Nowe równoległe algorytmy grupowania

Nowe równoległe algorytmy grupowania danych

Grant ID: PT01348

Project leader: Wojciech Kwedlo

Implementers:

  • Jakub Zaprzałka

Politechnika Białostocka

Wydział Informatyki

Białystok

Start date: 2026-03-24

Planned end date: 2029-03-24

Project summary

Badania prowadzone w ramach grantu obliczeniowego będą kontynuacją prac dotyczących algorytmów grupowania danych (data clustering), realizowanych w ramach poprzedniego wniosku w latach 2023-2026. Koncentrować się będą one wokół dwóch zagadnień:

1. Równoległej wersji algorytmu EM dla mieszanin wielowymiarowych rozkładów normalnych (Gaussian Mixture Models). W ramach tego nurtu planowane jest przede wszystkim dokończenie eksperymentów badających skalowalność opracowanego zrównoleglenia hybrydowego MPI/OpenMP na węzłach Trytona+, przy zmianie liczby węzłów od 1 do 64 (limit klastra). Główna seria eksperymentów została zakończona, obecnie przygotowana jest publikacja do czołowego czasopisma z listy JCR. W przypadku, gdy recenzenci zażądają dodatkoweych eksperymentów, zostaną one wykonane na Trytonie+. Jeżeli uda się zrekrutować doktoranta do szkoły doktorskiej, w ramach tego kierunku przewidywane jest przejście na GPU, z wykorzystaniem biblioteki NVIDIA cuBLAS i technologii CUDA i zbadanie uzyskanego sformułowania algorytmu najpierw na jednym węźle klastra a potem na wielu węzłach.

2. Równoległej wersji algorytmu ExKMC wyjaśnialnego grupowania danych. Prace te wpiszą się w ważny nurt tzw. wyjaśnialnej sztucznej inteligencji (explainable AI). Początkowo zostanie opracowana wersja algorytmu dla pojedynczego węzła klastra, z wykorzystaniem standardu OpenMP zrównoleglenia zagnieżdżonego (nested paralelism). W następnym kroku zostanie rozważone przejście na GPU bądź też zrównoleglenie hybrydowe MPI/OpenMP. Zaletą algorytmu ExKMC w porównaniu ze zrównoleglonym w ramach poprzedniego grantu CI TASK algorytmem IMM jest brak ograniczenia na liczbę liści drzewa decyzyjnego.

Contact

Traugutta 75, Street, 80-221 Gdańsk
tel.: + 48 58 347 24 11
email: office@task.gda.pl
NIP: 584-020-35-93
REGON: 000001620
Opening hours: Monday-Friday 08.00 am – 03.00 pm