Klasyfikacja obrazów obiektów przestrzennych za pomocą sieci kapsułkowych
Identyfikator grantu: PT00931
Kierownik projektu: Maciej Szczodrak
Realizatorzy:
- Piotr Sokołowski
- Sebastian Lewalski
- Jakub Zasada
Politechnika Gdańska
Wydział Elektroniki, Telekomunikacji i Informatyki
Gdańsk
Data otwarcia: 2022-02-03
Streszczenie projektu
Kapsułkowe sieci w przeciwieństwie do sieci splotowych w wielu testach są skuteczniejsze w rozpoznawaniu obiektów przestrzennych, jednocześnie będąc znacznie bardziej wrażliwe na szumy w danych treningowych jak też i bardziej kosztowne obliczeniowo, co ogranicza ich zastosowania praktyczne. Celem projektu jest przebadanie różnych metod rozwiązania wspomnianych wyżej problemów, zarówno poprzez uczenie na dedykowanych zbiorach danych jak też poprzez modyfikację samych algorytmów uczących. Na potrzeby redukcji szumów w danych wykorzystywanych w procesie uczenia przygotowano zastawy fotografii bezcieniowych miniaturowych, abstrakcyjnych obiektów, które zostały wykonane z plastycznych materiałów specjalnie na potrzeby badań. Eksperymenty mają odpowiedzieć m.in. na pytania:
- Czy większy poziom uproszczenia obiektu treningowego będzie pozwalać na rozpoznawanie większej liczby różnych instancji walidacyjnych? Jeśli tak, to w jakim stopniu?
- W jakim stopniu materiał, a więc także i proces technologiczny tworzenia danych treningowych będzie wpływać na możliwość generalizacji klasyfikatora?
- W jaki sposób zastosowany algorytm uczenia będzie wpływać na powyższe kwestie?
Dodatkowym celem projektu jest także zbadanie możliwości optymalizacji uczenia sieci kapsułkowych na infrastrukturze chmurowej, poprzez rozproszenie obliczeń pomiędzy wiele maszyn wirtualnych.
- Czy większy poziom uproszczenia obiektu treningowego będzie pozwalać na rozpoznawanie większej liczby różnych instancji walidacyjnych? Jeśli tak, to w jakim stopniu?
- W jakim stopniu materiał, a więc także i proces technologiczny tworzenia danych treningowych będzie wpływać na możliwość generalizacji klasyfikatora?
- W jaki sposób zastosowany algorytm uczenia będzie wpływać na powyższe kwestie?
Dodatkowym celem projektu jest także zbadanie możliwości optymalizacji uczenia sieci kapsułkowych na infrastrukturze chmurowej, poprzez rozproszenie obliczeń pomiędzy wiele maszyn wirtualnych.
Publikacje
- Sebastian Lewalski, Trening klasyfikatorów obrazów na podstawie zdjęć modeli kartonowych, praca dyplomowa magisterska, Politechnika Gdańska, WETI 1, (2022) 1-58
- Jakub Zasada, Rozproszone uczenie kapsułkowych sieci neuronowych rozpoznawania obrazów obiektów trójwymiarowych, praca dyplomowa inżynierska, Politechnika Gdańska, WETI 1, (2022) 1-50