Grant/Projek zakończony
Uczenie ze wzmocnieniem bez i z wykorzystaniem modeli świata, przecięcie uczenia oraz planowania
Identyfikator grantu: PT00778
Kierownik projektu: Paweł Czarnul
Politechnika Gdańska
Wydział Elektroniki, Telekomunikacji i Informatyki
Gdańsk
Data otwarcia: 2019-10-30
Data zakończenia: 2022-03-25
Streszczenie projektu
Obecne najnowocześniejsze metody wykorzystujące głębokie sieci neuronowe w połączeniu z uczeniem ze wzmocnieniem są bardzo nieefektywne ze względu na ilość danych, co oznacza, że czasami wymagają dziesiątek, a nawet setek milionów interakcji ze środowiskiem. Ponadto brakuje im elastyczności ludzkiej inteligencji, stąd wyuczone zachowania słabo przenoszą się na nowe zadania w tym samym środowisku.
Celem tego projektu jest stworzenie systemu głębokiego uczenia ze wzmocnieniem, który mógłby uczyć się rozwiązywać złożone zadania w środowiskach z wielowymiarowymi obserwacjami, który równocześnie robiłby to w sposób efektywny ze względu na ilość danych. Do testów rozwiązań wykorzystane zostanie skomplikowane środowisko Google Research Football. Stworzenie sztucznej inteligencji potrafiącej planować i realizować skuteczne strategie gry w piłkę nożną byłoby kolejnym krokiem na drodze do ogólnej sztucznej inteligencji i optymalizacji coraz to bardziej skomplikowanych dziedzin ludzkiego życia.
Celem tego projektu jest stworzenie systemu głębokiego uczenia ze wzmocnieniem, który mógłby uczyć się rozwiązywać złożone zadania w środowiskach z wielowymiarowymi obserwacjami, który równocześnie robiłby to w sposób efektywny ze względu na ilość danych. Do testów rozwiązań wykorzystane zostanie skomplikowane środowisko Google Research Football. Stworzenie sztucznej inteligencji potrafiącej planować i realizować skuteczne strategie gry w piłkę nożną byłoby kolejnym krokiem na drodze do ogólnej sztucznej inteligencji i optymalizacji coraz to bardziej skomplikowanych dziedzin ludzkiego życia.