Logowanie do System sprawozdań KDM

Model-free and model-based reinforcement learning, intersection of learning and planning

Kierownik projektu: Paweł Czarnul

Politechnika Gdańska

Wydział Elektroniki, Telekomunikacji i Informatyki

Gdańsk

Streszczenie projektu

Obecne najnowocześniejsze metody wykorzystujące głębokie sieci neuronowe w połączeniu z uczeniem ze wzmocnieniem są bardzo nieefektywne ze względu na ilość danych, co oznacza, że czasami wymagają dziesiątek, a nawet setek milionów interakcji ze środowiskiem. Ponadto brakuje im elastyczności ludzkiej inteligencji, stąd wyuczone zachowania słabo przenoszą się na nowe zadania w tym samym środowisku.

Celem tego projektu jest stworzenie systemu głębokiego uczenia ze wzmocnieniem, który mógłby uczyć się rozwiązywać złożone zadania w środowiskach z wielowymiarowymi obserwacjami, który równocześnie robiłby to w sposób efektywny ze względu na ilość danych. Do testów rozwiązań wykorzystane zostanie skomplikowane środowisko Google Research Football. Stworzenie sztucznej inteligencji potrafiącej planować i realizować skuteczne strategie gry w piłkę nożną byłoby kolejnym krokiem na drodze do ogólnej sztucznej inteligencji i optymalizacji coraz to bardziej skomplikowanych dziedzin ludzkiego życia.