Uczenie ze wzmocnieniem bez i z wykorzystaniem modeli świata, przecięcie uczenia oraz planowania

Kierownik projektu: Paweł Czarnul

Realizatorzy:

  • Piotr Januszewski

Politechnika Gdańska

Wydział Elektroniki, Telekomunikacji i Informatyki

Gdańsk

Data otwarcia: 2019-10-30

Streszczenie projektu

Obecne najnowocześniejsze metody wykorzystujące głębokie sieci neuronowe w połączeniu z uczeniem ze wzmocnieniem są bardzo nieefektywne ze względu na ilość danych, co oznacza, że czasami wymagają dziesiątek, a nawet setek milionów interakcji ze środowiskiem. Ponadto brakuje im elastyczności ludzkiej inteligencji, stąd wyuczone zachowania słabo przenoszą się na nowe zadania w tym samym środowisku.
Celem tego projektu jest stworzenie systemu głębokiego uczenia ze wzmocnieniem, który mógłby uczyć się rozwiązywać złożone zadania w środowiskach z wielowymiarowymi obserwacjami, który równocześnie robiłby to w sposób efektywny ze względu na ilość danych. Do testów rozwiązań wykorzystane zostanie skomplikowane środowisko Google Research Football. Stworzenie sztucznej inteligencji potrafiącej planować i realizować skuteczne strategie gry w piłkę nożną byłoby kolejnym krokiem na drodze do ogólnej sztucznej inteligencji i optymalizacji coraz to bardziej skomplikowanych dziedzin ludzkiego życia.


← Powrót do spisu projektów

CONTACT

Our consultants help future and novice users of specialized software installed on High Performance Computers (KDM) at the TASK IT Center.

Contact for High Performance Computers, software / licenses, computing grants, reports:

kdm@task.gda.pl

Administrators reply to e-mails on working days between 8:00 am – 3:00 pm.