Uczenie ze wzmocnieniem bez i z wykorzystaniem modeli świata, przecięcie uczenia oraz planowania

Kierownik projektu: Paweł Czarnul

Realizatorzy:

  • Piotr Januszewski

Politechnika Gdańska

Wydział Elektroniki, Telekomunikacji i Informatyki

Gdańsk

Data otwarcia: 2019-10-30

Streszczenie projektu

Obecne najnowocześniejsze metody wykorzystujące głębokie sieci neuronowe w połączeniu z uczeniem ze wzmocnieniem są bardzo nieefektywne ze względu na ilość danych, co oznacza, że czasami wymagają dziesiątek, a nawet setek milionów interakcji ze środowiskiem. Ponadto brakuje im elastyczności ludzkiej inteligencji, stąd wyuczone zachowania słabo przenoszą się na nowe zadania w tym samym środowisku.
Celem tego projektu jest stworzenie systemu głębokiego uczenia ze wzmocnieniem, który mógłby uczyć się rozwiązywać złożone zadania w środowiskach z wielowymiarowymi obserwacjami, który równocześnie robiłby to w sposób efektywny ze względu na ilość danych. Do testów rozwiązań wykorzystane zostanie skomplikowane środowisko Google Research Football. Stworzenie sztucznej inteligencji potrafiącej planować i realizować skuteczne strategie gry w piłkę nożną byłoby kolejnym krokiem na drodze do ogólnej sztucznej inteligencji i optymalizacji coraz to bardziej skomplikowanych dziedzin ludzkiego życia.


← Powrót do spisu projektów

KONTAKT

Nasi konsultanci służą pomocą przyszłym i początkującym użytkownikom specjalistycznego oprogramowania zainstalowanego na Komputerach Dużej Mocy w Centrum Informatycznym TASK.

Kontakt w sprawach Komputerów Dużej Mocy, oprogramowania/licencji, grantów obliczeniowych, sprawozdań:

kdm@task.gda.pl

Administratorzy odpowiadają na maile w dni robocze w godzinach 8:00 – 15:00.