Wysokowydajne obliczenia w trenowaniu agentów Reinforcement Learning dla złożonych systemów produkcyjnych
Grant ID: PT01341
Project leader: Paweł Chodnicki
Politechnika Gdańska
Wydział Chemiczny
Gdańsk
Start date: 2026-03-10
Planned end date: 2027-03-10
Project summary
Celem projektu jest opracowanie i walidacja zaawansowanego systemu decyzyjnego opartego na metodach Reinforcement Learning (RL) do dynamicznego harmonogramowania zleceń produkcyjnych w rozproszonym środowisku cloud manufacturing. System ma umożliwiać optymalną alokację wieloelementowych zamówień do wielu fabryk i linii produkcyjnych przy uwzględnieniu ograniczeń czasowych, dostępności zasobów oraz zróżnicowanych priorytetów realizacji.
Współczesne systemy produkcyjne w ramach tzw. Przemysłu 4.0 ewoluują w kierunku architektury cloud manufacturing, w której:
a) zlecenia są dynamicznie przydzielane do rozproszonych jednostek produkcyjnych,
b) zasoby produkcyjne są współdzielone,
c) decyzje operacyjne muszą uwzględniać niepewność, zmienność popytu oraz ograniczenia technologiczne.
Problem harmonogramowania w takim środowisku jest kombinatorycznie złożony (NP-trudny), wielokryterialny oraz dynamiczny. Klasyczne metody heurystyczne nie skalują się efektywnie wraz ze wzrostem liczby zamówień oraz liczby dostępnych fabryk.
Zastosowanie RL umożliwia uczenie polityki decyzyjnej bez konieczności definiowania jawnego modelu optymalizacyjnego, adaptację tej polityki do zmiennych warunków środowiskowych oraz odkrywanie strategii trudnych do zaprojektowania heurystycznie.
Współczesne systemy produkcyjne w ramach tzw. Przemysłu 4.0 ewoluują w kierunku architektury cloud manufacturing, w której:
a) zlecenia są dynamicznie przydzielane do rozproszonych jednostek produkcyjnych,
b) zasoby produkcyjne są współdzielone,
c) decyzje operacyjne muszą uwzględniać niepewność, zmienność popytu oraz ograniczenia technologiczne.
Problem harmonogramowania w takim środowisku jest kombinatorycznie złożony (NP-trudny), wielokryterialny oraz dynamiczny. Klasyczne metody heurystyczne nie skalują się efektywnie wraz ze wzrostem liczby zamówień oraz liczby dostępnych fabryk.
Zastosowanie RL umożliwia uczenie polityki decyzyjnej bez konieczności definiowania jawnego modelu optymalizacyjnego, adaptację tej polityki do zmiennych warunków środowiskowych oraz odkrywanie strategii trudnych do zaprojektowania heurystycznie.
Contact
Traugutta 75, Street, 80-221 Gdańsk
tel.: + 48 58 347 24 11
email: office@task.gda.pl
NIP: 584-020-35-93
REGON: 000001620
Opening hours: Monday-Friday 08.00 am – 03.00 pm