Separacja głosów z zastosowaniem głębokich sieci neuronowych

Identyfikator grantu: PT01264

Kierownik projektu: Józef Kotus

Politechnika Gdańska

Wydział Elektroniki, Telekomunikacji i Informatyki

Gdańsk

Data otwarcia: 2025-04-30

Planowana data zakończenia grantu: 2026-04-30

Streszczenie projektu

Celem pracy jest opracowanie metody separacji głosów różnych osób mówiących jednocześnie z zastosowaniem głębokich sieci neuronowych. Cechą wyróżniająca proponowane do opracowanie rozwiązanie jest przetwarzanie sygnałów akustycznych zarejestrowanych za pomocą wektorowego czujnika akustycznego. Problem badawczy polega na sprawdzeniu działania proponowanych w literaturze struktur sieci neuronowych oraz dostępnych modeli a następnie zaproponowanie autorskiej struktury sieci, skutecznie realizującej postawione zadanie, dla zadanego zbioru sygnałów. Wynikiem działania opracowanej metody powinny być informacje, ile głosów jest w danym nagraniu oraz zestaw plików, zawierających wypowiedzi poszczególnych osób.


← Powrót do spisu projektów

CONTACT

Our consultants help future and novice users of specialized software installed on High Performance Computers (KDM) at the TASK IT Center.

Contact for High Performance Computers, software / licenses, computing grants, reports:

kdm@task.gda.pl

Administrators reply to e-mails on working days between 8:00 am – 3:00 pm.