Separacja głosów z zastosowaniem głębokich sieci

Separacja głosów z zastosowaniem głębokich sieci neuronowych

Identyfikator grantu: PT01264

Kierownik projektu: Józef Kotus

Realizatorzy:

  • Józef Kotus
  • Michał Cellmer

Politechnika Gdańska

Wydział Elektroniki, Telekomunikacji i Informatyki

Gdańsk

Data otwarcia: 2025-04-30

Planowana data zakończenia grantu: 2026-04-30

Streszczenie projektu

Celem pracy jest opracowanie metody separacji głosów różnych osób mówiących jednocześnie z zastosowaniem głębokich sieci neuronowych. Cechą wyróżniająca proponowane do opracowanie rozwiązanie jest przetwarzanie sygnałów akustycznych zarejestrowanych za pomocą wektorowego czujnika akustycznego. Problem badawczy polega na sprawdzeniu działania proponowanych w literaturze struktur sieci neuronowych oraz dostępnych modeli a następnie zaproponowanie autorskiej struktury sieci, skutecznie realizującej postawione zadanie, dla zadanego zbioru sygnałów. Wynikiem działania opracowanej metody powinny być informacje, ile głosów jest w danym nagraniu oraz zestaw plików, zawierających wypowiedzi poszczególnych osób.

Kontakt

ul Traugutta 75, 80-221 Gdańsk
tel.: + 48 58 347 24 11
email: office@task.gda.pl
NIP: 584-020-35-93
REGON: 000001620
Godziny otwarcia: pn-pt godz. 8:00-15:00