Separacja głosów z zastosowaniem głębokich sieci neuronowych
Identyfikator grantu: PT01264
Kierownik projektu: Józef Kotus
Politechnika Gdańska
Wydział Elektroniki, Telekomunikacji i Informatyki
Gdańsk
Data otwarcia: 2025-04-30
Planowana data zakończenia grantu: 2026-04-30
Streszczenie projektu
Celem pracy jest opracowanie metody separacji głosów różnych osób mówiących jednocześnie z zastosowaniem głębokich sieci neuronowych. Cechą wyróżniająca proponowane do opracowanie rozwiązanie jest przetwarzanie sygnałów akustycznych zarejestrowanych za pomocą wektorowego czujnika akustycznego. Problem badawczy polega na sprawdzeniu działania proponowanych w literaturze struktur sieci neuronowych oraz dostępnych modeli a następnie zaproponowanie autorskiej struktury sieci, skutecznie realizującej postawione zadanie, dla zadanego zbioru sygnałów. Wynikiem działania opracowanej metody powinny być informacje, ile głosów jest w danym nagraniu oraz zestaw plików, zawierających wypowiedzi poszczególnych osób.