Automatyczne wyszukiwanie słów kluczowych w nagraniach mowy na podstawie transkrypcji wygenerowanej przez modele głębokiego

Automatyczne wyszukiwanie słów kluczowych w nagraniach mowy na podstawie transkrypcji wygenerowanej przez modele głębokiego uczenia

Identyfikator grantu: PT01314

Kierownik grantu: Bożena Kostek

Politechnika Gdańska

Wydział Elektroniki, Telekomunikacji i Informatyki

Gdańsk

Data otwarcia: 2026-01-12

Planowana data zakończenia grantu: 2027-01-31

Streszczenie grantu

Celem pracy jest opracowanie systemu umożliwiającego automatyczne wyszukiwanie słów kluczowych w nagraniach mowy, w szczególności pochodzących z ogólnodostępnych źródeł (np. YouTube). System opiera się na automatycznej transkrypcji wypowiedzi z wykorzystaniem modeli głębokiego uczenia (np. Whisper, Wav2Vec 2.0), a następnie przeprowadza analizę skuteczności wykrywania słów kluczowych. Praca ma na celu ocenę dokładności i niezawodności transkrypcji oraz jakości identyfikacji i wyszukiwania fraz, z uwzględnieniem różnych języków, akcentów lub warunków akustycznych.

Uzasadnienie: Dyplomanci będą działać na dużych zasobach danych, stąd wynika zapotrzebowanie na moce obliczeniowe.

Kontakt

ul Traugutta 75, 80-221 Gdańsk
tel.: + 48 58 347 24 11
email: office@task.gda.pl
NIP: 584-020-35-93
REGON: 000001620
Godziny otwarcia: pn-pt godz. 8:00-15:00