Automatyczne wyszukiwanie słów kluczowych w nagraniach mowy na podstawie transkrypcji wygenerowanej przez modele głębokiego

Automatyczne wyszukiwanie słów kluczowych w nagraniach mowy na podstawie transkrypcji wygenerowanej przez modele głębokiego uczenia

Grant ID: PT01314

Project leader: Bożena Kostek

Politechnika Gdańska

Wydział Elektroniki, Telekomunikacji i Informatyki

Gdańsk

Start date: 2026-01-12

Planned end date: 2027-01-31

Project summary

Celem pracy jest opracowanie systemu umożliwiającego automatyczne wyszukiwanie słów kluczowych w nagraniach mowy, w szczególności pochodzących z ogólnodostępnych źródeł (np. YouTube). System opiera się na automatycznej transkrypcji wypowiedzi z wykorzystaniem modeli głębokiego uczenia (np. Whisper, Wav2Vec 2.0), a następnie przeprowadza analizę skuteczności wykrywania słów kluczowych. Praca ma na celu ocenę dokładności i niezawodności transkrypcji oraz jakości identyfikacji i wyszukiwania fraz, z uwzględnieniem różnych języków, akcentów lub warunków akustycznych.

Uzasadnienie: Dyplomanci będą działać na dużych zasobach danych, stąd wynika zapotrzebowanie na moce obliczeniowe.

Contact

Traugutta 75, Street, 80-221 Gdańsk
tel.: + 48 58 347 24 11
email: office@task.gda.pl
NIP: 584-020-35-93
REGON: 000001620
Opening hours: Monday-Friday 08.00 am – 03.00 pm