Czym jest resotrum

Resotrum, to nowatorska technologia przetwarzania sygnału (dźwięku) do dziedziny częstotliwości. Technologia ta jest stworzona na potrzeby rozpoznawania mowy.

Pierwsze pomiary i analizy wykazują, że resotrum daje drastycznie lepsze wyniki niż techniki, w których podstawą jest transformata Fouriera. Ma to znaczący wpływ na skuteczność procesu rozpoznawania mowy.

Proszę zwrócić uwagę, jak dokładne pomiary częstotliwości formantowych daje ta metoda. Zachęcam do porównania poniższych wyników z innymi publikacjami.

A E I O U Y

Powszechnie wiadomo, że w nagraniach samogłosek można wyróżnić dominujące częstotliwości (częstotliwość krtaniową i częstotliwości formantowe). Jednak, większość badaczy ma poważne problemy z ich podaniem. Metoda resotrum daje następujące wyniki:

Plik aeiou-Piotr-48kHz.wav
Treść nagrania „a, e, i, o, u”
Data nagrania 1 kwietnia 2007, 16:37
Lektor Piotr, lat 30
Pomiary
Fonem Częstotliwość krtaniowa, oraz cz. formantowe (Hz)
A 130, 285 430 580 720 870 1115 1175 2400 3600
E 130, 270 405 540 680 830 1640 2250 3700
I 125, 255 380 2200 3200
O 118, 239 357 487 600 720 842 986 2600 4000
U 114, 222 325 437 522 650 770
Opis Pogrubione zostały częstotliwości o dominującej energii akustycznej. Pomiar danego fonemu został wykonany w wybranym momencie czasu (blisko środka okresu trwania fonemu). Pomiary w innych momentach mogą się różnić.

rozpoznawanie mowy, voice recognition, automatic speech recognition, computer speech recognition, speech to text,