Zespół Przetwarzania Sygnałów DSP AGH

-> Dokumentacja API systemu rozpoznawania mowy AGH Sarmata

System rozpoznawania mowy polskiej SARMATA jest nieustannie rozwijanym projektem. Jego najnowsza stabilna wersja jest już gotowa do wielu wdrożeń, takich jak obsługa ograniczonej ilości komend czy interfejs głosowy wybranych programów lub urządzeń (do 1 000 komend przy dobrych warunkach rejestracji nagrań i do 100 w wypadku codziennej mowy telefonicznej). Może służyć obniżeniu kosztów obsługi klientów lub sterowaniu głosowemu urządzeniami bez posługiwania się rękami.

System jest oparty o liczne innowacyjne technologie. Część z nich opisano w publikacjach, opisy niektórych nie są udostępniane. Program można dostosować zarówno do konkretnego mówcy, jak i uruchomić w trybie modelu ogólnego.

Dokładniejszy opis systemu znajduje się w artykule przygotowanym na demo systemu.

Wersja laboratoryjna

Interfejsy Głosowe

Poniżej znajduje się film demonstrujący działanie głosowego sterowania programem SAWA (używanym przez instytucje wymiaru sprawiedliwości do zarządzania dokumentacją procesową)

Wirtualna Mysz

System został także wykorzystany do wykonania Wirtualnej Myszy - programu symulującego działanie myszy komputerowej. Program jest obecnie w trakcie testów.

Wyszukiwarka Akustyczna

Sarmata może także działać w funkcjonalności wyszukiwania ustalonego słowa w długich nagraniach w celu analizy archiwów cyfrowych.

Aplikacja dla IVR

SARMATA został prototypowo wdrożony do systemów telefonicznych IVR jednej z wiodących firm w Polsce dostarczających takie technologie telekomunikacyjne, w celu wybierania głosowego wewnętrznych połączeń itp.

Licencjonowanie

Istnieje możliwość pozyskania licencji AGH na oprogramowanie rozpoznawania mowy.

System został zlicencjonowany do Stanusch Technologies S.A., Techmo sp. z o.o. oraz Adescom Polska sp. z o.o..

Zespół Przetwarzania Sygnałów DSP AGH

stat4u