Zespół Przetwarzania Sygnałów DSP AGH
-> Dokumentacja API systemu rozpoznawania mowy AGH Sarmata
System rozpoznawania mowy polskiej SARMATA jest nieustannie rozwijanym projektem. Jego najnowsza stabilna wersja jest już gotowa do wielu wdrożeń, takich jak obsługa ograniczonej ilości komend czy interfejs głosowy wybranych programów lub urządzeń (do 1 000 komend przy dobrych warunkach rejestracji nagrań i do 100 w wypadku codziennej mowy telefonicznej). Może służyć obniżeniu kosztów obsługi klientów lub sterowaniu głosowemu urządzeniami bez posługiwania się rękami.
System jest oparty o liczne innowacyjne technologie. Część z nich opisano w publikacjach, opisy niektórych nie są udostępniane. Program można dostosować zarówno do konkretnego mówcy, jak i uruchomić w trybie modelu ogólnego.
Dokładniejszy opis systemu znajduje się w artykule przygotowanym na demo systemu.
Wersja laboratoryjna
Interfejsy Głosowe
Poniżej znajduje się film demonstrujący działanie głosowego sterowania programem SAWA (używanym przez instytucje wymiaru sprawiedliwości do zarządzania dokumentacją procesową)
Wirtualna Mysz
System został także wykorzystany do wykonania Wirtualnej Myszy - programu symulującego działanie myszy komputerowej. Program jest obecnie w trakcie testów.
Wyszukiwarka Akustyczna
Sarmata może także działać w funkcjonalności wyszukiwania ustalonego słowa w długich nagraniach w celu analizy archiwów cyfrowych.
Aplikacja dla IVR
SARMATA został prototypowo wdrożony do systemów telefonicznych IVR jednej z wiodących firm w Polsce dostarczających takie technologie telekomunikacyjne, w celu wybierania głosowego wewnętrznych połączeń itp.
Licencjonowanie
Istnieje możliwość pozyskania licencji AGH na oprogramowanie rozpoznawania mowy.
System został zlicencjonowany do Stanusch Technologies S.A., Techmo sp. z o.o. oraz Adescom Polska sp. z o.o..