Technologia

Technologia odszumiania ma zastosowanie wszędzie tam, gdzie na jakość przekazu głosowego mają wpływ czynniki otoczenia zewnętrznego takie jak hałas, szum czy inne zewnętrzne dźwięki. Nad redukcją szumu dla sygnałów mowy pracują od wielu lat liczne instytucje naukowe i firmy na całym świecie. Jednakże systemy redukcji szumów są wciąż udoskonalane. Dzięki wieloletnim badaniom jesteśmy w tej dziedzinie bardzo zaawansowani.

Nasza technologia NOISEBUSTERS opiera się na zaawansowanych algorytmach statystycznego przetwarzania syngału mowy. Stosowane algorytmy wyróżniają się przede wszystkim wbudowanym mechanizmem skanowania szumu. Metoda ta dopasowuje się do zmianiającego się w czasie szumu przez co nie jest konieczne ręczne pobieranie jego próbek w miejscach gdzie mowa jest nieaktywna. Dodatkowo zaimplementowana jest wyrównywanie poziomu nagrania. Gdy jego poziom jest zmienny (np. osoba mówi raz ciszej raz głośniej) jest to wykrywane i następuje adaptacyjna normalizacja nagrania. Pracujemy również nad eksperymentalnymi systemami odszumiania mowy wykorzystującymi wiedzę a-priori o sygnale mowy.

Dysponujemy próbkami odszumionej mowy przy wykorzystaniu naszej technologii. Jesteśmy gotowi do realizacji zleceń w oparciu o implementację algorytmów odszumiania na indywidualne zamówienie. Nasze rozwiązania charakteryzują się bardzo skuteczną redukcją szumu oraz odwzorowaniem charakterystyki sygnału mowy.

Technologia rozpoznawania mowy ma zastosowanie w komunikacji człowieka z otoczeniem teleinformatycznym przy pomocy wypowiadanych komend głosowych czy mowy ciągłej. Dzięki temu można sterować urządzeniami, mieć dostęp za pomocą głosu do informacji bazodanowych, czy dyktować SMSy. Zadaniem systemów rozpoznawania mowy (ang. ASR- Automatic Speech Recognition) jest zamiana wypowiedzianych słów na tekst. Budowa takiego systemu jest o wiele trudniejsza niż budowa syntezatora mowy od strony technicznej. Jest wiele różnych podejść do tego problemu. Systemy rozpoznwania mowy ciągłej mogą opierać się na małych lub dużych słownikach.

Firma VOICE LAB wykorzystuje statystyczne metody analizy rozpoznawanej mowy w oparciu o niejawne łańcuchy Markowa (HMM). Bazujemy na rozwiązaniach autorskich oraz typu open-source w zależności od potrzeb i zastosowań. Specjalizujemy się w tworzeniu baz danych nagrań. Wdrażamy systemy rozpoznwania mowy w postaci e-usług działających on-line. Rozwijamy również eksperymentalny system ASR z globalną optymalizacją modeli Markova. Wdrażamy nasze rozwiązania na wysokowydajnych serwerach.

W oparciu o nasze doświadczenie i rozwiązania jesteśmy gotowi do wdrożeń systemów rozpoznawania mowy
w następujących obszarach:

  • na urządzenia mobilne z systemem Android, Symbian, iPhon,
  • do zastosowań typu call center,
  • do nawigacji portalem lub stroną internetową,
  • czy innych zastosowaniach na indywidualne zamówienie.