Virage SoftSound技術源自於劍橋大學,Virage SoftSound授權、商品化及進階發展該技術,提供語音和演說處理方法一個主要基礎。演說辨識技術的主要功能特性包括:
- 不受演說者變動影響的運作方式 – 無需人為訓練就可以創新地運作
- 非常龐大的詞彙量 – 沒有任何特別的大小限制
- 賦有專利的搜尋技術顯著地降低系統對CPU和記憶體的需求
- 經由附加的文字素材達成自動的客製化
- Fixed-latency即時模式應用於媒體監控的運作
此外,我們也已經成功發展以下技術:
- 演說者變換和演說者辨識
- 文字和語音的自動同步,以利於字幕和有聲書方面的應用
- 文字標記和詞組辨識