微軟公司宣布,他們的語音辨識系統已經達到 5.1% 的錯誤率,截自目前為止最低的紀錄。這超過了微軟人工智慧的研究人員在去年達到的 5.9% 的錯誤率,其準確性與具有多次聆聽文字優勢的專業人類抄寫員平分秋色。
這兩項研究都轉錄了從 Switchboard 資料庫得到的紀錄,約 2400 通電話對話紀錄的集合,並從九十年代初以來就被研究人員用來測試語音識別系統。這項新研究是由微軟人工智慧團隊所執行,研究目的是為了達到與人類抄寫員相同的準確度,人類抄寫員能夠多次傾聽轉錄、進入對話環境以及和其他抄寫員一起工作。
總體來說,最新研究的研究人員透過改善微軟語音識別系統,包括基於神經網絡的聲學和語言模型,因此錯誤率較去年降低了約 12% 。而且,他們還讓語音辨識器使用完全的對話技巧,使抄錄內容能夠符合上下文,並預測下一步可能出現的單字或短句,就像人類彼此交談時的方式。
微軟的語音辨識系統被應用在 Cortana 和 Presentation Translator 軟體,以及 Cognitive Services 。
新聞來源:TechCrunch
【延伸閱讀】
● Windows 10內置眼睛追蹤功能 讓身障人士輕鬆與外界連結
世代傳媒股份有限公司
信箱:service@upmedia.mg
電話:+886 (2) 2568-3356
傳真:+886 (2) 2568-3826
地址:新北市新店區寶橋路188號8樓
探索網站
地址:新北市新店區寶橋路188號8樓
電話:+886 (2) 2568-3356
傳真:+886 (2) 2568-3826
e-mail:service@upmedia.mg
關注我們的報導社群
提供新聞:news@upmedia.mg
投書評論:editor@upmedia.mg
客戶服務:service@upmedia.mg
廣告合作:ad@upmedia.mg