-
百度、斯坦福研究表明 語音輸入比打字快3倍且準確率更高(組圖)
2016/8/26 10:40:55 來源:中國新聞網 【字體:大 中 小】【收藏本頁】【打印】【關閉】
核心提示:中新網8月25日電 近日,百度、斯坦福大學和華盛頓大學共同完成了一項有關智能手機輸入方式對比的研究,該研究利用百度深度語音識別技術Deep Speech 2與32名測試者中新網8月25日電 近日,百度、斯坦福大學和華盛頓大學共同完成了一項有關智能手機輸入方式對比的研究,該研究利用百度深度語音識別技術Deep Speech 2與32名測試者進行“人機對戰”。研究結果表明,智能手機利用語音輸入的速度比鍵盤輸入快3倍,且輸入準確率更高。研究人員發現,相比于傳統的鍵盤輸入,語音輸入方式在速度及準確率方面更具優勢。利用語音輸入英語和普通話的速度分別是傳統輸入方式的3.24倍和3.21倍。此外,通過加入糾錯功能后,語音輸入英語及普通話的準確率進一步提高,達到96.43%和92.35%,輸入速度仍為傳統方式的3倍和2.8倍。該研究將語音輸入方式的評估細化到了字符級,充分展現了語音輸入方式的優勢,幫助技術研發者進一步優化語音輸入的效果。除此之外,技術人員還研究了如何在詳細數據分析和定向響應的基礎上,進一步提高語音輸入的效率和準確率。
如今,用戶輸入的使用習慣正在由鍵盤到語音轉變,研究發展有效的語音交互接口迫在眉睫。斯坦福大學計算機科學專業教授James Landay表示:“過去十年,語音識別技術被寄予厚望,但實際表現卻不盡如人意。近兩年,受益于大數據和深度學習技術的不斷發展,語音識別技術突飛猛進,速度及準確性都有了長足進步。除了打字發郵件或短信外,我們還在將語音用于更多方面。比如語音啟動和圖形觸控操作相結合的交互界面等。”
此次參與研究的Deep Speech 2發揮出色,是百度布局語音技術的最好體現。2014年底,百度首席科學家吳恩達及其團隊便發布了第一代深度語音識別系統Deep Speech,該系統使用了端對端的深度學習技術,主要專注于提高嘈雜環境下的英語語音識別的準確率。通過使用批處理技術將DNNs部署在GPUs上,Deep Speech的語音識別表現出了極高的訓練效率。目前,該系統語音識別準確率達到97%,且支持超過26萬億次浮點運算,可在幾天內完成深度語言的集中訓練。2015年11月,Deep Speech2被美國權威雜志《麻省理工科技評論》列為2016年人類十大突破技術之一。
除了強大的技術研發能力,百度還積極推進語音技術的普及。無論是Carlife、還是度秘,乃至應用到搜索、地圖等領域的語音技術,都極大優化了產品體驗并方便了人們生活。除此之外,百度還通過自身的語音技術開放平臺,將技術能力免費開放,通過SDK、API等不同的接入方式供企業及開發者使用,進一步刺激語音識別技術的創新應用開發。其中,行業用戶包括小米、聯想、特斯拉、陌陌、康佳、SONY、惠普、海爾等。未來,隨著語音技術的不斷發展,語音接口會變得更為實用和有效,人們將更為便捷的與身邊的設備進行自然的交流。
鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播更多信息之目的,如有侵權行為,請第一時間聯系我們修改或刪除,郵箱:cidr@chinaidr.com。 -
- 熱點資訊
- 24小時
- 周排行
- 月排行
- 儲能變革,果下科技引領“AI+”儲能/能源資產新時代
- “年經濟”升溫企業開足馬力趕訂單、忙生產 馬年特色產品內銷、出口雙提升
- 東軟集團與Cerence AI達成戰略合作 共筑新一代AI智能座艙平臺
- 神功威力無比“505神功元氣袋”
- 苦盡甘不來 咸陽505大廈上“辛酸苦辣”的商業倫理與時代密碼
- 2025年北京接待入境游客548萬人次,入境旅游加速發展
- 速抄筆記!《2026網絡安全趨勢報告》正式發布
- 唯可鮮(WakeFresh)發力HPP果蔬汁市場產能布局,新增Quintus QIF 600L超大容量設備,實現產能與安
- “智造+文化+服務”圈粉海外游客 中國消費市場成購物熱土
- 艾為電氣:擴產研發齊發力,產業資本添信心


