首頁 > 成語

今日熱搜丨語音識別技術

作者:由 澎湃新聞客戶端 發表于 成語日期:2022-08-13

何為車載船裝

語言是人與人

傳達和獲取資訊的重要工具。

隨著社會的發展,

讓機器聽懂人的語言

已從夢想變成了現實。

而讓計算機聽懂人類語言,

這就要靠人機互動的重要技術——

語音識別技術。

什麼是語音識別技術

語音識別技術,又稱為自動語音識別(Automatic Speech Recognition,ASR),它是以語音為研究物件,透過語音訊號處理和模式識別讓機器理解人類語言,並將其轉換為計算機可輸入的數字訊號的一門技術。

今日熱搜丨語音識別技術

語音識別是怎麼實現的?

機器聽到的聲音

和人類聽到的有何不同?

戳影片,瞭解答案。

(《人工智慧是怎樣識別語音的》 來源:科普中國)

語音識別技術在

生活中的應用已經非常廣泛,

在車載導航、智慧家居、

日常辦公等領域都有涉及,

給人們生活帶來了很多便利。

應用場景和領域

1。文字輸入

文字錄入是語音識別最基本的應用,一般透過語音輸入法進行。這方面做得較好的有IBM、微軟、科大訊飛等,很多輸入法都用的是訊飛的語音識別引擎。如果發音標準,在高達95%的識別率下,對於大量文字的錄入,效率還是比較高的,甚至對於一些OCR難度較大的材料,也可以採用人工語音輸入來解決。

2。語音轉換

把語音轉換成文字,看起來似乎跟語音輸入一樣,在QQ和微信中,也可以把聊天中傳送的語音直接轉換成文字。但是在以前,如果想把一首MP3的朗誦檔案轉換成文字,還是要大費周章的。現在這個問題就很簡單了,在語音識別引擎的支援下,很多軟體都能實現語音檔案轉換。例如,利用搜狗輸入法的MP3轉文字功能,就可以把單田芳的評書MP3識別轉換成文字檔案。

3。會場速記

會議速記是對錄入速度的極大考驗,因為正常說話的速度是每分鐘200多字,一般人的文字錄入速度不太容易達到。但是如果會議發言的語音較標準,環境噪聲小,就完全可以由機器對講話進行語音識別記錄,自動轉換成文字。例如,在一些法庭的庭審現場,也會透過語音識別來分擔書記員的工作。

(《準確率98%!語音識別“黑科技”來了》 來源:河北日報客戶端)

4。錄音整理

很多時候,記者在採訪和訪談時都會錄音,以便回去後復聽,避免遺漏和錯誤。在整理這些錄音時,就可以採用語音識別的方法快速地得到文字版的採訪過程記錄,提高工作效率。

5。語音檢索

圖書館在查詢資料時,常常會與檢索打交道。檢索方式從最初的卡片式檢索變為後來的電子檢索,很大程度地方便了借閱。但是如果支援語音檢索的話,會更進一步地提高檢索效率。

6。字幕轉換

在手機上的影片剪輯軟體中,有一個功能很受歡迎,就是語音轉字幕。只要發音不是太難懂,影片中的語音都可以很方便地轉換成字幕,並且保持與畫面同步,如快影、剪映等都有這個功能,不僅實用,而且極大地節省了製作時間。但是在計算機上的傳統影片編輯軟體中,卻很少具備這種智慧化操作功能。

7。聊天機器人

機器人能夠跟人聊天的前提,當然也是需要具備語音識別功能,能夠“聽”出人在說什麼,並且還需要具備語義識別功能,即能夠聽“懂”人在說什麼。微軟的小冰、IBM的沃森助理等,都具有較高的智慧化水平。當然,它們不僅僅需要語音識別,更重要的是要基於人工智慧、自然語言處理和大資料,才能實現像人一樣聊天。

8。智慧音箱

智慧音箱本質上也是一個聊天機器人,不過它從計算機和手機軟體中獨立出來,不再依賴於計算機和手機,適應性更好。常見的天貓精靈、小愛同學、百度小度等,都是具有一定智慧和應用特色的產品。

9。智慧聲控

用語音發命令,讓機器和裝置去執行,這早已不是科幻場景,在智慧家居、車載裝置上都已充分應用。其前提也是先運用語音識別。

10。人機互動

如果說簡單的聲控是單向響應的話,那麼人機語音互動則是雙向溝通。最常見的車輛導航,可以接受駕駛人的語音指令,根據目的地啟用地圖和導航,然後再根據車輛定位的反饋向駕駛人發出指示。

(《上海自動駕駛出租車上路了!記者體驗:車內人臉識別認證、語音操控服務》 來源:天目新聞)

以上僅僅是語音識別

眾多應用場景的一部分,

相信隨著語音識別技術的進步,

還會出現更多的應用方向。

探索與部署

工業和資訊化部批覆組建國家智慧語音創新中心等4家國家制造業創新中心

2021年,工業和資訊化部批覆組建國家智慧語音創新中心等4家國家制造業創新中心。國家智慧語音創新中心依託合肥智慧語音創新發展有限公司組建,將圍繞多語種語音識別、語音合成、語義理解和專用人工智慧語音晶片等研發方向,構建集共性技術研發、測試驗證、中試孵化和成果轉移轉化於一體的創新平臺,提升我國智慧語音行業技術水平和產品競爭力。

人民法院探索網際網路司法新模式 全面推廣庭審語音識別類案強制檢索

2020年,全國高階法院院長會議在北京召開。會議指出,要全面深化智慧法院建設,以電子卷宗深度應用為抓手,全面推廣庭審語音識別、文書智慧糾錯、類案強制檢索等應用,努力攻克以人工智慧為核心的一批關鍵技術,持續深化智慧審判建設。要全方位升級執行辦案平臺,打通審判與執行辦案平臺數據介面,持續在執行管理、網路查控、聯合懲戒、司法拍賣等環節資訊化建設上發力,提升智慧執行水平。

語音識別技術在河北

《河北省新一代資訊科技產業發展“十四五”規劃》提出發展語音識別等智慧系統

2021年,省工業和資訊化廳印發《河北省新一代資訊科技產業發展“十四五”規劃》,提出到2025年,全省新一代資訊科技產業實現跨越式發展。其中,在“發展重點”篇章中提出發展語音識別、影象識別、知識處理等智慧系統,培育人工智慧解決方案提供商,開發一批次大面廣的新型人工智慧終端產品。

“冀小青”播報廊洽會

6月26日,備受矚目的2022年中國·廊坊國際經濟貿易洽談會開幕,長城新媒體集團推出AI虛擬主播冀小青播報廊洽會系列報道。長城新媒體集團AI虛擬主播依託語音識別、人臉建模、口唇預測、音訊驅動等自主關鍵技術,能夠實現智慧驅動,快速便捷地進行新聞直播。

中國電信滄州分公司5G+語音識別技術在黃驊港成功應用

近日, 中國電信滄州分公司利用5G+工業網際網路技術為國家能源集團滄州黃驊港務公司打造的智慧專用網路成功開通並順利透過驗收。在黃驊港煤炭碼頭,巨大的裝船機隨著工作人員的語音指令準確動作,執行過程中全程網路通暢、識別準確、動作流暢,這標誌著中國電信5G網路+智慧操控的裝船機智慧化解決方案在黃驊港成功落地。該專案也使黃驊港成為世界首個應用5G+語音識別技術的智慧散貨港口。

今日熱搜丨語音識別技術

原標題:《今日熱搜丨語音識別技術》