首頁 > 易卦

從語音識別到語義識別還有多少路要走?

作者:由 曉芯智慧語音 發表于 易卦日期:2023-01-18

語音可以識別到人嗎

隨著近年定義和產業分工越發精細,語音識別漸漸分成了語音識別和語義識別兩個支系。語音和語義雖然只有一字之差,但卻是天壤之別。

打個簡單的比方,語音識別相當於人的耳朵,而語義識別則是大腦,語音識別幫助機器獲取和輸出資訊,而語義識別則是對這些資訊進行加工。

從語音識別到語義識別還有多少路要走?

語音發展史

語音是最自然的交流方式,自從1877年愛迪生髮明瞭留聲機,人們就開始了與機器的交流,但主要的還是與人的交流,而非機器本身。

1950年

,計算機科學之父阿蘭·圖靈在《Mind》雜誌上發表了題為《計算的機器和智慧》的論文,首次提出了機器智慧的概念

20世紀80年代

,語音識別技術能夠將口語轉化為文字。

2001年

,計算機語音識別達到了80%的準確度。

語音識別產品的應用

語音識別作為打造良好互動體驗的重要前提,今年的發展可謂是持續火爆。在智慧音箱市場,令人首先想到的就是Amazon的Echo。Echo作為將自然語音轉化為線上指令的裝置,其效率之高毋庸置疑,並且可保持線上的自然環境中的自然語言識別。

而國內語音識別領域也開始爭奪大戰。以科大訊飛聽見系列產品為例,自2015年釋出以來,總使用者突破1000萬,應用於30餘個行業。目前,已經形成了以聽見智慧會議系統、訊(詢)問筆錄系統、聽見轉寫網站、錄音寶APP、聽見智慧會議服務等以智慧語音轉寫技術為核心的產品和服務體系。

從語音識別到語義識別還有多少路要走?

曉芯電話機器人

就是基於語音識別技術的一種應用產品。曉芯智慧以服務低端勞力密集型企業為宗旨,幫助企業突破人工客服效率低、工作時間長的瓶頸,從而幫助企業擴大規模和提升業績。

我們所期望的語音識別實質上是人機互動,大致上可以理解為人與機器之間無障礙溝通。在通訊側音源質量限制的情況下,曉芯機器人在對音源質量透過演算法進行智慧降噪以及通訊側持續最佳化之後,仍然能以80%的識別率達到行業領先的水準。但即便是達到100%也還是沒有實現真正的人機互動

而我們曉芯電話機器人有很多的客戶都問我們能不能達到語義識別?

目前來說確實不能,

要從語音識別成功轉變成真正意義上的語義識別,在智慧電話客服的技術實現上依舊存在難點,大量的多音字和同音詞是干擾機器人識別精準度的的主要障礙。首先要獲得大量的資料,用這些資料不斷訓練,來提高識別的準確率。這一步的跨越還存在多種難關要攻克。就目前的市場分析來看,語義識別只是慢慢滲透到我們的生活中,還沒有成熟的在行業中應用自如。隨著技術不斷地成熟,曉芯智慧也必定會將語義識別技術融合進曉芯電話機器人。

在智慧電話客服的技術實現上依舊存在難點,大量的多音字和同音詞是干擾機器人識別精準度的的主要障礙。

屆時,我們將會再一次改變人工客服職業,電銷行業乃至更多傳統企業。

從語音識別到語義識別還有多少路要走?

人工客服職業,

1、應用層:包括行業應用和智慧語音互動系統

2、NLP技術層:包括以語言學、計算機語言等學科為背景的,對自然語言進行詞語解析、資訊抽取、時間因果、情緒判斷等等技術處理,最終達到讓計算機“懂”人類的語言的自然語言認知,以及吧計算機資料轉化為自然語言的生成。

3、底層資料層:詞典、資料集、語料庫、知識圖譜,以及外部世界常識性知識等都是予以是被演算法木星的基礎。

語義識別技術可以分析網頁、檔案、郵件、音訊、論壇、社交媒體中的大亮資料,應用領域廣泛,既可以直接應用與醫療、教育、金融等行業。也可以透過技術介面應用於所有智慧語音互動場景,如智慧家居、車載語音、可穿戴裝置、VR、機器人等,從互動的方式上,也可以分為:事實問答、知識檢索、分類問題等。智慧語音互動被看做未來人工智慧技術中最值得期待的應用場景。

語義識別的三個層次

(學術性分析來源於網上)