首頁 > 收藏

語音輸入誰最準?暴肝3天,105次測試,告訴你一個想不到的答案!

作者:由 什麼值得買 發表于 收藏日期:2022-12-25

一個蟲一個夾是什麼字

作者:網羅燈下黑

在週一的時候,我們不是做了個「微信發語音會不會轉文字再發」的小調查嘛,在參與投票的小夥伴中,有近 80% 的人選擇了會轉文字再發。

這個答案不算出人意料,但讓我覺得有趣的是,評論區裡出現了很多安利「訊飛輸入法」的小夥伴。

語音輸入誰最準?暴肝3天,105次測試,告訴你一個想不到的答案!

這讓我想起了 4 年前我們做過的一個關於手機輸入法語音輸入準確率的評測,最後脫穎而出的恰恰就是「訊飛輸入法」。

語音輸入誰最準?暴肝3天,105次測試,告訴你一個想不到的答案!

時隔 4 年,你說各個廠家的語音識別率準確度有沒有發生什麼變呢?雖化然各家輸入法的語音識別都搭配有聯絡上下文 AI 自動糾錯的輔助功能,但沒關係的,我們照樣可以不問 UI 逼格高不高,不看使用方不方便,只拿最終的識別結果說事。

那麼,讓我們一起來看看,市面上的主流輸入法,在 4 年後的今天,誰才是語音輸入的最佳選擇。

PS:這會是一篇超級長文,趕時間的小夥伴可以直接扒拉到最後看結果,但你可能會測過一個有趣的過程。

評測準備

既然是主流輸入法的評測,那當然要找到誰才是當今主流,所以我先是去找了幾篇關於第三方手機輸入法的行業報告,無一例外,第一梯隊還是搜狗、百度、訊飛這三家大廠。

語音輸入誰最準?暴肝3天,105次測試,告訴你一個想不到的答案!

不過今天參與評測的主角,除了第一梯隊的三家輸入法外,還有國民級應用微信上的語音輸入,以及 iPhone 上的聽寫功能。

這裡容我稍微解釋一下,帶上微信,我想應該沒人反對,無論是月活還是使用者總量,都是其他輸入法無法匹敵的,而它自帶的那個語音輸入功能,也是最貼近生活,使用最多的語音輸入姿勢了。

至於 iPhone,則是之前有小夥伴專門提過它好用,所以這裡也把它拉過來溜上一溜。

1.參評軟體版本號

訊飛輸入法:安卓端 V11。1。12

搜狗輸入法:安卓端 V11。10

百度輸入法:安卓端 V11。4。5。40

微信:安卓端 V8。028

iPhone:iOS 16。0

2.校對軟體

Office Word 校對+人工統計

我本來也想找一個可以自動校對兩端文字變化的工具,但挑來挑去還是選擇了 Word 裡的稽核比較。

但這真不是我貪圖 Word 裡的修訂統計,因為在實際對比的過程中,我發現 Word 比較出來的修訂統計,皆是以詞語或句子為單位的,並不能做到十分精確。

語音輸入誰最準?暴肝3天,105次測試,告訴你一個想不到的答案!

而且更關鍵的是,這樣的修訂統計與我測試的初衷不符,我想得到的最終結果,是以我在語音輸入後,需要手動編輯修改的次數最少為核心,這是今天評測的唯一標準,也符合實際應用場景的使用邏輯,簡單點說,改得越少,識別最準。

所以這裡我選擇了搭配人工統計,每個錯誤的字元、每個有問題的標點,都是我一個一個數出來的,單是統計的這一步驟,就花了我一整天的時間。

語音輸入誰最準?暴肝3天,105次測試,告訴你一個想不到的答案!

可不是我磨洋工啊,主要是和我設計出來的評測方案有關。。。

3.評測思路

在實驗中,為了確保原始音訊檔案一致,輸入的語音都是提前錄好同一段語音素材,除 iPhone 自帶的聽寫外,在同一個手機上使用不用輸入法進行實驗,儘可能降低誤差率。

這裡的「儘可能」,包括不限於讓兩部手機處在同一網路環境下;播放音訊的手機固定且音量固定;兩個部手機的位置不發生變化等等。

但實際過程中,哪怕外在條件都一致,多次測試仍會得出不同的識別結果,從統計學意義上說,為了降低誤差,保證測試結果的穩定性,應該多次測試然後取平均值再參與對比。

事實上,我也是這麼幹的,一個輸入法要完整連續識別每個音訊 3 次才算過關,某種意義上說,這次準確率的測試,其實也兼顧了語音識別的穩定性。

同時呢,在實驗測試結果中,我還對錯誤特徵進行了分類,比如文字字元錯誤、標點錯誤、數字錯誤、英文單詞大小寫錯誤等等。

之所以進行分類,是為了更加準確地體現出識別的準確率。如文字錯誤、單詞錯誤屬於識別錯誤,已經影響了閱讀與理解,後期還要刪掉修改,所以這些字元錯誤的係數定為 1。

如果是標點符號這類錯誤,不影響閱讀與理解,但仍需要後期校對修改,這些標點錯誤的係數定為 0。5。

如果是英文大小寫錯誤和未空格錯誤等其他錯誤,屬於識別正確拼寫錯誤的範疇,所以把這些統一歸為其他錯誤,其他係數定為 0。2。

係數之所以這樣標定,究其原因還是不同錯誤對閱讀、理解、修改的影響不同,所以只有在統一的標準下,才能真正橫測出贏家。

那麼準確率的計算方法我們也有了:(總字元數-錯誤數對應係數)/總字元數,且這樣連續計算三次後,再取均值得到最終準確率。

至此,我們的前期準備工作才算搞定,至於參與評測主角表現如何,一起來看看結果。

普通話極致水平

因為每個輸入法都測了 3 次,所以我這裡就不一一向大家展示識別結果了,5 個測試物件,帶上原文字,一共 16 個 Word 文件。

語音輸入誰最準?暴肝3天,105次測試,告訴你一個想不到的答案!

把統計來的資料錄入表格,綜合結果如下。

結果分析:

在字正腔圓的播音員面前,搜狗輸入法表現最好,問題都是些無傷大雅的標點符號,而且對於資料的播報,搜狗輸入法的數字規範書寫顯得非常準確。

語音輸入誰最準?暴肝3天,105次測試,告訴你一個想不到的答案!

不信你看看差生 iPhone 自帶輸入法的聽寫功能,數字書寫亂得那是一塌糊塗。

語音輸入誰最準?暴肝3天,105次測試,告訴你一個想不到的答案!

訊飛和微信的表現和搜狗非常接近,至於最後為什麼會敗下陣來,仔細對比後,我發現還是數字識別後的規範出了問題,且多了一個錯別字。

語音輸入誰最準?暴肝3天,105次測試,告訴你一個想不到的答案!

剩下的百度,則輸在了字元錯誤上,只能說在字正腔圓面前,搜狗輸入法拿捏住了細節。

在普通話極致水平的測試中,準確率排名為:搜狗輸入法 > 微信輸入法 > 訊飛輸入 > 百度輸入法 > iPhone 聽寫

普通話一般水平

雖然在播音員面前搜狗表現很好,但真說貼合日常生活,還得是咱們一般人的說話標準,正好,以我普通話二級甲等的水平,不算好也不算差,算箇中游水平吧,所以我就親自上陣,選了幾段以前文章裡的片段,口播試試輸入法們的深淺。

當然,因為這段的測試最有用,所以我這裡選擇了並非只准備了一個音訊,而是一口氣測了三個音訊。

這是第一次的測試結果:

語音輸入誰最準?暴肝3天,105次測試,告訴你一個想不到的答案!

第二次的測試結果:

語音輸入誰最準?暴肝3天,105次測試,告訴你一個想不到的答案!

第三次的測試結果:

語音輸入誰最準?暴肝3天,105次測試,告訴你一個想不到的答案!

結果分析:

出乎意料的是,在第一項測試中字元錯誤表現最好的搜狗和訊飛輸入法,被微信彎道超車,為啥會發生這樣的情況?

答案是,微信雖然在數字書寫細節方面略有不足,但丟字、錯字表現最好,反觀搜狗和訊飛,連這個「128M」都能識別出來,但總是丟三落四的。

語音輸入誰最準?暴肝3天,105次測試,告訴你一個想不到的答案!

而標點符號的斷句方面,搜狗、訊飛難分伯仲,微信一如既往的穩定,也是它能脫穎而出的原因之一。

至於百度,表現一如既往的不佳,要不是 iPhone 聽寫兜底,市場佔有量頗高的百度就尷尬了。

說到 iPhone 聽寫,我的感覺是,它重新給我編了故事。。。

語音輸入誰最準?暴肝3天,105次測試,告訴你一個想不到的答案!

在普通話一般水平識別中,準確率排名為:微信輸入 > 訊飛輸入法 > 搜狗輸入 > 百度輸入法 > iPhone 聽寫

中英文混合輸入

中英文混合輸入雖然在日常使用中適用的場景較少,但交流中一旦搞不定夾在內的英文單詞,那就尷尬了,像我這樣的科技號在日常寫作中有時候會出現大量夾雜英文單詞的狀況,所以也把這個加入到本次評測中。

選用的文字,選自蘋果官網關於 Apple Music 的介紹,錄入資料後,表格如下:

語音輸入誰最準?暴肝3天,105次測試,告訴你一個想不到的答案!

結果分析:

在這一項測試中,識別正確率能到 90% 以上的,只有微信和訊飛,所以這裡的分析重點也放到它們倆身上。

這是微信表現最好的一次識別:

語音輸入誰最準?暴肝3天,105次測試,告訴你一個想不到的答案!

這是訊飛表現最好的一次識別:

語音輸入誰最準?暴肝3天,105次測試,告訴你一個想不到的答案!

單說英文單詞的識別和書寫規範,其實訊飛反而比微信還強,該大寫的大寫,該空格的空格,像「Sonos」這個詞,訊飛識別了出來,反而微信沒有識別。

但從準確率上說,微信比訊飛要高上那麼一點點,仔細對比後,我發生是微信是贏在了漢字識別率更準確上。

至於蘋果的聽寫,只要我發音到位,單詞識別的很 Nice,但就這中文,實在難盡人意。

語音輸入誰最準?暴肝3天,105次測試,告訴你一個想不到的答案!

搜狗表現中規中矩,必須要說的是百度,因為音訊中關於「iPhone、iPad、Apple Watch」那句唸的很快,所以總會在那個地方卡頓。

我前後識別了 8、9 次,才有了完整的 3 次識別結果,但效果差了很多。

所以在中英文場景中,準確率排名為:微信輸入 > 訊飛輸入法 > 搜狗輸入法 > 百度輸入法 > iPhone 聽寫

方言

正兒八經的測試其實到上面就結束了,但在測試時,我發現和 4 年前不一樣的是,現在的那三家主流輸入法,都開始支援方言識別了,我還看到了「河南話」的選項。

這讓我來了興趣,因為之前在外地上學工作,所以我怕我說得不夠地道,專門從網上找了段地道的河南話。

挨個把搜狗、百度、訊飛輸入法調成河南話後,測了一波,至於沒有「河南話」專項的微信和 iPhone 聽寫,則是硬上,表格如下:

語音輸入誰最準?暴肝3天,105次測試,告訴你一個想不到的答案!

結果分析:

沒想到,這次是真的沒想到,開啟「河南話」識別的三家第一梯隊的輸入法,竟然還沒有微信硬上好用。

倒是 iPhone 聽寫不出意料的翻車,一共也就 265 字,iPhone 聽寫愣是錯了 170 多個字,看來本就語文不合格的 iPhone 聽寫,在河南話面前真的是一點面子都沒有了。。。

語音輸入誰最準?暴肝3天,105次測試,告訴你一個想不到的答案!

至於那三家第一梯隊的輸入法,也是矮個裡挑高個,百度輸入法跑到了前頭,和搜狗一起成功及格。

在河南話方言的測試下,具體排名為:微信輸入 > 百度輸入法 > 搜狗輸入法 > 訊飛輸入法 > iPhone 聽寫

AI 合成音

既然連河南話都測了,我又想到了「注意看,這個男人叫小帥」的 AI 合成音,套娃嘛,要的就是節目效果。

所以我用微軟 Azure 的雲希專門生成了這麼一段話:

語音輸入誰最準?暴肝3天,105次測試,告訴你一個想不到的答案!

測試後,表格如下。

語音輸入誰最準?暴肝3天,105次測試,告訴你一個想不到的答案!

結果分析:

AI 合成音嘛,不像正常說話那樣帶有停頓或者不標準的發音習慣,所以整體結果和普通話極致水平是接近的。

可以看到搜狗和訊飛的表現,無論是錯字、漏字,還是標點符號都差不了多少,微信則一如既往的穩定。

AI 合成音的語音識別中,準確率排名如下:微信輸入 > 訊飛輸入法 > 搜狗輸入法 > 百度輸入法 > iPhone 聽寫

結語

在分項做完對比後,我又做了個最終的表格,即將上面 5 項測試結果的準確率相加求平均值,最終統計結果如下:

語音輸入誰最準?暴肝3天,105次測試,告訴你一個想不到的答案!

換言之,今天這 5 個支援語音輸入的工具排名為:微信輸入 > 搜狗輸入法 > 訊飛輸入法 > 百度輸入法 > iPhone 聽寫

其實評判語音輸入法的方法標準並不唯一,前面也說了,我這次得出來的結果,為的就是得到一個需要修改調整字元最少的方案。

單從這一點出發,贏家毫無疑問是微信自帶的語音輸入功能,訊飛和搜狗之間的差距很小,最讓我失望的,毫無疑問,還是市場佔有率遠比訊飛還高的百度輸入法了。

語音輸入誰最準?暴肝3天,105次測試,告訴你一個想不到的答案!

圖源艾媒網

你瞅瞅這個月活對比圖,最高的但是在語音輸入這裡反而表現最差,讓人實在沒想到,果然是貨比貨得扔啊。

這篇文章我花了近 3 天時間才完成,完全是用寫論文的態度完成這次評測的,以前向大家安利軟體的時候,說什麼什麼好,什麼什麼不好,其實拋開對比來說誰更好用,都有點耍流氓。

這次不耍流氓了,給大家整點乾的,這也是我寫這篇評測的初心。

如果你覺得今天這篇評測有用,請大膽點個贊,你的支援就是我堅持的動力,希望這篇有用,也值得。