首頁 > 繪畫

著眼使用者需求,vivo 致力於用 AI 實現“1001 個便利”

作者:由 CSDN 發表于 繪畫日期:2023-01-12

vivo怎樣頁面識別文字

當前資訊科技已經進入人機物融合、萬物智慧互聯的階段,人工智慧作為引領新一輪科技革命和產業變革的重要戰略性技術,成為各行業數字化重構的神兵利器。與我們生活息息相關的諸如智慧家居、智慧汽車、智慧手機等等終端裝置的“智”化發展都離不開 AI 技術的支撐。

在移動終端裝置中,人們日益攀升的通訊、娛樂、辦公、出行等體驗最佳化需求,驅動著智慧手機的不斷迭代。如今“一部手機走天下”的願景已經逐漸照進現實,而 AI 憑藉著巨大的發展潛力,以及對行業多邊應用的推動力,將成為使用者體驗提升的關鍵技術,一個新的創新感知時代已經來臨。

聚焦 AI 創想的無限可能,國內手機大廠 vivo 基於使用者體驗需求以及對智慧終端行業敏銳的感知,向大眾展示了軟硬兼具的實力與美好藍圖。

深耕 AI,蓄力前行

自 2017 年起,vivo 便開始組建 AI 全球研究院,憑藉著“希望幫助所有消費者享受科技帶來的美好生活”的初心,不斷攻克技術壁壘、擴充團隊規模,下沉技術深度的同時,也在探索並佈局應用的多維度發展。

vivo 高階副總裁施玉堅在 2022 vivo 開發者大會上表示,“我們堅持使用者導向,從使用者的視角出發,穿著使用者的鞋子在企業裡奔跑,堅持設計驅動,透過設計驅動完成使用者導向的落地,並透過不設上限的持續研發投入,拓展消費電子行業人文與科技的邊界。”

當 AI 重新定義世界,vivo 也在開拓邊界。經過 5 年多的努力,今天的 vivo AI 全球研究院已經有超過 1000 名 AI 工程師,在演算法、資料、算力方面建立了全面的技術能力,全方位賦能了 vivo 的核心業務,覆蓋手機、網際網路、營銷等領域。

AI 打造 1001 個便利

基於“AI 打造優質體驗”的技術驅動,vivo 希望依託 OriginOS 能力,以使用者使用手機的多元化場景為載體,致力於為使用者打造“1001 個便利”,讓科技照亮美好未來。

著眼使用者需求,vivo 致力於用 AI 實現“1001 個便利”

截至目前,OriginOS AI 已經實現了 500 多個功能,涉及諸如娛樂時聽歌識曲、AI 字幕翻譯、螢幕朗讀,生活中提醒充電、取快遞,拍照時 AI 感知引擎讓顏色識別更準確、清晰出片,工作時拍攝電腦螢幕消除摩爾紋,出行時自動彈出乘車碼通知等等使用場景,為使用者提供無處不在的驚喜。

著眼使用者需求,vivo 致力於用 AI 實現“1001 個便利”

vivo 不僅為普通使用者提供便利,為特殊人群也打造了諸多便捷功能。例如,針對聽障人士的日常溝通需求,vivo 整合了核心 AI 技術,聯合中國聽力醫學發展基金會發布了“聲聲有息”公益計劃,推出“無障礙通話”“vivo 聽說”及“聲音識別”等功能,為聽障人士搭建溝通的橋樑,營造更友好的資訊無障礙社會環境。

vivo 堅持以使用者為導向,持續發力技術創新,用有溫度的科技,讓每個人都能享受科技進步帶來的快樂,用科技去照亮美好未來。

著眼使用者需求,vivo 致力於用 AI 實現“1001 個便利”

AI 感知引擎:透過 AI 計算攝影技術讓手機能夠像專業攝影師一樣理解世界,透過智慧的白加黑減和白平衡演算法,使得純色場景能夠做到精準還原。

琥珀掃描:運用文件影象處理和 OCR 文字識別技術,讓手機化身為便攜掃描器,辦公學習更加高效。

朗讀螢幕:基於 vivo 自研的個性化語音合成系統,研發出的豐富多元的合成聲音,解放雙手雙眼,為使用者打造流暢舒適的閱讀新體驗。

翻譯機:支援二十多個主流語種的互譯,跨語言溝通不再有障礙,讓使用者生活學習隨心自由。

Jovi 輸入法 Pro:自研拼音、語音、手寫三大輸入法 AI 核心,和 OS 深度結合,為使用者提供安全、高效的輸入體驗

Jovi 語音助手:智慧生活助理,使用者透過可以透過與手機的語音指令互動,解放雙手,一句話搞定各種複雜操作。

vivo 手語識別虛擬人:既能流利地透過手語進行表達,還能快速識別手語,幫助聽障人士與他人順暢溝通。

……

強大技術原力,創造使用者驚喜

便捷的服務、高效的體驗往往需要強大的技術原力作為支撐。

影象是日常生活中 AI 最常用的場景之一,我們拍照首先要拍得清,vivo

AI 透過自主研發的文件影象處理引擎與

OCR 文字

識別技術的核心演算法,實現了囊括文件掃描、實況文字、表格識別、試卷去手寫&算式批改等在內的多重功能。

文件影象處理引擎:可以對文件進行自動裁剪矯正以及超清修復,幫助使用者更便捷、更清晰的記錄好文件。一方面透過最佳化檢測、分割以及邊緣線精修三個模組來共同提升檢測框的精度,同時,透過疊加光流跟蹤模組,進一步提升了檢測框的穩定性。最佳化後的檢測框做到了既準又穩,使用者在拍攝時可以享受一拍即得。此外,透過疊加全域性超清模組,不僅有效提升了文件的色彩表現力,還能讓文字更加清晰和銳利,使用者一鍵即可自動完成之前需要多次操作才能完成的任務。透過超清修復,近距離拍螢幕可以去除摩爾紋,開會拍 PPT 能去除人頭遮擋。

OCR 文字識別引擎:能夠幫助使用者智慧識別圖片中的文字,即便是褶皺彎曲的手寫字也能做到準確快速的識別。在視覺模型的基礎上疊加了語言模型進行融合識別,進一步提升了模糊、手寫等低質量影象場景下的識別準確率。同時,由於演算法都是執行在手機本地不需要傳輸網路,不僅使得體驗不受網路穩定性影響,還更好的保障了使用者的資料隱私安全。當想要將書稿文字快速錄入筆記時,只需調起相機掃描就可以將文字實時上屏,不管是書稿還是手寫稿都可以做到又快又準,高效提取。

著眼使用者需求,vivo 致力於用 AI 實現“1001 個便利”

把影象拍清之後,下一步就是要把影象拍好,因此 vivo 團隊自 2018 年起便持續在 AI 計算攝影方面專注投入。

今年,vivo 攜手蔡司基於 AI 計算攝影能力,從“智慧白加黑減技術”和“智慧白平衡技術”入手,還原極致色彩,讓拍攝充滿驚喜。

智慧白加黑減技術:vivo 在行業內首次解決了“白加黑減”場景下曝光不準確的問題。拋棄傳統十八度中性灰曝光方法中的測光假設,透過對畫面內所有區域進行觀察取值,基於深度神經網路模型估計最優曝光引數。曝光準確率超過行業競品 20%。

智慧白平衡技術:拋棄了傳統白平衡演算法中的“灰世界”假設,考慮到亞洲人色彩恆常性的視覺特點,以及拍攝場景,從地域、光源、場景等多個維度構建豐富的色彩資料集。再基於人工智慧模型去實際學習人眼看到的色彩,從而獲得更準確的白平衡引數。相對於行業競品,色彩精準度提升 13%。

除了影象處理之外,語音處理也是 AI 的另一個重要使用場景。vivo 的 AI 語音技術包括語音合成技術以及語音識別技術, 基於自研的語音合成系統

,vivo 持續地研發出了豐富多元的合成聲音,實現了多音色、多風格以及多情感的合成技術。透過端到端建模、AI 降噪以及場景化語言模型等方式,克服了口音、噪音和專業領域等導致的識別錯誤,極大提升了語音識別的準確性。

著眼使用者需求,vivo 致力於用 AI 實現“1001 個便利”

面對日益豐富的國際交流和文化碰撞,vivo 透過機器翻譯技術助力使用者突破語言障礙。針對翻譯的重點人群、高頻場景、便捷入口均設計了產品方案,助力高效解決翻譯需求。

此外,Jovi 語音助手自推出以來,一直圍繞著便利的技能、豐富的知識、貼心的閒聊三個方向不斷提升。目前 Jovi 語音助手已經支援超過 100 個場景垂類,超過 600 種使用者請求意圖,很好地滿足使用者在快捷操作、資訊獲取、情感陪伴方面的需求。目前手機端日活已經超過 1000 萬,每個月小 v 都會和使用者產生 18 億次對話,回答 2 億個問題。

當然,AI 帶來的便利遠不止這些,vivo 多年來深耕於手機使用典型場景的普適性和通用性,在智慧終端行業內牽頭實現應用升級與迭代,反哺著行業創新發展,共同打造極致的使用者體驗。

堅持使用者導向,科技照亮美好未來

在人文關懷方面,經過不懈的研發創新,vivo 實現了手語到文字再到語音的流暢互譯,推出了手機行業首個具備手語識別能力的虛擬人。目前的演算法已經可以識別 1200 個手語詞彙,準確率在 80% 以上,已經達到漢語四級的理解水平,同時在手語表達方面,目前覆蓋了國家手語通用詞典超過 8000 個詞彙。AI 手語虛擬人既能流利的透過手語進行表達,還能快速識別手語看懂手語,幫助聽障人士更便捷地獲取資訊,更高效地與人溝通。

理念牽引,實幹專注。發展多年,vivo 始終深耕於科技行業,並向大眾展示了一系列佈局與探索:vivo 影像戰略釋出,打贏了手機攝影之戰;開啟自研晶片之路,向世界展示了 vivo 敢於向技術深水區邁進的決心;堅持長期主義,重視核心科技研發,更是 vivo 長久、健康發展的“形象標籤”。

暢想未來,vivo 將 AI 技術作為又一個研發重點:一方面 vivo 將在計算攝影、文件掃描、語音技術、語義技術、機器翻譯、計算加速平臺、vivo 開發者平臺 AI 專區七大方向持續發力;另一方面 vivo 計劃逐步開放這些領先的 AI 能力,攜手行業夥伴合作共創,比肩為消費者打造極致的體驗,更是展現了手機行業巨頭的格局擔當。在這條鮮有前人的道路上與開發者們同行,為 5 億多全球 vivo 使用者以及更多消費者提供方方面面、無處不在的驚喜與激動人心的體驗,打造“1001 個便利”。

著眼使用者需求,vivo 致力於用 AI 實現“1001 個便利”

走出方寸天地,擁抱行業變幻。如何滿足使用者體驗,技術可以下沉到何種程度,手機產品如何在激烈的市場競爭中搶得關鍵先機?我們看到,vivo 一一給出了最優解。正如施玉堅所說,“我們堅持從使用者的真實需求出發,不斷創新和最佳化產品、以人文理念思考解決方案,努力成為更強大、更值得信賴的平臺。”

科技帶來美好生活,未來的 vivo 將成就怎樣的自身以及行業,讓我們拭目以待。