首頁 > 易卦

虛擬數字人有了體溫

作者:由 東方財富網 發表于 易卦日期:2023-01-31

科技何以向善

“虛擬數字人”是指用數字技術在非物理世界中構建的具有人類特徵的虛擬產物,其集成了計算機圖形學、動作捕捉以及多模態模型、語音識別、知識圖譜等技術,堪稱近年來最受關注的“人”了。

虛擬數字人何以成“人”?一方面是透過整合一系列高精尖技術,從而使虛擬數字人的外貌、聲音甚至是實時互動能力高度擬真;另一方面則是虛擬數字人的應用可以為人們的生活帶來實實在在的便利,並與人類實現共生共榮。前者始終以科技創新作為關鍵驅動力。沒有創新,虛擬數字人的高度擬真也就無從談起。後者則進一步闡明科技要始終遵循以人為本的發展理念,要讓虛擬數字人更好地滿足社會生產生活需求,要讓科技彰顯人性溫度。

技術創新是關鍵驅動力

顧名思義,虛擬數字人的核心在於對“人”的高度擬真、模仿。無論是外貌、聲音還是互動行為都無限接近真人,讓虛擬數字人與人類的交流溝通更加真實,增加互動沉浸感。因此,能否提供足夠自然和擬真的互動技術,是虛擬數字人能否在未來場景應用中逐步取代一些不必要的真人勞動力,助力社會邁向數智化的關鍵。

技術創新始終是虛擬數字人能夠更加擬真、智慧以及整個產業做大做強的關鍵驅動力。總體而言,虛擬數字人技術正在快速發展,產業發展脈絡變得清晰。《虛擬數字人深度產業報告》認為,從技術層面看,虛擬數字人已經劃分為真人驅動型和計算驅動型兩個大類。

以真人驅動模式為例,在完成原畫建模和關鍵點繫結後,技術人員只需利用動作捕捉裝置或攝像頭採集真人表情與動作等要素,便可直接驅動虛擬數字人。由於其背後是直接利用了真人的各種表情動作,因而虛擬數字人的動作靈活度以及互動效果都較為出色。這種技術模式的好處在於,一方面能夠在部分涉及影視創作的行業中顯著降低生產成本,另一方面則能在虛擬偶像、直播主播行業進行批次生產,讓虛擬數字人在大型直播、現場路演等互動性較強的活動中加強落地應用。

有關虛擬數字人技術討論的高潮莫過於“真假黃仁勳”事件。在2021年4月

英偉達

舉辦的釋出會上,

英偉達

創始人兼CEO黃仁勳以虛擬數字人形象出現在虛擬甲板(Holodeck)上面並進行了簡短髮言,這在全球範圍內引起了熱議。

英偉達

這段時長約14秒的“秀肌肉”環節讓很多觀眾第一次領略到虛擬數字人的飛速發展——它們已經能夠以假亂真了。

據介紹,英偉達的虛擬世界模擬引擎Omniverse依託頂尖的計算機圖形學、人工智慧等技術,其不僅允許使用者在平臺上進行建模、佈局、陰影、動畫、照明、特效或渲染工作,還可以建立互動式人工智慧替身。

無獨有偶,我國

百度

科大訊飛

等人工智慧領先企業也在積極探索虛擬數字人技術,他們利用擁有自主智慧財產權的影象、人工智慧引擎或是先進的人臉3D重建、唇形驅動技術,配合自身擁有的各類數字資產,在虛擬數字人領域開疆拓土。

隨著虛擬數字人技術不斷迭代創新,未來的數智化社會也許會是這般風貌:全世界不同膚色、講著不同語言的人們憑藉虛擬數字人將自身對映到元宇宙中,虛擬世界的“人們”幫助真人深度參與生產活動。各行業的執行也將變得更高效——工業、金融、

教育

、文化、醫療等垂直行業元宇宙紛紛落地,並反哺物理世界中的技術與產品,使其再度迭代升級。

科技向善彰顯人性溫度

如果說技術賦予了虛擬數字人動聽的聲音、真實的膚色,那麼如何更好地用虛擬數字人技術造福社會則決定虛擬數字人能否擁有自己的體溫。科技向善是人類命運共同體的內在要求。虛擬數字人作為新一代資訊通訊技術的集大成者,其不僅要“取之於人,用之於人”,更要用得好、用得對。

根據研究機構統計,預計到2030年,我國虛擬數字人整體市場規模達到2700億元。面對規模龐大的市場藍海,如何利用好虛擬數字人為公眾服務是產學研必須思考的問題。

目前,多數虛擬數字人企業的發力點主要圍繞透過搭建虛擬數字人內容生成平臺,深挖特定場景(政務、金融、傳媒、大型活動賽事等)的人工智慧客服、虛擬主播、虛擬助手、新聞播報等業務,華為、

科大訊飛

百度

、騰訊、搜狗等企業都在該領域有所佈局。

在2021年一場華為開發者大會的會場直播大屏上,身著紅色衣服的虛擬數字人實時匹配演講嘉賓的說話內容,透過手語直播大會內容。據介紹,該虛擬數字人基於即時聽到的語言,透過華為手語服務,實時生成連貫、自然的手語。另外,華為還宣佈此專案將透過華為手語服務(SignPal Kit)開放出來,讓虛擬數字人惠及全世界的聽障群體,讓溝通無障礙。

世界衛生組織(WHO)最新資料顯示,全球患有聽力障礙的群體大約有4。66億人,幾乎超過全世界人口的5%。手語作為聽障群體溝通的重要工具,是他們融入社會和完成工作、學習的橋樑與紐帶。特別是由於交流的不便和資訊的缺失,聽障群體在公共場所,例如政府、

銀行

、醫院等機構辦理業務時面臨諸多困難。在我國,聽障群體人數約為2700萬,即每100人中約有2人患有聽力障礙。但是目前我國手語行業發展較為緩慢,手語

教育

培訓力量薄弱,具備專業手語翻譯資格認證的人員更是少之又少,與龐大的聽障群體比例極為失衡。虛擬數字人的應用將為他們帶來切實福利。

以人工智慧技術見長的

科大訊飛

正在為患有視力障礙的人們的溝通交流作貢獻。隨著北京冬奧會和冬殘奧會日益臨近,從2019年底啟動的北京市無障礙環境建設專項行動也進入收官階段。科大訊飛高階副總裁杜蘭透露,和往屆奧運會相比,2022年北京冬奧會及冬殘奧會將成為歷史上首屆溝通無障礙的奧運會。為了滿足視障群體需求,科大訊飛推出了虛擬互動志願者,其利用多語種識別、自然語言理解、機器翻譯、虛擬形象等核心技術,替代真人提供全天候播報服務,讓視障人士能夠“聽得見”文字。

隨著各類底層技術越發成熟以及更多為公眾服務的虛擬數字人應用落地,虛擬數字人將不僅是一個由0和1組成的工具,更會是一個擁有體溫的“人”,更廣泛地傳播數智化帶來的社會紅利,惠及每個角落。

(文章來源:人民郵電報)