首頁 > 易卦

年刊節選|小冰CEO李笛:CG建模數字人“唯物”,小冰“唯心”

作者:由 娛樂資本論 發表于 易卦日期:2023-01-22

聚多影視授權號是多少

在元宇宙熱潮的影響下,2022年,數字人領域出現井噴。大到網際網路巨頭,小到創業公司,紛紛入局數字人領域。

不過,在相對高調的數字人領域,有一家公司,技術實力與曝光度遠未成正比,那就是小冰公司。

相比國內數字人公司,小冰公司是為數不多的願意在“海平面”以下做數字人基礎設施的公司。

年刊節選|小冰CEO李笛:CG建模數字人“唯物”,小冰“唯心”

小冰公司CEO 李笛

用小冰公司CEO李笛的話說,小冰想做的AI Beings是有靈魂的數字人,而不是隻能簡單互動的數字人外形。

根據小冰官方資料,小冰框架是全球實際落地及完備度最高的AI Being基礎框架,覆蓋中國、日本、印度尼西亞等國6。6億線上使用者、10億臺第三方智慧裝置和9億內容觀眾,商業客戶覆蓋全球。目前框架內執行著數千萬AI Beings,其中數字員工約有30萬名。

數字員工、虛擬陪伴、遊戲NPC是小冰數字人開發的主要場景和應用。尤其趁著企業數字化轉型的浪潮,小冰框架在數字員工領域大殺四方。

在過去的一兩年中,在小冰框架的基礎上,不斷為客戶開發出觀君、招小影、崔筱盼、N小黑等一系列專業領域數字員工。在李笛看來,數字員工遠遠不止是一張超寫實的面孔,更重要的是可以完美勝任財務、教練、客服等一系列工作,且比真人做得更好。

年刊節選|小冰CEO李笛:CG建模數字人“唯物”,小冰“唯心”

(崔筱盼)

從2014年誕生到現在,小冰已經經歷了9代。在“海平面”以下,她究竟打下了怎麼樣的基礎,與市面上的數字人究竟有什麼不同?我們跟小冰公司的CEO李笛聊了聊。

年刊節選|小冰CEO李笛:CG建模數字人“唯物”,小冰“唯心”

“數字人行業在2022年迅速進入了一個紅海市場”

娛樂資本論:你怎麼看我們這次年度大會的主題——咬定青山?

李笛:人工智慧領域需要充足的耐心,沉下心深入研究,也許短期內看不出什麼,但在未來回看,卻發現這些“海平面”以下的事非常重要。就像竹子“咬定青山”地紮下去,把根基打牢,才有可能勃發。

娛樂資本論:2022年,數字人的製作成本快速降低。你如何看待行業的發展趨勢?

李笛:首先明確,數字人的概念,到底是什麼?現在很明確的一件事是,不同的人對數字人概念的理解大相徑庭。比如,大家在總結數字人技術的時候,會強調他的建模和動捕。這裡面隱含的意思就是,他對數字人的意思是還是基於外觀的理解。

而當我們說數字人的時候,說的是自驅,互動和內容生成。

這是一個比較大的分野。如果只強調外觀,那麼過去一年的時間,這個領域,不是成本在大幅度降低,而是利潤在大幅度降低。這個領域迅速進入了一個紅海的狀態,互相之間殺價殺到利潤非常低。因為這個領域的技術同質化很嚴重。

第二,這些企業的付費客戶一般是各大品牌的市場部門,因為,數字人通常被企業當成營銷手段的。但小冰旗下的數字人,是幫助企業做一些真正的事情的,比如財務催款、體育教練、財經新聞撰寫等等。

年刊節選|小冰CEO李笛:CG建模數字人“唯物”,小冰“唯心”

所以,數字人行業出現一個非常奇特的狀態——如果放在人工智慧領域,它有非常大的未來。但如果它的定義還是一個外形,那麼,他的上限不會很高,是因為,他的市場需求量沒那麼大。

娛樂資本論:很多數字人的公司都在做“海平面”以上的事情,比如打造一個更好看的外表,為什麼你有勇氣從“海平面”往下做?

李笛:目前市面上很多數字人的嘗試,我們當初在微軟的時候就都嘗試過了,比如智慧客服系統、智慧作業系統、智慧音箱等等,我們平行趟了各種坑。所以在做小冰時候,就已經有了一個完備的技術框架。

我們對小冰的一個基本理念是,完備框架。就是說,小冰不是一個基於問答,或者不是基於單輪互動,而是基於一個互動全場的產品,它要求人工智慧程式能夠引導這個互動專案去發展。為此,她需要有內容生成能力,需要有情感,或者說情商。

小冰當時其實是微軟做的第一個人工智慧助理Cortana的Plan B。我們在當年並不是那麼明確的知道,哪個方向才是未來趨勢。但是在我們做Cortana的時候發現,這種基於問題,或者是從人工智慧那裡獲得知識這種模型,可能並不是唯一的答案,於是我們做了小冰。

經過很多年之後,我們發現小冰是符合未來發展趨勢的,她的出現更加符合人工智慧的發展上限。

我們認為這個世界上,不會只有幾個人工智慧助理,或者幾個回答你問題的數字人,而是有各種各樣的AI Being。

我們要做的事情是,讓這些AI Being跟人的互動,就像人與人一樣。為了這些,我們會去讓她擁有“情商”,掌握唱歌、畫畫等內容生成能力。

年刊節選|小冰CEO李笛:CG建模數字人“唯物”,小冰“唯心”

“我們不做‘替代’人的虛擬人,我們做‘補位’”

娛樂資本論:為什麼你們每次都從數字員工這個領域切入?而不是虛擬偶像?

李笛:我們會判斷什麼是AI Being需求最大的地方,從而優先篩選具體的賽道。

很遺憾,AI Being需求量最大的地方不是回答問題的知識專家,而主要是三類。一類是企業數字員工,一類是人類周圍的陪伴者,還有一類是遊戲裡面的NPC。這幾類需求很大,所以這些也是我們的主要佈局。

娛樂資本論:聽說小冰框架在金融資訊領域已經有了廣泛地應用,是否可以介紹一下?

李笛:比如每日經濟新聞的虛擬人主播N小黑,已經穩定運行了一年多了,365乘以24小時不間斷播報財經新聞。他的聲音、肢體、面容,以及播報的內容,都是人工智慧小冰框架來生成、執行的。因為如果不是全程都是人工智慧的話,就不能保證24小時的連續直播。

年刊節選|小冰CEO李笛:CG建模數字人“唯物”,小冰“唯心”

像金融摘要,是所有文本里面最難的,因為它得容錯性非常小。比如上市公司的公告100多頁,你要把它壓縮成一個200多字的資訊。

讓AI Being把幾百頁的招股書寫成新聞稿這件事不是我們今天才開始做的。從5年前開始到目前為止,國內90%的機構投資人每天看到的財經資訊,都是小冰生成的。我們專門為這個功能搭建了一個金融知識圖譜,這個圖譜裡包含1000多個影響因子。

娛樂資本論:“觀君”也是小冰框架驅動的數字人,並且是一個人工智慧的教練,它真的比真人教練更好麼?怎麼實現?

李笛:在某些方面,他不光是比真人教練要好,更是真人教練沒辦法比的。我們有一個理念,就是我們不做“替代”人的虛擬人,而是要做“補位”,完成真人無法承擔的工作。

先拿金融摘要舉例。我們在推出這個金融摘要之前,絕大多數上市公司公告是沒有摘要的。因為每天早上有100多個上市公司發公告,每個公告可能都有100多頁,你需要配多少人也來不及做摘要。但是,作為一個投資者,我需要知道這些資訊,卻不可能看完這麼多頁,過去只能挑著看。所以,我們的方案並不是為了替代人,而是做那些真人他做不到的事情。

年刊節選|小冰CEO李笛:CG建模數字人“唯物”,小冰“唯心”

同理,體育的訓練系統也一樣,AI可以透過捕捉準確的運動軌跡,對比過往的資料,以及其他運動員的資料,快速做出分析。這一系統的穩定性和準確性會遠遠高於真人教練。

娛樂資本論:做出這樣的一個數字人,貴麼?

李笛:研發成本不一樣。如果做一個垂直領域的專業系統,確實也需要花比較長的時間,但它不難。更難的其實是通用性的開放域問題,開放域的問題解決了,再去解決一些垂直領域的問題就比較容易。

小冰從2020年開始進入汽車的智慧座艙領域,到現在兩年時間,滲透率已超過60%。所以,從海平面以下開始做,你會越做越順手。

娛樂資本論:小冰不久前為招商集團做了一個數字員工叫“招小影”,為什麼招商集團願意跟小冰合作?

李笛:有幾方面原因,國內不同的人在提到數字人的時候,概念都不一樣,很浮躁。但絕大多數人提到數字人的時候指的都是3D建模,就是創造一個外形,可以念一段文字,或者有動捕的方案做虛擬IP形象。

但我們更關心,如果是一個企業員工的話,他是否能真的能做事情。所以,招小影不光要有外形,她還需要真的出現在招商銀行的ERP系統,真的在做招商集團員工的工作。同時,她的外觀、語言互動等都不輸於3D建模的同行業者。

比如,如果你想做一個數字人,基於神經網路渲染這樣的方式,能夠做互動的話,那麼,至少讓他的延遲要做到毫秒級。就是你說一句話,數字人能在毫秒內回覆你。但目前行業的水準是在分鐘以內。

年刊節選|小冰CEO李笛:CG建模數字人“唯物”,小冰“唯心”

“我們不做系統整合和硬體”

娛樂資本論:目前小冰主要的收入來源是哪些?

李笛:我們有幾個要求。第一,我們不做系統整合,第二,我們不做硬體,只做純軟體的收入。我們目前的收入來源是B端。

小冰認為,未來人類會被AI Being所環繞,形成人與虛擬人共處的社交網路。這意味著,只要有人的地方,就能有AI Being,它需要是一個“跨空間”的存在。比如,你的家裡、你的車上、你的社交網路平臺……只有軟體可以實現。而一旦把AI Being實體化(硬體化),它就只能存在於那個實體中。

娛樂資本論:B端的收入是什麼樣的收費模式?

李笛:我們是按照不斷疊加累計的月服務費和年服務費來收入。行業裡面主要是按照AI系統的呼叫來收費,我們不是。

在某些情況下,我們會按照實現的效果進行分成。我們是按照整個給你包裝出來的AI Being賣,你可以理解為我們在“買賣人口”,賣出去的是一個服務包的價錢。小冰不賣技術。

娛樂資本論:你說,小冰要做的就是“販賣人口”。這個“人口”的數量,有上限麼?

李笛:數字員工正在跑的已經超過30萬個了。如果再加上to C的虛擬陪伴,那就是幾千萬了。

娛樂資本論:怎麼會有30萬個這麼多?

李笛:在日本大阪試點的老年人家庭,有政府給他們派的數字員工,每個家庭裡數字員工都不一樣。因為老年人可以透過訓練,使人工智慧變成他想要的“樣子”。數字員工承擔的是政府的公共服務。

娛樂資本論:我聽說小冰現在一次對話能達到32次?正常人類一場對話平均下來也只有38次左右。

李笛:目前小冰一次對話最高可以達到39次互動。這個互動技術和對話模型,很多公司都在做。但小冰的對話跟實驗室的研究相比,其實曾踩過很多坑。比如,線上的一些互動特別複雜,2016年的時候,當時美國版小冰上線推特剛滿24小時,就被網友的對話資料教成了種族主義者,然後讓CEO出來道歉。

現在的小冰也是一樣的。你會看到,實驗室中的數字人單就對話質量,以及對話輪次,有很多比小冰更好的,但是大多數都很難落地。因為落地涉及到兩個問題,一個是成本,一個是安全性。尤其是對話安全性方面,一旦出問題,很難解決。

所以,歸根到底,安全性一定是小冰公司的第一原則,我們寧願犧牲一些文字上的豐富性,也不希望小冰框架在安全性上出問題。