首頁 > 易卦

資料資產的玄學、顯學

作者:由 鈦媒體APP 發表于 易卦日期:2023-01-28

大資料值錢嗎

圖片來源@視覺中國

鈦媒體注:本文來源於微信公眾號遠川科技評論(ID:kechuangych),作者 | 董指導,鈦媒體經授權釋出。

資料就是資產,這個道理在商業領域並不難懂。

比如國外有聚焦金融資料的彭博,國內也有萬德,早期靠著人工錄入、整理資料的方式,聚集了龐大的資料庫,成為投資公司的必備;而聚焦學術文獻等知識資料的知網,不僅舒舒服服賺差價,還能涉嫌壟斷被處罰。

但資料資產這個理念,在全社會得到認可,也非一蹴而就,而是一波一波的普及、深化。

2011年,麥肯錫釋出報告,認為“大資料Big Data已成為當今競爭、創新、生產效率提升的關鍵基礎”。一時間,大資料,成為業內熱點。資料,大家都懂;大,有什麼區別?

聚焦大資料的創業公司紛紛成立,時任美國總統的奧巴馬也在2012年3月宣佈了“大資料研究與發展先導計劃”,雖然投資額僅2億美元,但有評論認為這和上世紀90年代的資訊公路計劃相媲美。

而不管大的是什麼,至少一個確定的趨勢是,資料資產,越來越值錢。

這股科技新風也來到中國。本著“懂不懂先不說,有新趨勢就先幹”的大A,也漸漸熱鬧起來。比如擁有消費者購買記錄的百貨公司,雖然還處於電商取代線下的衰退趨勢中,但投資者還是興奮地給了“估值重構”的機會,2013年7月份,也曾有過股價快速漲一倍的戰績。

而最“得勢”的當屬銀之傑,公司透過收購億美軟通,為企業向用戶傳送簡訊,每年傳送量超過100億條。每一條簡訊,在投資人眼裡,都是金燦燦的“資料資產”。再疊加科技牛市buff,銀之傑受到投資者的狂熱追捧。從2012年底起,兩年半漲幅近100倍。一個字,絕。兩個字,瘋狂。

2015年4月,我國首家大資料交易所——貴陽大資料交易所成立,對資料資產的探索,又邁出了關鍵一步。成立當天就完成了第一筆資料交易,交易所管理層也雄心勃勃,提出在3~5年內將日交易額推到100億元的規模。

蜂擁而至的故事,結局似乎都差不多。2016年,Gartner在報告中警告:許多公司正打算削減大資料專案投入。

百貨行業沒有避開電商的衝擊,業績也沒有被資料資產改善;而簡訊等資料,也讓投資人清醒,有的資料是資產,有的只是01程式碼,或者只是投資人情緒的載體。而在大資料領域創業的公司,也有一些融了FGH輪之後,不得不賣伺服器來改善現金流。而貴陽大資料中心也在2022年8月,才實現了資料交易規模突破1億元。

然而,也正如Gartner公司經典的科技發展曲線一樣,技術發展不是一帆風順,資料的資產重塑,也必經歷曲折。基於龐大資料的演算法,正成為許多公司業務提升的訣竅,例如在短影片、在自動駕駛。而資料交易所的數量擴充套件到了30多家。

資料資產,似乎是“玄學的顯學

,顯而易見的是,資料很重要、資料很好用、資料很值錢;而玄之又玄的是,資料如何成為資產?如何成為可交易的資產?如何成為產生更大收益的資產?要回答這些問題,並不容易。

蘋果“關門”:資料屬於誰

2020年,蘋果公司內部發生了一場激烈爭論,話題是“是否限制對iPhone使用者廣告追蹤”。負責技術開發的一方,希望加大對使用者隱私的保護;而負責廣告、營銷業務的一方則認為,開發人員需要透過廣告來盈利,這個限制會引起合作伙伴的反對。

最終,2021年4月,蘋果推出了折中方案,應用開發者必須事先詢問使用者,是否同意線上活動被其他網站和應用跟蹤。

雖然是折中方案,但對於廣告主們而言,仍然是“晴天霹靂”。畢竟,這個提問,就等同於問“把你家開啟讓陌生人進去怎麼樣”。使用者顯然基本上不會同意。

使用者的拒絕,就是廣告主的損失。比如有研究認為,Facebook、Twitter等幾家公司,就因為蘋果新方案而在2021年下半年損失了近100億美元廣告收入。而與之對應,2021年11月蘋果公司財報顯示,廣告業務,創下季度新高。

廣告公司指責蘋果這個做法帶來“破壞性”,甚至“別有動機”。但卻絲毫沒有辦法,畢竟,使用者的資料都在手機上。

蘋果和廣告主的“衝突”,並不是個例。國內手機商華為也和應用開發商騰訊,關於資料有過爭議。華為智慧助手可以根據微信聊天內容來提供個性化內容服務,比如提供差旅資訊,就有天氣、車票等推薦;聊到看電影,就有電影、買票渠道等推薦。而騰訊則認為這個做法侵權了騰訊的資料、使用者的隱私。

類似的糾紛還有順豐和菜鳥、微博和今日頭條等等。在公司激烈爭吵之外,產生資料的使用者,似乎是真正的所有者,通常情況下只能默默無聲。而這些狀況,都指向了資料資產的核心問題:確權。

使用者的資料所有權、平臺的資料所有權,如何界定?

蘋果“關門”:資料屬於誰

一個不成文的行業慣例,是使用者的資料屬於使用者;但提供服務的平臺,可以透過使用者的授權(不點選同意授權,就沒辦法使用應用),對資料具有一定的使用權。透過對資料的分析、使用,提升整體效率、拿到雙贏自然是最好不過了。

一個經典的案例,是沃爾瑪透過樣本資料得到結論,在尿不溼旁邊擺放啤酒,既提升了銷量,又節省了使用者選購時間。而在地圖軟體上,透過分析終端使用者的數量、使用者的移動速度,也可以對路況得到大致的分析,有助於使用者提前規劃路線、節省時間。

資料分析提升生活的案例,不勝列舉。但不可否認的是,演算法的世界,也有資訊繭房、大資料殺熟等等讓人擔憂的事情。資料的使用,也有邊界。

最近,某網際網路公司的國際業務犯了個錯誤,員工未經使用者允許、且在非法律要求的情況下,查看了幾位使用者的資料。儘管幾位員工的目的和探尋公司機密資訊洩露相關,但很不幸,這個行為依然引起了輿論的軒然大波,同時也會面臨監管機構的調查、甚至處罰。

我們目前的資料,大部分都是和個人相關,要變成資產,就必須先守好邊界。使用者期待的是,用我的資料,讓我更好;而不是利用我的資料,找到我的弱點,猛攻、謀利。

不當訪問:該用資料做什麼

汽車領域有過一場爭論,關於整車廠是否要丟掉自己的靈魂。

這個衝突在現實中很常見,擁有資料的公司,許多並不具備分析資料的能力,而如果把資料完全公開給合作方,不僅涉及隱私、甚至還會丟掉靈魂。而另一方面,一家機構的資料維度有限,要達到更好的效果,也難免會涉及多方資料共享。

如何讓資料合規、安全得到處理?所謂,原始資料不出域、資料可用不可見。這就需要用到“隱私計算”。

隱私計算,也是前幾年的創業熱潮。剛需性毋庸置疑,但在從概念驗證走向商業落地過程中,存在的瓶頸也是顯而易見:

不當訪問:該用資料做什麼

比如在技術體系方面,就有:

姚期智教授在1982年提出的“多方安全計算”;可追溯到1996年的、谷歌也在大力使用的“聯邦學習”;Intel等晶片公司推動的由軟硬體方法構建安全區域的“可信執行環境”;以及包括差分隱私、圖聯邦等在內的其他技術等。

而所有的技術路線,也都有一些共性瓶頸。專注於隱私計算領域的上海富數科技,在和遠川科技的產業交流中強調,本身用來解決安全合規問題的隱私計算,卻也存在多個“安全黑盒”:

隱私計算:安全分析資料

雖然隱私計算的理論基礎是公開、被廣泛認可的學術研究成果,但在實際應用中,為了滿足商業環境需求,也會自行改造演算法協議,而這部分修改對客戶是不透明的,也缺少嚴謹性,但卻存在安全基礎坍塌的風險。

這就有點類似於祖傳秘方,也許好用,但也不知道為什麼,總還是有點擔憂。

隱私計算:安全分析資料

演算法程式碼容易被惡意修改,無法與演算法協議保持一致性,從而也破壞了演算法原本的安全性和正確性。

技術路線差異大、派系眾多、理論複雜晦澀。

原始資料一般會先經過本地計算和加密處理,產生中間資料,然後再用中間資料和合作方進行互動。但,中間資料的準確性無法驗證。這不禁令人想到一幕幕鬼才的翻譯橋段,中間人如果不靠譜,做啥都是乾瞪眼。

演算法協議存在“安全黑盒”。

單個演算法可能滿足安全要求,但是多個演算法流程的組合,是否安全,就存在不確定性。這也好理解,機率論告訴過我們,多個非100%的準確率疊加後,同時都正確的機率就會大幅降低;而且,組合也會提高複雜度。

演算法程式碼存在“安全黑盒”。

隱私計算產品中的演算法、資料安全性和一致性難以驗證評估,因此審計監管只能依賴人工審查和理論證明。而如果採用“自證清白”的方式,不僅流程繁複、效率低下,而且靜態的驗證也難以檢測真實應用情況。

困難重重。但解決方案也在推進,比如透過資料洞察、通訊透析、日誌開箱、程式碼審計、全鏈路視覺化等方式,可以有效緩解黑盒瓶頸。

隱私計算的應用,會逐步打破資料孤島,將資料資產連線起來,實現真正的數字社會;但隱私計算的發展,也並不是安全公司一家的事兒,對算力、通訊網路傳輸效能都提出了巨大需求和挑戰。

資料互動存在“安全黑盒”。

前段時間,蔚來公司遭遇到了駭客勒索,要求支付225萬美元等額比特幣(約合1570。5萬元人民幣)以換取盜竊的資料不洩露。遭到蔚來拒絕後,駭客進行了公開定價出售,比如2。28萬條內部員工資料值0。15比特幣、39。9萬條車主ID資料值0。25比特幣等等。

雖然駭客對資料進行了明碼標價,但實際上,對資料資產,進行估值定價並不是一件容易的事。

目前海外國內都未對資料資產價值評估形成體系化的框架理論。上海資料交易所和普華永道聯合釋出的《資料要素視角下的資料資產化研究報告》中顯示,處在研究中的方法包括:

應用流程存在“安全黑盒”。

成本途徑,即以年均歷史開發成本、持續運營成本為基礎,結合資料有效使用年限、使用率、質量等要素,計算出資料資產價值。這個方式的前提要求有歷史成本可計量。

收益途徑,即以新的使用場景產生的年均增量收益為基礎來評估。這個方式的前提要求具備買方場景的效用評價體系。

市場途徑,即市場說了算,願意支付多少就是多少。而這個方式的前提是,具備良好的流通市場。也就是,得有活躍市場、才能定價。這就有點像套娃,好的流通需要有好的定價體系,而有效的市場定價,則需要好的流通市場。

在農業中,有一句話,資產千萬,帶毛不算。這是說牲畜容易因傳染病而遭到巨大損失,不容易估值。而資料資產的估值,且先不說資料真偽判斷,單說評估難度,也不亞於“帶毛的”。但估值,又是資料成為資產,必不可缺的一環。

也許可以借鑑的,是股票市場,從90年代開始,關於新股定價多番探索。而資料資產,作為更加非標準化的產品,摸索路徑難免也會更加曲折。

隱私計算的審計監管存在“安全黑盒”。

駭客勒索:資料資產如何估值

每個時代,都有其對應的核心資產要素。

農業經濟時代,農業技術是第一生產力,土地、勞動力、農耕工具是核心生產要素;工業經濟時代,蒸汽、電力技術是第一生產力,能源、裝置、資本,也成為核心要素。

而在當下數字經濟時代,數字技術成為第一生產力,資料資產,也已經和土地、勞動力、資本、技術等並列成為生產要素。

資料不僅只有個人資料,企業資料、公共資料,都是可以挖掘的資產。資料資產的時代趨勢是清晰,但路徑卻充滿挑戰:蒐集、確權、加工、分析、定價、使用、監管,多個環節、多種困難。正視困難,是成功的開始。

而時代機遇,也恰恰存在於解決時代難題的過程中。