多快好省的生成式 AI 何時進入規模化商用？

ai切片工具怎麼切文字

文｜動點科技

作者｜鄭惠敏

編輯｜Steven Lee

近日，一位國外遊戲設計師的作品《太空歌劇院》奪得了美國科羅拉多州博覽會藝術比賽數字類別的一等獎。據瞭解該畫作完全由 AI 繪圖軟體根據文字指令生成，是不折不扣的 AI 畫作，這樣的結果引來了不少傳統藝術家的指責，一時間，關於 AI 作畫是否是作弊、人類藝術消亡的討論引爆網路。

AI 作畫正是大量 AI 模型訓練後的技術能力輸出的方向之一。

Gartner 釋出的 2022 年 AI 技術成熟度曲線顯示：

生成式 AI、AI 大模型等技術在萌芽 2 年多後已快速步入期望膨脹階段，生成式 AI 更是被 MIT 科技評論列入 “2022 年全球十大突破性技術”、是 Gartner“2022 年的 12 項頂級戰略技術趨勢” 之一。

什麼是生成式 AI？

2020 年，生成式 AI 首次出現在 Gartner 技術成熟度曲線上。

生成式 AI 是指利用現有文字、音訊檔案或影象等建立新內容的技術。

使用生成 AI，計算機檢測與輸入相關的基本模式並生成類似內容。

生成式 AI 可從其資料中學習內容或物件，並運用資料生成全新的、完全原創的、逼真的工件，留下與訓練資料相似的特徵，而不是簡單的重複。

生成式 AI 有潛力創造新形式的創意內容，例如影片，並可加快從醫學到產品創造等領域的研發週期。

企業可以透過兩種方式使用生成式 AI：一是與業務部門一起增強當前的創新工作流程，開發自動化以幫助人類更好地執行創造性任務。例如遊戲設計師可以利用生成式 AI 來建立地下城，突出他們喜歡和不喜歡的內容。二是充當業務流程的重要部分，生成式 AI 可以在幾乎沒有人為參與的情況下生產無數的創意作品。它只需要設定上下文，結果將獨立生成。

與此前廣受爭議的深度偽造 Deepfake 相似，生成式對抗網路 (GAN) 與變分自動編碼器 (VAE) 也都是生成式 AI 的關鍵技術。其中，生成式對抗網路更廣泛地用於影象處理，而變分自動編碼器則更多地用於資訊壓縮。

生成式對抗網路本質上是一種深度學習模型，在原理上，生成式對抗網路使用兩個神經網路相互對立，一個生成器和一個判別器。生成器或生成網路，負責生成類似於源資料的新資料或內容，判別器或判別網路則負責區分源資料和生成資料。經過交替週期訓練，雙方在對抗中不斷完善。

生成器不斷學習生成更逼真的資料，判別器則更善於區分假資料和真實資料。

變分自動編碼器可以為具有不同機制的各種任務建立更有效的分類引擎。它們的核心建立在組成的神經網路的一個自動編碼器和一個自動解碼器上。

編碼器最佳化表示資料的更有效方式，而解碼器最佳化重新生成原始資料集的更有效方式。

傳統上，自動編碼器技術清理資料、改進預測分析、壓縮資料併為其他演算法降低資料集的維數。變分自動編碼器更進一步，以儘量減少原始訊號的誤差與重建誤差。

生成式 AI 的巨大潛力

根據 Gartner 官網，預計到 2025 年，生成式 AI 將佔所有生成資料的 10%。

IDC 報告預測，2025 年全球 AI 市場規模將達到 2218。7 億美元。其中，中國約佔全球總規模 8。3%，位列單體國家第二。《中國 AI 數字商業產業展望 2021-2025》報告認為，

從中國 AI 應用表現看，以生成式 AI 和組合式 AI 為代表的人工智慧新興技術將成長為中國數字商業產業鏈的關鍵應用技術棧。

生成式 AI 是最引人注目和最強大的 AI 技術之一，在各行各業有著廣泛的使用案例。

例如在工業設計領域，企業可以將不同的限制條件提供給 AI，由 AI 設計出一些不同的方案以供選擇。

在媒體內容生成方面，生成式 AI 可以處理並生成圖片、音訊、影片、檔案、語言等不同型別資料。比如介面原型設計工具 Pencil 可以將企業上傳的字型、顏色、LOGO、圖片等素材生成可用於營銷或廣告用途的海報或影片等內容。

此外，生成式 AI 還可用於增強式程式設計，透過計算機或機器輔助程式設計師寫程式碼，當前微軟、Github、OpenAI 都在使用這種技術。

以多模態形式呈現的數字人、虛擬偶像等也是生成式 AI 的應用方向。數字主播的聲音、表情、動作是透過背後的大模型實時生成並融合呈現的。

以上種種都可以歸結為數字產品，此外，生成式 AI 還為陷入困境的企業資料使用打開了新的可能性，即在真實資料的基礎上製作合成的資料。

雖然單條生成資料可能面目全非但其資料集的整體分佈，包括方差、均值都與原始資料十分接近。即其在保留資料價值的同時將涉及資料安全的隱私部分隱去。

合成數據有望提高資料資源的豐富度，以合成數據輔助 AI 訓練也已成為國際通用的手段，它可以為工業機器人或自動駕駛車輛設計數百萬個不同的訓練場景。

國內商業公司中，支付寶基於實物建模技術與渲染技術提出應用於視覺零售的 3D 合成方案，也是運用合成數據有效降低了模型訓練中的資料成本，避免了人工標註資料帶來的不可靠性。

Unity 總裁約翰·裡奇蒂洛認為合成數據可以無偏差地訓練人工智慧的演算法，人們可以隨時退回到之前的過程檢視和分析演算法。這在真實世界資料強化的過程中，需要幾天幾周幾個月才能做到，但是用合成數據幾乎即刻就能完成。

Gartner 研究總監閆斌認為，合成數據在未來企業的應用中存在較大的發展空間，且與全球市場相比，國內的合成數據廠商較少，機會更多。

合成數據可實現不同企業間資料的彙集，並應用於更加安全的第三方分析工作、廠商選型、測試以及一些雲上的應用，以及在脫敏和合規基礎上的資料變現，儘可能地保留資料價值。

邏輯與安全性尚待提升

當前，生成式 AI 與合成數據發展趨勢迅猛，被視為有望掀起人工智慧 2。0 的浪潮。但距離大規模商用還有很多困難需要克服。現有的生成式 AI 的應用還存在一些侷限，比如在常識、邏輯和推理；複雜上下文的長期記憶以及對於資料的依賴性和效率方面。

人工智慧專家認為，生成式 AI 在未來還需關注以下問題：

合成數據的評估問題。在全面應用合成數據集之前，需要充分研究合成數據集與真實資料集的差異，從而避免應用合成數據集帶來的偏差。

如何評估合成數據集與真實資料集的差異仍是一個亟待解決的問題。

合成數據仍存在 “非自然資料” 的問題。目前大多合成數據技術基於統計機器學習的方法，由於經典統計學只關注了資料中蘊含的相關性，而忽視了因果性，因此有可能會生成不合邏輯的資料。例如合成影象中出現的具有異常背景的影象，這類資料被稱為 “非自然資料”，它對智慧演算法的魯棒性和可靠性將造成何種影響目前仍然未知。

刻畫影響的邊界並提早思考應對措施將會是合成數據能否進入風險敏感領域的關鍵。

合成數據的安全性問題，主要包括生成對抗網路等模型的穩定性問題會帶來預期之外的生成結果、對於原始訓練樣本的記憶容易導致隱私洩露以及被不法分子用於詐騙等風險。

且在實際應用中，合成數據也存在一些無法模擬的場景，也不適用於人臉檢測、物體識別等人工標註成本較低的任務，對於低成本實現動態場景模擬等技術難點還需進一步攻克。

多快好省的生成式 AI 何時進入規模化商用？｜動察

相關文章

猜你喜歡