大規模整合是一種歷史必然

什麼是資訊整合

如何理解基於汽車的新制造革命？汽車製造過程中，大量的資料如何傳送到控制器？gavinhill等人在analytical motors、quick communications、quick office、quick signal四篇研究報告中，提出了一個直接的視角，考慮「先進製造」的可能性。

他們的研究方法論值得借鑑。在探討這個問題的道路上，英國bt實驗室提出了「資料先進製造（distributed digital industry）」這一概念，從製造過程中資料的流動、高效處理資料等方面，將「資料先進製造」同基於汽車的汽車製造革命緊密聯絡在一起。

在他們看來，可以說大規模整合是一種歷史必然。通常透過整合現代資料來源來減少系統因資料處理時間，和如何共享現代資料來源等問題，是關鍵因素。雖然各國對dimbus在汽車製造過程中的作用有不同的定義，但是在計算機上實現資訊整合通常是資料先進製造的原始概念。

在資料採集方面，大家最大的特色可能就是可以透過實時資料獲取問題模型的結構，並用於模型更新迭代。但是，資料來源是怎麼被採集到的呢？這需要對大資料的特性有所理解。舉個例子，資料一般有兩種來源，一種是使用者活動資訊獲取，一種是透過大規模公開資料集獲取。

首先，我們需要區分什麼是使用者行為；什麼是公開資料集。研究單個使用者行為影響的只有使用者註冊時提供的資訊；研究群體共性行為的，可以透過叢集來獲取。這在科研活動中也很常見，因為他們通常需要大規模多學科的資料來源來支撐。現實中，有一部分科研結果沒有專業公司來支撐，那麼社會機構就是最好的叢集來源，也就是提供報告或者資料解決方案的單位。

另外一個叢集方式就是透過大規模資料來源來採集。資料中心有儲存，有算力，總可以高效地執行某一個特定過程。上文中的使用者行為中，可以分為活動類使用者，行為類使用者等。還有就是一些科研結果，需要分析單個科研結果的差異，那麼根據演算法評分不同獲取不同的科研結果也是個很好的解決方案。

反過來，在資料獲取方面，目前還只有個別幾個大資料庫作為行業研究的主力。每家大資料庫都有自己的特色，比如具備位置資訊，時間序列，向量資訊等等。但是這並不影響本質上的東西。gavinhill做過評估使用者偏好的使用者動力學的特徵，使用了基於連續變數的條件隨機場的蒙特卡洛模擬，給出了與線性迴歸相關聯的分佈，這和機器學習裡面的分佈非常類似。

大規模整合是一種歷史必然

相關文章

猜你喜歡