首頁 > 易卦

全球網際網路很快「儲存空間不足」,未來要把資料存在哪裡?

作者:由 愛範兒 發表于 易卦日期:2022-08-15

讀寫資料從哪裡到哪裡

如今智慧手機的儲存空間越來越大,可全球的資料儲存很快就會亮出「儲存空間不足」的預警。

根據軟體公司 Domo 的報告,2018 年人們每分鐘在 Google 進行 383 萬次搜尋,在 YouTube 觀看 433 萬段影片,傳送 159362760 封電子郵件、473000 條 Twitter 和 49000 張 Instagram 上的照片。

全球網際網路很快「儲存空間不足」,未來要把資料存在哪裡?

而在中國,每天在微信發出的資訊就超過 450 億條。Domo 預計到 2020 年全球人均每秒將產生 1。7 MB 的資料,以全球人口 78 億計算,那麼一年就會產生 418 ZB 的資料,大約需要 4180 億個 1TB 硬碟才能裝下。

這還沒考慮到人口的增長趨勢,聯合國預計世界人口在 2050 年就能突破 97 億。這意味著現有的資料儲存系統撐不到下個世紀了。

全球網際網路很快「儲存空間不足」,未來要把資料存在哪裡?

▲ i 圖片來自:聯合國

資料的爆炸式增長,迫使人類尋找更好的資料儲存技術。有人嘗試用 1 公斤 DNA 儲存全球資料,微軟則研發出可以號稱可以使用上千年的「玻璃光碟」,然而技術最先進的科技公司還在使用磁帶儲存資料。

人類文明狂奔 5000 多年,但現在可用的儲存介質最長的壽命最多才約 60 年,資料儲存的未來到底在哪裡?

9102 年了,科技公司為什麼還在用磁帶儲存資料?

在很多人印象中,磁帶彷彿是上個世紀的古董了。不少 80 後 90 後當年還是以買磁帶來支援自己的偶像,任賢齊 1996 年發行的專輯《心太軟》錄音帶銷量就突破了千萬。

全球網際網路很快「儲存空間不足」,未來要把資料存在哪裡?

然而隨著 CD、MP3、智慧手機相繼在音樂市場上各領風騷,磁帶也成了一代人的回憶,在生活中難覓蹤影。可磁帶並沒有死,反而在大資料時代成了最具競爭力的儲存介質。

目前包括 Google 、亞馬遜和微軟等科技巨頭其實也還在使用磁帶來備份海量資料。為什麼放著機械硬碟(HDD)和固態硬碟(SSD)不用,反而去用磁帶儲存資料呢?

全球網際網路很快「儲存空間不足」,未來要把資料存在哪裡?

最重要的原因還是便宜,這些科技公司的使用者數以億計,需要儲存的資料量十分龐大。儘管雲計算是未來趨勢,但對於提供網際網路服務的公司來說,依然需要將資料儲存到本地,這將是一筆不菲的成本。

儘管與硬碟和半導體儲存器相比,磁帶的讀取速度要慢得多。但成本卻也低得多,1 TB 容量的行動硬碟售價約為 50 美元,相同容量的磁帶的價格僅需 5 美元。

全球網際網路很快「儲存空間不足」,未來要把資料存在哪裡?

▲1951 年磁帶首次用於計算機(Univac)資料儲存

而且磁帶比硬碟要耐用,一般硬碟的壽命不超過 10 年,每隔幾年就要複製到新硬碟中,海量的資料的複製不止耗時,而且還容易丟失資料,而磁帶則可以儲存數十年。

此外在使用過程中磁帶只需要插在機械磁帶庫的插槽中,不需要耗電,也節省了不少電力成本,要知道 2025 年全球資料中心的電費將會超過百億美元。

全球網際網路很快「儲存空間不足」,未來要把資料存在哪裡?

對於很多公司來說,資料儲存的安全性往往是重要的。因為磁帶不安裝驅動就無法訪問,這種離線狀態隔絕了駭客和網路攻擊,不容易丟失和被篡改。

2011 年,Google 郵箱 Gmail 因為一次更新中的 Bug 意外刪除了 40000 多個賬戶的郵件,雖然 Google 一直有在多個數據中心用硬碟儲存資料副本,但仍有部分資料無法恢復。所幸這些資料同時也有備份到磁盤裡, 才得以恢復所有資料。

全球網際網路很快「儲存空間不足」,未來要把資料存在哪裡?

▲ 圖片來自:Business Insider

因此除了科技公司,不少對於資料安全性有較高要求的企業和機構其實也還在用磁碟儲存資料。比如銀行、保險公司、國家檔案館,以及科研機構,其中就包括美國國家航空航天局(NASA)。

但磁帶並不是因為安全和成本而犧牲效率的資料儲存載體,磁帶技術的發展已經超出很多人的想象。

索尼在 2014 年利用自主開發的濺射薄層沉積技術,將 7。7nm 的極細磁顆粒鋪設在磁帶上,實現了高密度磁儲存,儲存容量可以達到 185TB。

全球網際網路很快「儲存空間不足」,未來要把資料存在哪裡?

IBM 在瑞士蘇黎世有一個專門的研究團隊來負責推進磁帶技術,據團隊科學家 Mark A。 Lantz 介紹,IBM 在 2017 解決了每平方英寸儲存 201 千兆位元組的難題,並透過引進索尼的濺射薄層沉積技術,將單盒磁帶的容量提升至 330 TB。

編者注:1 平方英寸=0。00064516 平方米

更重要的是,磁帶的儲存容量已經以每年 33% 的速度增長了多年,而且並沒有放緩的跡象。資訊儲存行業協會(INSIC)預測 2025 年磁帶儲存密度能達到每平方英寸 91 GB,到 2028 年將突破每平方英寸 200 GB。

全球網際網路很快「儲存空間不足」,未來要把資料存在哪裡?

▲ 圖片來自:Quartz

而硬碟的磁錄密度增長速度卻已經降到了 10-15%,因為當硬碟的儲存密度達到一定極限後,要再縮小磁性顆粒大小,就難以保持磁性穩定,這就是所謂的超順磁極限 (superparamagnetic limit)。

根據 IDC 的資料,網際網路上的大資料正以每年 30%-40% 的速度增長,而目前硬碟容量增長的速度不到大資料增長速度的一半,磁帶卻可能成為遵循摩爾定律的最後一種資訊科技。

眾多廠商在嘗試突破儲存技術的極限,但沒那麼容易

正如上文所述,企業級的資料儲存裝置至少要兼顧下面這些因素:成本、安全、耐用和儲存密度。那麼除了磁帶,我們真的沒有別的選擇嗎?

只能說,現階段磁帶是價效比最高的大資料儲存介質之一,但很多廠商也一直在研究新的儲存技術。比如硬碟廠商希捷和西數開發出的熱輔助磁記錄技術(HAMR)和微波輔助磁記錄技術(MAMR),就有望讓硬碟打破超順磁極限。

全球網際網路很快「儲存空間不足」,未來要把資料存在哪裡?

▲ 圖片來自:Fstoppers

這兩種技術分別透過鐳射和微波來降低介質的矯頑力,在超高密度的資料儲存中時保證足夠的穩定性。但這兩種技術都還未完全成熟,需要更多時間才能完全商用。

另外一種可能像磁帶一樣被忽略的就是光儲存技術,CD 和 DVD 都是光儲存介質的一種。但過去的 CD 容易老化,同時由於衍射極限的限制(可以看作光盤裡的超順磁極限),儲存密度也十分有限。

全球網際網路很快「儲存空間不足」,未來要把資料存在哪裡?

▲圖片來自:Taskar Baban Sadik

但藍光光碟改變了這一切,據華錄光儲存研究院營銷中心副總經理胡冰介紹,藍光光碟同樣具有可靠穩定和使用壽命長的特點,使用壽命能達到約 50 年,單張藍光光碟的容量已達 500 GB,未來有望突破 TB 級。

全球網際網路很快「儲存空間不足」,未來要把資料存在哪裡?

▲圖片來自:ssdfans

同時藍光儲存對溫度等環境溫度要求較低,不需要空調冷卻系統,這大大降低了成本。Facebook 的資料中心就採用了藍光儲存,與硬碟相比節省了超過一半的成本,耗電量則降低了 80% 以上。

微軟最近曝光的 Project Silica 專案其實也基於光儲存技術,是透過飛秒鐳射技術(一種以脈衝形式發射的鐳射,常用於近視矯正手術)在一塊玻璃上形成一個奈米尺度光柵層結構,併產生不同深度和角度的變形,有點像燒錄光碟,不過密度更高也更復雜,一塊 2 毫米厚的玻璃可以包含 100 多個數據層。

全球網際網路很快「儲存空間不足」,未來要把資料存在哪裡?

目前微軟已經和華納兄弟公司合作,成功將 1978 年的《超人》電影母帶儲存在一塊 75 x 75 x 2 mm 的玻璃中,並透過機器學習對於玻璃中的資料進行了非順序的讀取,只不過讀取速度還有待提升。

全球網際網路很快「儲存空間不足」,未來要把資料存在哪裡?

跟光碟不一樣的是, Project Silica 的資料是儲存在玻璃內部而非表面,因此資料不會因為玻璃磨損而丟失。研究人員將這種「玻璃光碟」放進 500 ℃ 的烤箱、用微波爐加熱、廢水煮泡,甚至用鋼絲擦洗後,資料依然能順利讀取。

全球網際網路很快「儲存空間不足」,未來要把資料存在哪裡?

雖然這項技術仍處於初期階段,但英國微軟劍橋研究院的實驗室副主任表示,這種「玻璃光碟」可以持續使用上千年。此外玻璃對溫度和溼度也沒什麼要求,這能大幅降低資料儲存的成本

實際上「玻璃光碟」並不是微軟的首創,早在 2016 年英國南安普敦大學成功用類似的技術將資料編碼到玻璃中,可以承受 1000 ℃ 的高溫 ,號稱在常溫下壽命接近無限,即便在 190°C 下也可使用 138 億年 ,要知道地球的歷史也才大約 46 億年。

全球網際網路很快「儲存空間不足」,未來要把資料存在哪裡?

值得一提的是,微軟的 Project Silica 專案正是和南安普敦大學合作開發的,這種玻璃光碟又被稱為 5 維光碟,由奈米結構的三維,再加上整體尺寸和方向構成。同等尺寸的玻璃光碟儲存容量是藍光光碟的 3000 倍。

如果成功,真的可能像南安普敦大學研究人員所說的,開創一個數據永久儲存的新時代。

最好的資料儲存載體,可能就是我們自己

資料儲存領域裡一個更大膽的設想,是生物質硬碟,就是將資訊儲存在 DNA 中。

DNA 是如何儲存資料的?其實原理不算複雜,所有計算機資料都是以 0 和 1 組成的二進位制數儲存和運算的,而 DNA 儲存技術則是用四種鹼基來代替 0 和 1 ,將數字訊號轉化為化學訊號。

2017 年,哈佛大學醫學院就利用 CRISPR DNA 編輯技術,將一張賽馬的動圖錄入大腸桿菌的基因組中,並以超過 90% 的準確率讀取出來。

全球網際網路很快「儲存空間不足」,未來要把資料存在哪裡?

近幾年也出現了不少探索 DNA 儲存技術的創業公司,前段時間初創企業 Catalog 宣佈將維基百科英文版一共 16G 的所有文字儲存在一個 DNA 分子中,透過一臺超大型 DNA 書寫器完成,資料寫入速度能達到 4 MB/s 。

全球網際網路很快「儲存空間不足」,未來要把資料存在哪裡?

▲ 裡面就是儲存了 16G 維基百科的 DNA

而另一家叫做 Twist Bioscience 的生物科技公司,是目前全球最大合成基因的供應商之一。據其創始人 Emily Leproust 介紹,該公司一粒膠囊中的 DNA 可以儲存相當於整個 Facebook 資料中心的資料。

目前 Twist Bioscience 已經向客戶推出 DNA 儲存的服務,但價格卻很感人。儲存 12 MB 資料的價格就高達 10 萬美元,但 Emily Leproust 表示未來這一價格將降到 10 美分。

2016 年哈佛大學在學術期刊 Nature Materials 發表了一項關於 DNA 儲存技術的研究成果,指出 DNA 的儲存密度遠超目前任何一種儲存介質,經過換算,1kg 的 DNA 就能儲存全球一年產生的資料。

全球網際網路很快「儲存空間不足」,未來要把資料存在哪裡?

但 DNA 儲存目前還遠不是理想的資料儲存技術,除了昂貴的成本,由於 DNA 儲存的資料只能透過測序來讀取,讀寫速度非常緩慢。有人計算過如果要將 2017 年全球產生的 16 ZB 資料儲存到 DNA 中,需要花費 40 億年。

今年年初微軟首次實現

了全自動 DNA 資訊儲存

,讓 DNA 儲存技術從實驗室邁向商業化更進了一步,但僅僅是編碼「hello」五個字母,從轉換到讀取就要花費 21 小時,同時讀取的準確度也有待提高。

全球網際網路很快「儲存空間不足」,未來要把資料存在哪裡?

由此可見,雖然 DNA 儲存技術確實有可能徹底解決全球資料儲存的問題,但這個未來還有一段不短的距離。

資料永久儲存有可能實現嗎?

隨著各種技術成熟,人類正在追求資訊儲存在時間和空間兩個維度上的極致:超高的儲存密度和永恆的儲存時間。

沒有人知道這能否實現,因為沒人能活到永遠,人類最早的文字記錄也只是 5200 年前蘇美爾人留下的楔形文字,然而網際網路誕生僅僅 50 年,50 年前的資料有多少至今仍儲存完整呢?

全球網際網路很快「儲存空間不足」,未來要把資料存在哪裡?

在科幻小說《三體》中的未來世界裡,即便一粒米大小的量子儲存器就可以放下一座大型圖書館的資料,但最多也只能儲存 2000 年。最後人們發現把資訊儲存 1 億年的唯一可行方法,就是「把字刻在石頭上」。

劉慈欣總結得好:

文明像一場五千年的狂奔,不斷的進步推動著更快的進步,無數的奇蹟催生出更大的奇蹟,人類似乎擁有了神一般的力量但最後發現,真正的力量在時間手裡,留下腳印比創造世界更難,在這文明的盡頭,他們也只能做遠古的嬰兒時代做過的事,把字刻在石頭上。

題圖來自:《龍珠》