Arweave:《蘋果》的啟示、網路的亞歷山大圖書館

#371

嗨,早!

香港《蘋果日報》在上週四出刊最後一期,官方網站及相關社群平台內容已全數終止服務。營運 26 年的《蘋果》正式走入歷史。這篇文章討論《蘋果》的啟示,以及 Arweave 如何運用去中心化科技在網路上重建「亞歷山大圖書館」。

《蘋果》的啟示

現在打開香港《蘋果日報》網站只能看到訂戶通知,無法再瀏覽任何新聞內容。但若是在 Internet Archive(網際網路檔案館)輸入舊網址,還是可以找得到過去的圖文網站備份。根據《科技創業週報》整理:

25 年前,數位圖書館員 Brewster Kahle 將自己共同創辦的網站監測工具 Alexa 賣給亞馬遜之後,創立了網際網路檔案館 —— Internet Archive。他希望 ... 讓知識普及的願望透過網路成真。

史上第一個網頁在 1991 年上線,五年後 Internet Archive 的「網頁時光機(Wayback Machine)」服務就開始備份整個網際網路。25 年來,網頁時光機累計收錄了 4,750 億個網頁。

而根據最新統計,目前全球可以被檢索到的網頁卻只剩 60 億個,約為網頁時光機收藏總量的 1.2%。這說明「網頁時光機」的重要性 —— 你可以在裡面找到許多本來已經消失的網頁。

網頁時光機會透過網路爬蟲(web crawler)程式,自動將網路上可搜尋得到的網頁備份下來。下圖就是網頁時光機對《蘋果》的備份紀錄。從 2017 年 10 月到 2021 年 6 月之間,光是首頁就被備份了 28.8 萬次。

但全球的網頁多如牛毛。即便是全自動的網路爬蟲程式,也很難詳細紀錄每個網站的一舉一動。與其被動等待爬蟲造訪,人們也可以主動要求網頁時光機備份自己的網站。

6 月 22 日停刊消息傳出後,《蘋果》首頁在一天內就被備份了超過 4 萬次。相當於每 2 秒備份一次。只不過,數位備份雖然方便搜尋,卻有法律爭議,也沒人能保證非營利組織 Internet Archive 能長久經營。

那麼紙本備份的工作呢?照理說公共圖書館理應忠實地留存紙本報紙,卻也在這波行動中「被消失」:

《港區國安法》實施近一年,康文署以覆檢書籍內容為由,過往將多本書籍下架。而《蘋果日報》停刊前發行的最後一份報紙,亦未見放在圖書館內的「昨日報紙」一欄中;其餘所有《蘋果》舊報章亦已下架。

中央圖書館的職員指暫未能借閱黎智英的著作,稱館藏要根據香港法例,而涉及黎智英的著作有機會干犯《港區國安法》,故書籍需全數收回後作覆檢,惟職員不清楚相關書籍確實下架時間。

看來若要完整還原香港《蘋果》,恐怕只剩下香港市民家中的紙本報紙了。每份報紙可說是市民「去中心化」的收藏,政府要完全銷毀並不容易。只不過紙本難以與他人共享,報紙也會隨著時間變質,難以保存。

所幸,有匿名網友在 6 月創立「dAppleDaily」,聲稱其任務是「decentralize Apple Daily(將蘋果日報去中心化) 」。計劃的首階段是透過網路爬蟲,將《蘋果》內容存放到永久、去中心儲存的 Arweave。

什麼是 Arweave?

去中心化儲存

Arweave 是去中心化的網路儲存協議(protocol),功能和 IPFS 相似。除了使用的加密貨幣不同之外,兩者最大差異在於 Arweave 只要一次性付費就能永久保存

Arweave 運用類似區塊鏈的技術 blockweave 確保存入的資料無法刪改。此外,Arweave 運用經濟誘因鼓勵人們幫忙保存資料,而且使用者只要一次性付費即可。

協議就是一組網路規則。例如網際網路(Internet)協議就是確保每個人都能找到自己要的東西,但又不會讓這些東西分崩離析的規則。而 Arweave 協議則是一套新的規則,確保人們上傳的資料都能夠被「礦工們」永久保存。

礦工將資料託管在他們的私人伺服器、節點上,或者共同成立「礦池」來存放資料並藉此獲得獎勵。Arweave 的最大創新之處在於採用全新的收費機制,讓用戶只要一次性付費就能永久性儲存。

下圖就是我將區塊勢網站存到 Arweave 的操作截圖。裡面顯示了我所備份的網址、大小(511 KB) ,備份所產生的一次性費用為 0.000279 AR 幣(約為 0.078 新台幣)。完成備份之後,就可以取得一組網址。理論上,內容永久不會消失。

只要經濟誘因設計得當,礦工獲得的獎勵收入持續地大於儲存資料的成本,就能確保 Arweave 上的內容總會存放在某些礦工的電腦裡。但許多人都好奇,一次性的支付費用該如何負擔永久的儲存成本呢?

答案是成本會下降、而錢會變大。一來一回之下,人們一次性支付的費用就足夠永久使用

資料的儲存成本逐年下降,這與人們的生活開銷會越來越貴不同。過去的 50 年中,資料的平均儲存成本下降了 30.5%。

Arweave 設計了一套系統(詳細機制請參閱 Arweave 黃皮書),將人們支付的費用先存入捐贈基金內,並透過該基金產生的利息來支付儲存成本。即使儲存成本在未來都沒有下降,這些一次性費用也足以讓資料存放 200 年。

這就是硬碟的共享經濟。人們貢獻多出來的電腦硬碟空間,除了賺得 AR 幣之外,也能保存歷史。

至於該將檔案切成幾份、如何加密才能確保資料隱私、存放在幾位礦工的電腦裡才能永久保存,得看 Arweave 的協議如何規範。這是技術的深水區,就不在這篇文章內深入討論。

只是光有儲存空間還不夠。dAppleDaily 還得自己開發網路爬蟲,主動地將《蘋果》的資料備份透過 Arweave 儲存到全球的礦工電腦裡才算是大功告成。這就同時兼顧了數位、去中心化的優點,讓資料永遠不會「被消失」。

技術上來說,未來 dAppleDaily 還可以將這些網頁相互連結,重新拼湊出《蘋果》的原貌。但《蘋果》停刊木已成舟,Arweave 的內容充其量也只能算是「數位標本」。

只是,Arweave 還能再更進一步,讓尚存的網路原生媒體避免「被消失」的命運。

網路的亞歷山大圖書館

兩千多年前,亞歷山大圖書館曾是世界上最大的圖書館,但後來卻因為戰爭、火災而被摧毀殆盡。根據《科技創業週報》:

根據文獻記載,亞歷山大圖書館興建於西元前三世紀的埃及港口,他們求知若渴,透過貿易、掠奪等方式蒐羅世界各地的文獻寶典,行經該港口的商船也得留下船中所有文件的手抄副本才能離去。但這座曾經擁有全世界藏書最多、最豐富的圖書館,卻在日後的戰爭中被摧毀。

紙本資料難逃祝融之災。2002 年,埃及政府在原址重建新亞歷山大圖書館,此外,館內還有一台特殊的機器—— The Espresso Book Machine —— 可以列印數位館藏,讓人們將紙本「副本」帶回家。

這顛覆以往紙本才是正本的觀念,改為將數位檔案視為正本,而列印出來的都是副本。

數位檔案保存成本低廉,也不會因為時間而損毀。這讓該圖書館保存的許多絕版、不適合外借的書籍,得以重新流通。若把時間拉長來看,千年之後真正流傳千古的恐怕不會是圖書館內的紙本館藏,而會是那些數位館藏。

《蘋果》停刊後,香港新聞界風聲鶴唳,泛民媒體人人自危。

以 2014 年成立的網路原生媒體《立場新聞》為例,就可以考慮直接將網站架設在 Arweave 這樣的去中心化儲存服務上。甚至在不久的將來,還能運用加密貨幣「藏富於民」,避免步入《蘋果》的後塵 —— 被銀行凍結資金。

有別於紙本報紙得仰賴公共圖書館完整保存,Arweave 可望成為香港新聞報導的「亞歷山大圖書館」。不僅內容由全球礦工共同保存,日後也還可以列印出紙本「副本」翻閱。

或許去中心化的資料儲存、金流交易以及編採團隊(DAO),能成為香港新聞媒體在《國安法》下的另一條出路。

Share

如果你喜歡這篇文章,歡迎週六午後到 OURSONG 購買 NFT 收藏。若想查閱區塊勢過往的出刊內容,可以參考文章列表。此外,也請大家推薦區塊勢給身邊的親朋好友。