數據即勞務:自動化時代的被動收入,讓數據替你工作

#212

當機器人、人工智慧越來越強大,許多工作逐漸自動化,未來人們靠什麼賺錢維生?這就是本文要討論的主題 —— 自動化時代的被動收入。

數據即勞動(data as labor)是最近剛出版的新書《激進市場》(Radical Markets)提倡的重要概念。作者 Glen Weyl 是微軟研究院首席研究員,他與芝加哥大學法學院教授 Eric Posner 在書中提出五個改變社會制度模式的提案。

這本書不僅受到以太坊創辦人 Vitalik Buterin 及數位政委唐鳳推崇,還被《經濟學人》雜誌列為年度選書之一。之前我曾分別介紹過書中提出的新型態民主治理模式 —— 平方投票法(Quadratic Voting),我將它稱為票票不等值的公平投票。以及後續衍生的新型態群眾募資機制 —— 平方募資法(Quadratic Funding),它能打破 80/20 法則,讓人多比錢多更重要。

每項提案肯定都會讓你耳目一新,今天先從如何「讓數據替你工作」開始。

訂閱區塊勢

數據是 21 世紀的石油

你聽過「數據是 21 世紀的石油」嗎?過去我們會說盛產石油的中東國家是「富得流油」,但《經濟學人》在 2017 年便指出,世界上最寶貴的資源,將不再是天然的石油,而是人們產生的數據。

在企業眼中,每個人都是一片小油田。人們會不斷產生數據,就像是油田會持續冒出石油一樣。企業們為了搶奪這些「天然資源」,紛紛建立自己的鑽油平台,例如 Google 或臉書。企業之間還會相互競爭,看誰能從使用者身上挖出最多天然資源,誰就能「富得流油」,或應該改稱「富得流數據」。

但若從個人的角度思考,就會發現把數據視為石油並不合理。以你我注意力所產生的數據,怎麼忽然都變成免費的天然資源,任由大企業開挖,挖到都算他們的?近幾年越來越多人意識到注意力有價也有限,用戶產生的數據不應該被視為免費的天然資源,而應該被視為用戶的勞動產出。

企業若要取得用戶數據打造新服務,就得像是聘雇員工一樣支付薪水。在雙方合意的情況下,企業才能拿到更高品質的數據,而用戶也能透過授權賺取收入。這就是《基進市場》這本書提倡的重要概念 —— 數據即勞動(data as labor)

讓數據替你工作

馬上有人會說:「勞動可以罷工爭取權益,但現在數據都在企業手上,企業怎麼可能付錢?」

這可以從正反兩面來看,先從前者說起,現在已經有人願意為數據付錢。根據 WIRED 報導

史丹佛大學的眼科醫師 Robert Chang 幾年前投入人工智慧研究,透過眼部成像來追蹤青光眼等疾病的發展。只要有足夠的數據,他就能更精確的掌握疾病的樣態。但他手邊用來訓練 AI 的數據不足,因此他去請求捐贈中心以及其他大學研究學者一起合作。卻發現若他要使用這些共享資料,就得遵循複雜的使用規範,幾乎是在向人們「乞討」數據。

後來他找到另一位教授 Dawn Song 合作,他們是付費向用戶取得數據授權。患者的數據都是放在基於區塊鏈所建立的資料庫內,其設計使得研究人員在看不到數據的前提下,依然可以使用數據來訓練人工智慧。且為了鼓勵患者參與,研究者在使用患者數據時給予患者報酬。

我從這段報導看到兩大重點:

  1. 數據普遍缺乏技術加密及法律保護,因此數據的供需雙方難以建立平等的交易關係。

  2. 在缺乏數據交易模式的前提下,數據往往只能被(企業)強佔或是等待(用戶)捐贈。

學術單位用來訓練 AI 的數據,算是天然資源還是人們的勞動產出?

學術研究對於資料取得較為謹慎。但現況是,研究人員即便有經費也買不到資料。沒有一套平等且透明的數據交易機制,就只能仰賴複雜的捐贈流程,所取得的資料往往還附上許多但書,導致研究窒礙難行。因此,建立健康的數據交易關係,對供需雙方都有利。從學術領域開始會是個不錯的起點。

在非學術領域則遇上另一個問題,相信你已經猜到了。我們有許多數據是直接在企業的平台上產生,這些平台卻未必有嚴謹的數據授權制度。最近 Netflix 上的熱門紀錄片《個資風暴:劍橋分析事件》就是敘述「劍橋分析」這家公司,如何以不正當的方法取得大量臉書用戶資料,在包含台灣在內的多個國家「實驗」操縱特定議題。最終這些資料還被運用在英國脫歐、美國總統大選的兩大戰場。

即便只是一張照片,所包含的訊息也已經非常豐富。下方是我上傳到臉書的照片,只要在照片上點擊右鍵,並選擇「檢查」,就能看到臉書對照片自動產生的敘述:「圖像裡可能有 2 個人、包括葛如鈞、微笑的人、大家站著和眼鏡。」臉書將用戶上傳的圖片轉成文字,便於數據分析,而用戶等於是提供素材讓臉書訓練人工智慧。

今年初全球掀起的「10 年挑戰」風潮,也為臉書提供豐富的素材。根據天下雜誌報導

如果這幾天有刷臉書,你應該複習了許多朋友們 10 年前後的長相。臉書又成功地炒熱了一波風潮,但這背後有特別的用意嗎?

紐約大學史騰商學院(Stern School of Business)教授韋伯說,這個所謂的 10 年挑戰為臉書掀起了「機器學習的完美風暴」。這個活動讓臉書可以訓練演算法去識別使用者臉上的細微改變。10 年前,你可能真的還沒開始上傳照片到臉書。現在你則是幫臉書把新照、舊照併排整理好,再自己用標籤 #10yearchallenge 通知臉書。

雖然臉書稱這是社群自主發起的活動,但不可否認的是,臉書除了能運用這些資料調整演算法,還能進一步打造足以影響你我選擇的新工具。我們所上傳的資料能夠幫臉書訓練人工智慧,這算天然資源還是用戶的勞動產出?

去年正式上路的歐盟個資法(GDPR)便是以法律保障歐盟用戶對數據的掌控權。這就和企業稱數據是天然資源的說法相互衝突,企業頂多只能說這些數據是用戶自願交出來的「使用費」,但很難再主張這些數據先天就是企業所有。

技術還能再進一步補足法律上的模糊地帶。畢竟,只要數據仍然掌握在企業手中,就很難建立供需雙方平等的交易關係。因此越來越多人開始思考如何將數據加密,由自己掌握資料的控制權(鑰匙),只有獲得用戶授權的對象才能使用。例如 Maskbook 這款瀏覽器的擴充功能,就可以讓用戶先將貼文的內容加密再上傳到臉書,只有被授權的對象才能解碼看到內容原文。臉書發現自己什麼也看不到,乾脆直接剝奪用戶分享 Maskbook 的權利

這就與區塊鏈的概念非常相似。在區塊鏈世界裡,所有的資產使用都得透過私鑰授權,且當事人是私鑰的唯一保管者。區塊鏈讓資金運用的權力從中心化機構回到個別用戶手上,也可以用讓管理數據的權力回到個人手上。

任何人都可以透過加密將數據「歸戶」,掌握在自己手裡,再透過逐項授權讓數據替你工作。若資料可以賺錢,這就能回答文章一開頭我提出的問題:「若機器人、人工智慧逐漸將許多工作自動化,人們未來得靠什麼賺取收入呢?」

自動化時代的「被動收入」

上班都在上網卻還能賺錢,是生活在工業時代的人們做夢也想不到的職業,甚至會覺得這個人根本就是在賺「被動收入」。但現在我們都知道,這個人很可能是公司最重要的對外溝通窗口 —— 社群編輯。

同樣的,現在我們可能會覺得在社群網站貼文、逛網拍購物或看 YouTube 影片是娛樂消遣,但每一個動作確實都在產生新的數據。若未來有人宣稱自己每天就是靠著生產個人數據賺錢,其實一點也不奇怪。數據生產者可能變成一份全新的職業,專門替不同企業生產高品質數據。

賣玩具的公司想知道小學生都在看哪些影片、籌備選戰的政黨想知道不同族群在看哪些新聞。當人們能夠把數據「鎖起來」,企業必須向個別用戶取得授權才能使用時,或許小朋友在滑手機的時候,也是在替自己賺奶粉錢。

光是讓用戶取回數據掌控權,就能讓未來變得完全不同。從個人的角度來說,未來人們或許不用擔心工作被 AI 所取代,畢竟 AI 所需要的數據得回頭來跟你買。從企業的角度來說,個別用戶不可能逐一管理數據的授權。因此,未來可能會產生新的數據代理商,替人們處理數據的授權作業。人們可以根據獲利與隱私,選擇不同方案或代理商。從社會的角度來說,當有越來越多工作陸續自動化,人們只要專心的做「人」才能做的事,就能獲得基本收入了,這說不定真能成為全民基本收入(Universal Basic Income)的新解方。


謝謝你留下 email 成為區塊勢的免費讀者。多數媒體主要獲利來源是廣告,而相關廠商往往就是廣告主,這不利於媒體揭露真相。區塊勢採訂閱制,不會為廠商擦脂抹粉,也沒必要刻意抹黑,只會專心服務支持區塊勢的讀者。正是因為有你們的支持,我才能獨立作業。

訂閱區塊勢