Lentis/"資料是新的石油"
"資料是新的石油!"是資料科學家克萊夫·漢比於2006年在國家廣告主協會會議上發表的演講的標題。在他的演講中,漢比聲稱,原始資料必須像原油一樣經過提煉才能具有價值。[1] 從那時起,這句話開始廣泛流傳,用來闡明資料和石油之間無數其他的相似之處。正如19世紀末和20世紀初的第二次工業革命由石油推動一樣,如今的數字革命正在由資料驅動。
克萊夫·漢比最初使用這個類比來證明,資料和石油的原始形式在成為可銷售產品之前需要一些中間處理步驟。就像幾乎總是擁有自己煉油廠的寡頭石油公司一樣,寡頭資料公司也經常進行自己的內部資料處理。這些寡頭資料公司應該被稱為資料驅動型公司,因為它們完全依賴其處理過的資料來獲取收入。

與石油行業一樣,資料收集行業也僅限於少數幾家控制整個市場的大型跨國公司。無數較小的公司以某種方式為資料/石油的宏觀供應鏈運營做出貢獻,但大型公司在市場份額和整體社會技術影響方面主導著經濟。石油行業中這些大型公司的例子包括埃克森美孚、雪佛龍、英國石油公司和殼牌石油,資料行業中其類似公司的例子包括亞馬遜、谷歌、Facebook和YouTube。世界上第一位億萬富翁[2]約翰·D·洛克菲勒是標準石油公司(該公司最終被拆分為埃克森美孚和雪佛龍等公司)的執行長,世界上第一位千億富翁[3]傑夫·P·貝佐斯是亞馬遜的執行長(目前是世界上最大的資料驅動型電子商務平臺)。這兩個行業在財富和權力方面存在的相似之處是顯而易見的。
這些公司的商業模式是從其消費者那裡收集資料,並利用這些資料指導內部決策,透過更好地將產品定位到個別消費者的偏好來提高銷售額。這種商業模式的新變體伴隨著網際網路的出現,這使得可以將廣告作為唯一的收入來源。作為交換使用者資料,資料驅動型公司可以免費向用戶提供其服務。

這些公司幾乎完全透過收集和出售資料給第三方公司和實體來獲利。他們通常透過購買資料、挖掘公共記錄和/或建立收集使用者資料的應用程式來收集資料。主要有三種類型:1) 建立線上市場,個人使用者可以在其中付費獲取有關其他個人的資訊(例如,PeopleFinders、白頁);2) 向將資料用於營銷決策的實體出售資料(例如,Acxiom和劍橋分析);以及3) 向使用資料進行風險緩解和身份驗證的實體出售資料(例如,ID Analytics)。[4]
漏油會造成持久損害,尤其是在海洋生態系統方面,並且通常會導致環保人士的強烈反對以及公眾對石油公司的信任度下降。[5] 美國的一些著名例子包括1989年的埃克森·瓦爾迪茲號漏油事件和2010年的深水地平線漏油事件。與這些漏油事件類似,資料洩露會導致隱私倡導者的強烈反對以及公眾對收集消費者資料的公司的信任度下降。[6]
無數的資料洩露導致了消費者個人資料的非自願釋出。洩露的原因包括駭客攻擊、意外上傳和故意洩露。洩露影響到私營和公共部門,涵蓋了從電子病歷到位置資料再到社交網站上的好友列表等廣泛的資料集。
劍橋大學的研究員亞歷山大·科根聲稱正在進行研究,並獲得了Facebook的批准,在其平臺上釋出了一款數千名Facebook使用者安裝的性格測試問卷。多達8700萬Facebook使用者的個人資料被洩露給了劍橋分析公司(Cambridge Analytica),這是一家被唐納德·特朗普2016年總統競選團隊僱用的政治資料經紀公司。[7][8] Facebook的“服務條款”允許研究人員將資料用於學術目的。但是,出售資料是被禁止的。[9] 有人認為,此醜聞應該促使研究人員更加謹慎地處理個人資料的傳播。慈善原則規定,研究人員應將參與者的福祉置於首位。[10]
LocationSmart是一家與美國無線運營商合作銷售使用者位置資料的公司。[11] 直到2018年,任何LocationSmart使用者都可以找到美國任何手機的即時位置。一名匿名駭客還入侵了LocationSmart客戶Securus的網站,並訪問了機密的執法資訊。[12]
在美國,國內海上石油鑽探和石油管道運輸受環境保護署(EPA)的監管。類似於石油洩漏事件引發公眾對加強石油公司監管的強烈呼聲,過去二十年中的資料洩露事件也成為資料隱私法規萌芽的推動力。
加州消費者隱私法案最初於2018年6月由前州長傑裡·布朗簽署透過。[13] 該法律的主要原則規定,加州居民現在有權:1)訪問收集其資料的記錄;2)拒絕收集其資料;3)刪除其資料。[14] 該法律是消費者資料保護方面首批全面的州級立法之一。
類似於阿拉斯加州居民因其州內石油鑽探而獲得永久基金紅利,一些加州官員(例如加文·紐瑟姆、安德魯·楊)提議加州居民因其線上資料的利用/出售而獲得紅利。[15][16] 許多人認為這項提議不切實際。前Facebook高管安東尼奧·馬丁內斯認為,亞馬遜、谷歌和Facebook不認為他們欠消費者任何東西,因為他們免費提供服務,以換取可用於產生廣告收入的使用者資料。[17]
通用資料保護條例是歐盟法律,於2016年4月透過。與加州的CCPA類似,它要求在資料收集方面保持透明度,並側重於使用者對其資料的控制權。它被視為全球資料保護政策中的典範法律。[18] 電子隱私資訊中心(EPIC)是一個數據隱私監督機構,它認為美國需要一部類似於GDPR的法律或一個監管機構(例如資料保護局)。[19]
資料和石油每天都會影響數十億人的生活。如果不首先考慮其社會影響,就無法理解其技術影響。
石油和資料一直是人類寶貴的資源。數千年來,人們一直在收集貿易和收穫資料。最早利用大資料極大地改善人類生活的例子之一是1663年,當時約翰·格蘭特利用死亡率資料預測即將爆發的鼠疫。[20] 政府一直透過人口普查收集和利用資料,以便正確分配資金並幫助確保民主。[21] 企業意識到如何利用收集到的資料來提高效率和客戶體驗,克萊夫·漢比的諮詢公司鄧恩漢比和英國雜貨商樂購是其中一些開創性的公司。在21世紀,一旦資料的價值變得顯而易見,資料業務便迅速發展。與資料收集一樣,石油的使用也歷史悠久,可以追溯到蘇美爾人嘗試生火的時候。現代石油使用始於19世紀50年代中期,當時在美國發現了大量石油。[22] 石油的用途最初是作為光源和熱源,但後來發展到為交通運輸和經濟革命提供動力。該行業的公司因此變得非常富有。[23]

在大多數國家,以石油為燃料的汽車是主要的交通工具。現代經濟,特別是隨著電子商務的興起,依賴於航運業,因此也依賴於汽車。許多塑膠都是石油基的,塑膠是包裝和零售的核心。如今,我們的社會依賴於石油,有些人認為這種依賴關係將會持續下去,[24] 但一種新的依賴關係可能正在出現:資料。根據Google的Ngram Viewer,短語“資料科學”在20世紀初開始進入日常用語。[25] 內部資料幫助公司最佳化供應鏈運營,而消費者資料則幫助公司做出決策以改善客戶體驗。換句話說,資料收集並不總是負面的或侵犯隱私的。儘管人們對可接受的資料收集實踐有各種各樣的看法,但資料收集是我們數字經濟的核心。
我們可以推測,資料收集與網際網路的興起同時出現,因為人們注意到大約在 1990 年,“資料科學”的 Ngram 曲線急劇上升。[25] 人們可能會假設這是網際網路簡化資料收集的結果。現在,只需點選一個按鈕,就可以跨不同地點、社會經濟階層和文化收集資料。比以往任何時候都更多樣的社會群體的資料得到了體現;資料可能充當偉大的平等化因素。類似地,廉價的石油和煉油方法使更多的人能夠駕駛汽車。
總體而言,資料與石油既有相似之處,也有不同之處,但“資料是新的石油”這句話本身具有社會影響。它傳達了資料在數字時代的力量和獲利能力。它也讓人想起石油動盪的歷史,這或許是恰當的,因為我們目前正在努力應對資料收集帶來的隱私威脅。這句話告訴我們,語言具有力量,因為這句話本身就存在反對者和信徒。我們還見證了新興技術,特別是像網際網路和大規模資料收集這樣的顛覆性技術,引發了許多未解的經濟、監管和倫理問題。資料科學仍處於起步階段,但我們已經看到了資料對我們現代世界產生的巨大影響。
- ↑ Humby, C.; Palmer, M. (2006 年 11 月 3 日)。資料是新的石油。 https://ana.blogs.com/maestros/2006/11/data_is_the_new.html(2019 年 12 月 9 日訪問)。
- ↑ Simpson, S. (2019 年 11 月 9 日)。誰將成為世界上第一個萬億美元富翁?。 https://www.investopedia.com/financial-edge/0211/the-first-trillionaire.aspx(2019 年 12 月 9 日訪問)。
- ↑ Au-Yeung, A. (2019 年 10 月 24 日)。亞馬遜股價暴跌後,傑夫·貝佐斯不再是世界上最富有的人。 https://www.forbes.com/sites/angelauyeung/2019/10/24/jeff-bezos-is-no-longer-the-richest-person-in-the-world/#4dfb029b67ae(2019 年 12 月 9 日訪問)。
- ↑ Pasternack, A.; & Meldenez, S. (2019 年 5 月 28 日)。以下是正在秘密買賣您個人資訊的那些資料經紀人。 https://www.fastcompany.com/90310803/here-are-the-data-brokers-quietly-buying-and-selling-your-personal-information(2019 年 12 月 2 日訪問)。
- ↑ Walsh, B. (2010 年 7 月 7 日)。漏油事件和失去信任的危險。 http://science.time.com/2010/07/07/the-oil-spill-and-the-perils-of-losing-trust/(2019 年 12 月 10 日訪問)。
- ↑ Weisbaum, H. (2018 年 4 月 18 日)。劍橋分析醜聞發生後,Facebook 的信任度下降了 66%。 https://www.nbcnews.com/business/consumer/trust-facebook-has-dropped-51-percent-cambridge-analytica-scandal-n867011(2019 年 12 月 9 日訪問)。
- ↑ Meyer, R. (2018 年 10 月 26 日)。劍橋分析醜聞,用三個簡短的段落概括。 https://www.theatlantic.com/technology/archive/2018/03/the-cambridge-analytica-scandal-in-three-paragraphs/556046/(2019 年 11 月 30 日訪問)。
- ↑ Granville, K. (2018 年 3 月 19 日)。Facebook 和劍橋分析:隨著餘波擴大,你需要了解什麼。 https://www.nytimes.com/2018/03/19/technology/facebook-cambridge-analytica-explained.html(2019 年 11 月 30 日訪問)。
- ↑ 服務條款是什麼:你需要了解的一切。(不詳)。 https://www.upcounsel.com/what-are-terms-of-service(2019 年 11 月 30 日訪問)。
- ↑ 自然出版集團社論。(2018 年 3 月 27 日)。劍橋分析爭議必須促使研究人員更新資料倫理。 https://www.nature.com/articles/d41586-018-03856-4(2019 年 12 月 10 日訪問)。
- ↑ Oremus, W. (2018 年 5 月 21 日)。隱私醜聞應該比劍橋分析更大。 https://slate.com/technology/2018/05/the-locationsmart-scandal-is-bigger-than-cambridge-analytica-heres-why-no-one-is-talking-about-it.html(2019 年 11 月 30 日訪問)。
- ↑ 沒有人談論的關鍵安全危機。(2018 年 5 月 22 日)。 https://nordvpn.com/blog/securus-locationsmart-phone-tracking/(2019 年 11 月 30 日訪問)。
- ↑ 加利福尼亞州議會。(2018 年)。2018 年加利福尼亞州消費者隱私法案。 https://leginfo.legislature.ca.gov/faces/billTextClient.xhtml?bill_id=201720180AB375(2019 年 11 月 28 日訪問)。
- ↑ 加利福尼亞消費者隱私倡導者。(2019 年)。關於加利福尼亞州消費者隱私法案。 https://www.caprivacy.org/about(2019 年 11 月 28 日訪問)。
- ↑ Clifford, C. (2019)。安德魯·楊:你應該從 Facebook、亞馬遜、谷歌那裡收到一封關於你資料的支票。 https://www.cnbc.com/2019/10/17/andrew-yang-facebook-amazon-google-should-pay-for-users-data.html(2019 年 11 月 28 日訪問)。
- ↑ Daniels, J. (2019)。加州州長提議“新的資料紅利”,可能要求 Facebook 和 Google 向用戶支付費用。 https://www.cnbc.com/2019/02/12/california-gov-newsom-calls-for-new-data-dividend-for-consumers.html(2019 年 11 月 28 日訪問)。
- ↑ Martínez, A. (2019)。不,資料不是新的石油。 https://www.wired.com/story/no-data-is-not-the-new-oil/(2019 年 11 月 28 日訪問)。
- ↑ 歐盟。(2016 年)。通用資料保護條例(GDPR)。 https://gdpr-info.eu/(2019 年 11 月 28 日訪問)。
- ↑ EPIC。(2019 年)。資料保護機構。 https://epic.org/dpa/(2019 年 12 月 9 日訪問)。
- ↑ Morabia, A. (2013)。流行病學 350 週年紀念:1662-2012。流行病學(馬薩諸塞州劍橋),24(2),179-183。doi:10.1097/EDE.0b013e31827b5359
- ↑ Barazesh, S. (2019 年 7 月 7 日)。探究問題:為什麼人口普查很重要?賓夕法尼亞州立大學新聞。 https://news.psu.edu/story/141197/2009/07/27/research/probing-question-why-census-important
- ↑ 商業和研究經濟顧問。(2006 年)。石油和天然氣行業。 https://www.loc.gov/rr/business/BERA/issue5/history.html。
- ↑ History.com 編輯。(2010 年 4 月 8 日)。石油工業。 https://www.history.com/topics/industrial-revolution/oil-industry。
- ↑ Clemente, J. (2015)。石油將繼續主宰世界的三個原因。 https://www.forbes.com/sites/judeclemente/2015/04/19/three-reasons-oil-will-continue-to-run-the-world/#793fb55843f9(2019 年 12 月 9 日訪問)。
- ↑ a b Google 圖書 Ngram 檢視。資料科學。 https://books.google.com/ngrams/graph?content=data+science&year_start=1800&year_end=2000&corpus=15&smoothing=3&share=&direct_url=t1%3B%2Cdata%20science%3B%2Cc0#t1%3B%2Cdata%20science%3B%2Cc0(2019 年 12 月 9 日訪問)。