閱讀608 返回首頁    go 阿裏雲 go 技術社區[雲棲]


奧巴馬競選幕後CTO詮釋真正的大數據

他說,他最早在2007年接觸到“大數據”這個詞,當時是指一種存儲方麵的難題。“我們在2007年使用這個詞,當時是指數據難以保存。當時做大數據的人做得很好。”但是並非每個人都做得很好,知道如何做,或者有這麼做的工具。6年之後,像Hadoop和Hbase意味著保存和準備大量的數據用於分析,這些不再是複雜的難題,但是“大數據”這個詞依然存在。

Reed更希望“大數據”這個詞沒有得到如此廣泛的使用,因為他認為很多考慮對大數據進行投資的人,可能並沒有足夠多的數據能稱得上大數據。

作為奧巴馬2012年競選的首席數據科學家,Rayid Ghani表示認同Reed的觀點。他透露說,他個人在國內存儲的數據比競選中使用的數據更多。

所以Reed認為,這次CeBIT大會的參會者中,少有人的數據量可以真正稱之為“大”。

他說:“你可能會中等量的數據。”他認為大數據這個詞現在更多地代表著分析工具,而非數據本身。

即使是“大”數據或者“中量”的數據包含的個人信息,Ghani表示,分析過程也可能並沒有用之來得出有價值的東西。

他說:“比如,你開什麼樣的車,這種數據信息在競選中是沒什麼用處的。我們並不使用這種私人數據。”他表示,比較有用處的是簡單的數據點,例如對 “你支持總統嗎?”這種問題的回答。對問題的回答,以及個人是否曾經參加過競選,奧巴馬的團隊利用這些信息可以識別出哪些人是值得他們關注的。

Reed還提醒25歲以上的人們不要對隱私問題感到恐慌。年齡稍大一些的人會對像Facebook挖掘用戶信息這樣的事耿耿於懷,而年輕人則對使用服務的隱私控製比較了解。他說,年齡稍大的人並不會費心去了解關於隱私控製的事情,因此他們對自己隱私的擔憂是普遍存在的。“不要將我們自己的恐懼投射給別人。”

最後更新:2017-04-03 18:52:06

  上一篇:go 為什麼程序員總被認為是屌絲群體?
  下一篇:go 失業的程序員