閱讀283 返回首頁    go gooseeker集搜客


大數據的問題06:大數據預測得準嗎?

       這個係列故事全部是反思大數據,每個故事都會給大數據玩家一種刺痛感,上一篇《點球成金——數據流PK球探,誰更重要?》雖然也在說大數據失效的故事,但是明確人掌握大數據的分析師的價值和地位。今天這個故事觸及大數據核心目標——預測,看看大數據怎樣再次被“黑”的。

大數據都是騙人的啊——大數據預測得準嗎?
       從前,有一頭不在風口長大的豬。自打出生以來,就在豬圈這個世外桃源裏美滿地生活著。每天都有人時不時地扔進來一些好吃的東西,小豬覺得日子愜意極了!高興任性時,可在豬圈泥堆裏打滾耍潑。憂傷時,可趴在豬圈的護欄上,看夕陽西下,春去秋來,歲月不爭。“豬”生如此,夫複何求?根據過往數百天的大數據分析,小豬預測,未來的日子會一直這樣“波瀾不驚”地過下去,直到它從小豬長成肥豬……在春節前的一個下午,一次血腥的殺戮改變了豬的信念:尼瑪大數據都是騙人的啊……慘叫嘎然而止。


       這則“人造寓言”是由《MacTalk·人生元編程》一書作者 池建強 先生“杜撰”而成的。池先生估計是想用這個搞笑的小寓言“黑”一把大數據。
       我們知道,針對大數據分析,無非有兩個方麵的作用:     (1)麵向過去,發現潛藏在數據表麵之下的曆史規律或模式,稱之為描述性分析(Descriptive Analysis);     (2)麵向未來,對未來趨勢進行預測,稱之為預測性分析(Predictive Analysis)。把大數據分析的範圍從“已知”拓展 到了“未知”,從“過去” 走向 “將來”,這是大數據真正的生命力 和“靈魂” 所在。
       那頭“悲催”的豬,之所以發出“大數據都是騙人的啊”呐喊,是因為它得出了一個錯誤的“曆史規律”:根據以往的數據預測未來,它每天都會過著“飯來張口”的豬一般的生活。但是沒想到,會發生“黑天鵝事件”——春節的殺豬事件。
       黑天鵝事件(Black Swan Event) 通常是指,難以預測的但影響甚大的事件,一旦發生,便會引起整個局麵連鎖負麵反應甚至顛覆。讀者可閱讀納西姆·尼古拉斯·塔勒布(Nassim Nicholas Taleb)所著的暢銷書《黑天鵝》,來獲得對“黑天鵝事件”更多的理解。
       其實,我們不妨從另外一個角度來分析一下,這個搞笑的小寓言在“黑”大數據時,也有失敗的地方。通過閱讀知道,舍恩伯格教授在其著作《大數據時代》的第一個核心觀點就是:大數據即全數據(即n=All,這裏n為數據的大小),其旨在收集和分析與某事物相關的“全部”數據,而非僅分析“部分”數據。
       那頭小豬,僅僅著眼於分析它“從小到肥”成長數據——局部小數據,而忽略了“從肥到沒”的曆史數據。數據不全,結論自然會偏,預測就會不準。
       要不怎麼會有這樣的規律總結呢:“人怕出名,豬怕壯”。豬肥了,很容易先被抓來殺掉。這樣的“豬”血淚史,天天都上演的還少嗎?上麵的小寓言,其實是告訴我們:數據不全,不僅坑爹,還坑命啊!
       那麼,問題來了,大數據等於全數據(即n=All),能輕易做到嗎?要想知道答案,請閱讀《顛簸的街道——“n=All”隻是一個幻覺?》
下個故事:啤酒和尿布:經典故事是偽造的,你知道嗎?全文:深度|十個段子反思大數據

最後更新:2017-01-09 14:08:07

  上一篇:go 春節回家,大數據告訴你9件事
  下一篇:go 生意參謀如何使用:選詞助手,快速引流