134
gooseeker集搜客
大數據的問題01:醉漢路燈下找鑰匙
涉足數據行業已經有10年了,今天被一篇文章所深深吸引:深度|十個段子反思大數據 。《大數據帶來的八個(不,是九個!)問題》(Eight (No, Nine!) Problems With Big Data)不隻是標題黨的作品,所說的第九個問題很觸動我:其中文中的第九個問題,就是所謂的“大數據的炒作”。hype這個詞看你怎樣理解了,某某公司不是在持續發布一些“炒作周期圖”嗎?那是我們追新的風向標。但是,從負麵去想:10年來我做的事情的核心目標變化不大,怎麼忽然我寫的材料中都套上“大數據”這個詞,也卷入了這股洪流?不囉嗦那麼多,我們摘抄第一個大數據反思的故事,大家咀嚼回味一下。
醉漢路燈下找鑰匙——大數據的研究方法可笑嗎?
一天晚上,一個醉漢在路燈下不停地轉來轉去,警察就問他在找什麼。醉漢說,我的鑰匙丟了。於是,警察幫他一起找,結果路燈周圍找了幾遍都沒找到。於是警察就問,你確信你的鑰匙是丟到這兒嗎?醉漢說,不確信啊,我壓根就不知道我的鑰匙丟到哪兒。警察怒從心中來,問,那你到這裏來找什麼?醉漢振振有辭:因為隻有這裏有光線啊!
這個故事很簡單,看完這個故事,有人可能會感歎醉漢的“幼稚”、“可笑”。但不好笑的是,“烏鴉笑豬黑,自己不覺得”,這個故事也揭示了一個事實:在麵臨複雜問題時,我們的思維方式也常同這個醉漢所差無幾,同樣也是先在自己熟悉的範圍和領域內尋找答案,哪怕這個答案和自己的領域“相隔萬裏”!
還有人甚至認為,醉漢找鑰匙的行為,恰恰就是科學研究所遵循的哲學觀。前人的研究成果,恰是是後人研究的基石,也即這則故事中的“路燈”。到路燈下找鑰匙,雖看來有些荒唐,但也是“無奈之下”的明智之舉。
數據那麼大,價值密度那麼低,你也可以去分析,但從何分析起?首先想到的方法和工具,難道不是當下你最熟悉的?而你最熟悉的,就能確保它就是最好的嗎?
沃頓商學院著名教授、紐約時報最佳暢銷書作者喬納·伯傑(Jonah Berger)從另外一個角度,解讀這個故事:在這裏,浩瀚的黑夜就是如同全數據,“鑰匙”就好比是大數據分析中我們要找到的價值目標,他認為,“路燈”就好比我們要達到這個目標的測量“標尺”,如果這個標尺的導向有問題,順著這個標尺導引,想要找到心儀的“鑰匙”,是非常困難的!在我們癡迷於某項自己熟悉的特定測量標尺之前,一定要提前審視一下,這個測量標尺是否適合幫助我們找到那把“鑰匙”,如果不能,趕快換一盞“街燈”吧!
如果在黑暗中丟失的鑰匙,是大數據中的價值,那這個價值也太稀疏了吧。下麵的故事,讓我們聊聊大數據的價值。
全文:深度|十個段子反思大數據
最後更新:2017-01-09 14:08:08