閱讀606 返回首頁    go gooseeker集搜客


大數據的問題05:點球成金——數據流PK球探,誰更重要?

       上個故事《蓋洛普抽樣的成功——大小之爭》 展示了大數據和小數據的PK,誤差和偏差再次刺痛了我們大數據工作者的心。看今天的故事也許可以溫暖一下我們受傷的心,數據及數據分析和分析師PK,讓你找到勇士的感覺:數據分析隻是我手中的劍而已。


點球成金——數據流PK球探,誰更重要?


       《點球成金》(Moneyball)又是一例數據分析的經典故事:
       長期以來,美國職業棒球隊的教練們依賴慣例規則是,依據球員的“擊球率(Batting Average, AVG)”(其值等於安打數/打數),來挑選心儀的球員。而奧克蘭“運動家球隊”的總經理比利·比恩(Billy Beane)卻另辟新徑,采用上壘率指標(On-Base Percentage, OBP)來挑選球員,OBP代表一個球員能夠上壘而不是出局的能力。采用上壘率來選拔人才,並非毫無根據。通過精細的數學模型分析,比利·比恩 發現,高“上壘率”與比賽的勝負存在某種關聯(correlation),據此他提出了自己的獨到見解,即一個球員怎樣上壘並不重要,不管他是地滾球還是三跑壘,隻要結果是上壘就夠了。在廣泛的批評和質疑聲中,比恩通過自己的數據分析,創立了“賽伯計量學”(Saber metrics)。
       據此理論,比恩依據“高上壘率”選取了自己所需的球員,這些球員的身價遠不如其他知名球員,但比利·比恩卻能帶領這些球員在2002年的美國聯盟西部賽事中奪得冠軍,並取得了20場連勝的戰績。
       這個故事講得是數量化分析和預測對棒球運動的貢獻,吳甘沙先生認為,它在大數據背景下出現了傳播的誤區:
       第一,它頻繁出現在諸如舍恩伯格《大數據時代》之類的圖書中,其實這個案例並非大數據案例,而是早已存在的數據思維和方法。在“點球成金”案例中的數據,套用大數據的4V特征,基本上,無一符合。
       第二,《點球成金》無論是小說,還是拍出來的同名電影,都刻意或無意忽略了球探的作用。從讀者/觀眾的角度來看,奧克蘭“運動家球隊”的總經理比利·比恩完全運用了數據量化分析取代了球探。而事實上,在運用這些數據量化工具的同時,比恩也增加了球探的費用,“軍功章裏”有數據分析的一半,也有球探的一半。
       目前的大數據時代,就有這麼兩個流派,一派是技術主導派,他們提出“萬物皆數”,要麼數字化,要麼死亡(孫正義在對日本企業界的演講上所言),他們認為技術在決策中占有舉足輕重地作用。另一派是技術為輔派,他們認為,技術僅僅是為人服務的,屬於為人所用的眾多工具的一種,不可誇大其作用。
       針對《點球成金》這個案例,比利·比恩的擁躉者就屬於“數據流黨”,而更強調球探作用的則歸屬於“球探黨”。
       球探黨Bill Shanks在其所著的《球探的榮耀:論打造王者之師的最勇敢之路》(Scout’s Honor: The Bravest Way To Build A Winning Ball-team)中,對數據流黨的分析做出了強有力地回應。他認為,球探對運動員定性指標(如競爭性、抗壓力、意誌力,勤奮程度等)的衡量,是少數結構化數據(如上壘率等)指標無法量化刻畫的。
       和《點球成金》觀點針鋒相對的是,Bill Shanks更認可球探的作用,他把球探的作用命名為“勇士”哲學。對於勇士來說,數據分析隻是眾多“刀槍棍棒”兵刃中的一種,無需奉之如圭臬,真正能“攻城略地”的還是需要勇士。比如說,運動家棒球隊雖然在數據分析的指導下,獲得了震驚業界的好成績,然而他們並沒有取得季後賽的勝利,也沒有奪取世界冠軍,這說明,數據分析雖重要,但人的作用更重要!
       從第01故事的分析中,我們知道,大數據分析的第一層作用就是,麵向過去,發現潛藏在數據表麵之下的曆史規律或模式,也就是說達到描述性分析。而為了讓讀者相信數據分析的能力,灌輸一些“心靈雞湯(或稱洗腦)”,是少不了的,哪怕它是假的!
下個故事:大數據預測得準嗎?全文:深度|十個段子反思大數據

最後更新:2017-01-09 14:08:07

  上一篇:go 美國大數據產業地圖和數據科學家必備工具(2)-數據處理
  下一篇:go 生意參謀如何使用:競爭情報,快速找準競爭對手