過快、過量、過度:三類數據驅動型決策中的常見問題(附大量資源)
在大數據的時代,很多公司通過采用數據驅動方式進行決策。在本文中我想談一下我們在數據分析過程中三種常見失誤:過快--急於求成、過量--圖圇吞棗、過度--信息過載。
(注:本文附大量外鏈資料,建議先收藏再查看)
◆ ◆ ◆
過快:急於求成
還沒找到實際問題就提出解決方案
不要擔心在定位問題上花費太多時間。關於越早開始行動,越能提前完成項目的理論不一定正確,如果未能充分理解關鍵問題可能會浪費更多時間。無論你是在思考一個新的產品特性,對公司未來發展方向的戰略決策,建立機器學習模型,還是給你的同事寫郵件,都要確保你有花時間去了解項目的真正需求,而不是浪費了大量時間和精力後才發現方向錯了。
別忘了,你所要解決問題的類型決定了對應的解決辦法。比如在數據科學領域,建立模型前必須要了解該模型是為了加強調用(你的模型在多大程度上可以反饋特定數據),還是加強準確性(在所有正向預測中,有多少是準確的)。從最初開始定位項目目標有助於增強模型的準確性,降低漏報(針對調用)及報錯(針對準確性)發生的可能性。
《哈佛商業評論》一篇相關文章推薦了以下方法幫助你解決真正問題
(相關鏈接:https://hbr.org/2012/09/are-you-solving-the-right-problem)
第一步:設定解決方案的需求
第二步:調整該需求
第三步:將問題情境化處理
第四步:寫下問題陳述
另一個著名方法是MBA項目教授的“五問法”,一種由豐田集團開發的問題解決技巧,有助於通過重複拷問“為什麼”來觸及問題的根源。
(相關鏈接:https://en.wikipedia.org/wiki/5_Whys)
◆ ◆ ◆
過量:圖圇吞棗
對於重要的和無關緊要的指標不做區分
生活在大數據時代,我們能通過大量工具追蹤各類用戶活動,擁有各種指標來定義每一個用戶的行動。然而有多少指標是真正有用的?你能夠通過觀測這些指標來得出可行的方案麼?
重要的是質量而非數量。比起追蹤全部的數據,不如試著找出那些真正能夠衡量產品健康程度並加以改善的關鍵績效指標(KPI)。根據商業模式,公司目標和產品生命周期,決定哪些KPI是你需要關注的重點。
我推薦大家了解下Dave McClure的演講,他將項目開發的指標分成了五類:
用戶獲取
用戶激活
用戶留存
用戶推薦
收益增加
(相關鏈接:https://www.slideshare.net/dmc500hats/startup-metrics-for-pirates-long-version/2-Customer_Lifecycle_5_Steps_to)
大數據文摘後台回複“常見問題”下載Dave McClure的相關演講ppt
另一個知名的極簡方法是《精益數據分析》(Lean Analytics)中提到找到“第一關鍵指標”(詳見下方鏈接)。
https://growthhackers.com/videos/video-lean-analytics-one-metric-that-matters-omtm/
◆ ◆ ◆
過度:信息過載
試圖發現根本不存在的模式
因為我們的直覺並不總是對的,而數據有時令人驚訝,盡管我們一直在尋求通過數據驅動進行決策,應用常識也很重要。要記住,模型世界並不是世界本身。你的模型存在假設和局限性,有時這些會將你引入歧途。不管模型告訴你什麼,無論是肯定了你的預測還是告訴你特殊結果,你都要用自己的判斷力,思考預測正確的概率以及信號的強烈程度。
有時候被發現的並不是“真相”。我們可能沒有意識到,自己自己有時在無意識的尋找不存在的信號。通過了解行業的更多方麵,競爭格局,宏觀經濟因素,周期性影響和其他因素有助於更準確的設定增長目標並依據數據得出科學的結論。例如,某些參與指標的下降不一定是消極型號,可能隻是周期性影響,客戶投訴的增加可以是一個健康增長的跡象,因為它體現了用戶基數的上升。
“相關性不一定是因果關係”在統計學中,這用來強調兩個變量之間的相關性並不意味著一個因素會影響另一個。有時人們閱讀博客是為了優化他們的數據驅動決策,有時事情就這麼發生了。:-)
原文發布時間為:2016-11-28
本文來自雲棲社區合作夥伴“大數據文摘”,了解相關信息可以關注“BigDataDigest”微信公眾號
最後更新:2017-05-31 11:04:57
上一篇:
RHEL (Red Hat Enterprise Linux,紅帽企業級 Linux) 7.3 安裝指南
下一篇:
NASA重金懸賞 太空尿片最佳解決方案
LCS (Longest Common Subsequence) 字符串最長公共子串算法
Java 25天基礎-DAY 05-麵向對象-構造函數
VC++獲取網卡MAC、硬盤序列號、CPU ID、BIOS編號
史上十大最昂貴筆記本電腦:最高售價100萬美元
ant命令征集詳解
Mutex和內存可見性
Tomcat啟動報錯:java.lang.IllegalArgumentException: Can't convert argument:null
PPT超鏈接字體顏色修改方法
Linux OS||Services不響應SYN總結
MSSQL · 最佳實踐 · SQL Server三種常見備份