《數據分析實戰:基於EXCEL和SPSS係列工具的實踐》一1.4 數據分析的流程
本節書摘來異步社區《數據分析實戰:基於EXCEL和SPSS係列工具的實踐》一書中的第1章 ,第1.4節,紀賀元 著 更多章節內容可以訪問雲棲社區“異步社區”公眾號查看。
1.4 數據分析的流程
數據分析一般有數據采集、數據整理、製表、數據分析、數據呈現等多個階段。當然,不是說每一個數據分析的過程都需要這些階段,有的企業數據質量非常好,自然就不需要數據采集過程了;也有些數據分析並不怎麼需要呈現過程。不過,為了方便讀者理解,下麵將介紹一個完整的流程。
1.4.1 數據采集
數據采集指為了保證數據分析能夠順利展開而進行的數據采集工作。數據采集工作的難度、跨度非常大,有的采集工作非常簡單,僅僅是幾個簡單的郵件、電話,就能夠完成數據的采集工作;有的數據采集工作則非常痛苦,甚至經常會出現采集不到數據的情況。
數據采集的難度一般表現在如下幾個方麵。
(1)數據根本就不存在
由於企業缺乏數據規劃或者現場人員疏漏等原因,在采集數據的過程中,經常發現數據根本就不存在。
(2)數據過粗
如1.1.3節所述,企業經常在數據記錄的顆粒度方麵出問題,例如根據某企業的規定,項目的成本數據應該按照“天”為單位來記錄,但是我們最後發現成本記錄的單位是“月”,這中間的差別非常大。
(3)數據質量低下
數據的錯誤、對不上、缺漏等情況普遍存在,曾經有一個項目合作方對我說,如果嚴格校對數據質量,我們的數據可以刪除70%。試想想,在30%的比較“靠譜”的數據上做分析,得出的結論是否靠譜?
(4)人為原因導致數據采集困難
一些人為原因也會導致數據采集的困難,包括部門之間的隔閡、人際關係等因素。
1.4.2 數據整理
但凡是做過數據分析的人都知道,數據整理是一個痛苦而且複雜的過程,很多數據拿到手之後,並不能馬上做處理,而是要經過一個轉換過程,請看圖1-4所示的一個需要整理的數據案例。
從圖1-4可以看出,A列的數據都是合並單元格格式,如果要對以上的數據進行透視表分析,需要進行如下的操作。
(1) 取消合並單元格
選中A列,點擊EXCEL中的“開始”→“合並後居中”,取消合並單元格之後的數據效果如圖1-5所示。
(2) 填充空白單元格
按F5鍵,點擊“定位條件”,如圖1-6所示。
在彈出的界麵中選擇“空值”,如圖1-7所示。
這時工作表中的空白都被選中了,效果如圖1-8所示。
在公式欄中輸入“=A2”,也就是讓每一個單元格都等於上一個單元格的值,然後按“Ctrl+Enter”組合鍵,空白處都填充好了。填充後的效果如圖1-9所示。
以上隻是一個小小的例子,我們在進行數據處理的時候,都要先進行各種數據整理。甚至有時數據整理的時間會占據數據分析時長的70%以上。
1.4.3 製表
製表是日常工作的重要組成部分,也是數據分析的重要組成部分。實際上不少企業已經把企業管理工作貫穿到報表的實現當中,通過一張張精心設計的報表,管理人員可以迅速了解企業的采購、生產、銷售、售後、財務、人事、安全等相關信息。
企業常見的報表包括如下類型。
采購報表:反映企業各部門的需求,供應商供貨品類、價格等狀況,采購項目進展狀況等;
生產報表:包括產量表、成本表、人力消耗表、設備故障表、安全質量表等;
財務報表:包括銷售輸入管理、成本管控表、量本利分析表、流動資產管理表、負債管理表、投資項目決策表、財務預測表等;
售後報表:包括樣品跟蹤表、設備狀況跟蹤、客戶滿意度跟蹤、投訴建議表等;
人事報表:包括人員狀況、薪資福利、人員雇傭離職表等多個報表。
1.4.4 數據分析
數據分析的範圍非常廣泛,凡是基於業務需求出發且依托於數據進行分析的,就是數據分析。
企業的數據分析一般包括以下方麵。
營銷數據分析:這是企業數據分析的主要部分,個人認為也是數據分析最迷人最有魅力的地方。營銷數據分析包括營銷整體狀況分析、客戶分析、產品線分析、促銷分析、客戶畫像、客戶購買原因分析、營銷預測、營銷異常值分析等。
生產質量數據分析:包括生產態勢分析、設備故障分析、生產成本分析、質量穩定性分析等。
財務數據分析:財務數據分析也是數據分析的主要部分之一,在很多企業,營銷數據和財務數據有很多交集,甚至我見過一些企業的營銷數據基本上是在財務部進行匯總的。財務數據分析一般比較關心異常值分析、財務預測、成本結構、項目投融資決策等多個方麵。企業的其他部門也有一些數據分析的需求,不過分布得比較零散。
1.4.5 數據展示(呈現)
數據展示這件事情的跨度很大,高度重視數據展示的大企業會購買類似Tableau這樣的專業可視化軟件,這類軟件功能強大,能夠承受大數據量的考驗,且運轉速度快;而一般的企業由於實力限製或者沒有那麼高層次的需求,通常利用EXCEL或者一些數據分析插件來優化圖形展示效果即可。
最後更新:2017-06-22 15:32:07