閱讀313 返回首頁    go 技術社區[雲棲]


簡單數據分析

前麵基於excel進行了數據處理的練習,現在用一下常用的數據分析。其實完全可以把練習的這些數據通過tunnel upload到MaxCompute裏麵去,通過SQL進行處理和分析,這樣更靈活,不過用excel有excel的好處,就是方便,小數據量處理還是很好的。本文中所有數據分析的原數據在附件中,有需要練習的可以自己下載。
1. 對比分析
用途:兩個或者兩個以上的數據進行比較,發現規律和差異。
分析目標:對於兩年的注冊用戶數進行同比分析和環比分析。
操作要點:
• 數據透視表
• 日期分組(基於年月分組)
• 環比計算(數據百分比,緯度月份)
• 同比計算(數據百分比,緯度年份)
效果如下:
screenshot

  1. 結構分析
    用途: 在分組的基礎上進行構成分析,例如:市場占比分析
    分析目標:分析2012年每個月份注冊用戶數是否有微信的對比
    操作要點:
    • 數據透視表
    • 基於月份分組
    • 占比計算(同行百分比)
    效果如下:
    screenshot

  2. 分布分析
    用途: 在分組的基礎上進行構成分析
    分析目標:基於消費金額分組,分析一下各大區域的用戶消費情況
    操作要點:
    首先要分組;可以通過vlookup函數來分組,不過需要提前建立好分組表,分組表中的步長可以不等。也可以通過數據透視表裏麵的分組功能,不過數據透視表裏麵的分組功能步長是相等的。
    基於分組後進行其他緯度的分析即可(拉到列標簽,處理一下數據格式)
    效果如下:
    screenshot

  3. 交叉分析
    用途: 基於兩個或者兩個以上的重要指標進行數據切分,了解切分後的數據特點。
    分析目標:基於月流量消耗和月消費金額兩個緯度,進行全國的用戶細分,找出高流量、高消費的用戶群體。
    操作要點:
    主要是通過vlookup函數將數據表和維表join一下,然後通過數據透視
    表進行分析
    在數據透視表中將高流量高消費區域的數據雙擊,就可以得到高消費高流量的用戶列表。
    效果如下:
    screenshot
    screenshot

  4. 矩陣分析
    用途: 參照下麵這個圖,就能明白這個矩陣分析有啥作用了。
    screenshot

分析目標:基於月流量消耗和月消費金額兩個緯度,進行全國的用戶細分,找出高流量、高消費的用戶群體。
操作要點:
主要是通過vlookup函數將數據表和維表join一下,然後通過數據透視
表進行分析
在數據透視表中將高流量高消費區域的數據雙擊,就可以得到高消費高流量的用戶列表。
效果如下:
screenshot

就簡單的羅列了幾個以上簡單的數據分析方法,大家想想如果把數據變成一維表存入數據庫,這些分析目的通過SQL怎麼寫呢?

最後更新:2017-04-01 17:04:39

  上一篇:go 創業公司擼 Node
  下一篇:go 編程必備,程序員應該都知道的7款文本編輯器