《大數據係統構建:可擴展實時數據係統構建原理與最佳實踐》一1.9 示例應用:SuperWebAnalytics.com
本節書摘來自華章出版社《大數據係統構建:可擴展實時數據係統構建原理與最佳實踐》一書中的第1章,第1.9節,南森·馬茨(Nathan Marz) [美] 詹姆斯·沃倫(JamesWarren) 著 馬延輝 向 磊 魏東琦 譯,更多章節內容可以訪問雲棲社區“華章計算機”公眾號查看。
1.9 示例應用:SuperWebAnalytics.com
在本書中,我們將創建一個大數據應用程序示例來說明一些概念。我們將為Google Analytics構建數據管理層—比如服務。該服務將能夠每天追蹤數十億的頁麵瀏覽量。
該服務將支持多種不同的指標。每個指標都被實時地支持。指標的範圍很廣—從簡單的統計指標,到訪客是如何瀏覽網站的複雜分析指標。
示例應用將支持的指標如下:
按照時間切片基於URL的頁麵瀏覽計數—示例查詢是“過去一年中每一天的頁麵瀏覽量是多少?”和“過去12小時內有多少頁麵瀏覽量?”
按照時間切片基於URL的獨立訪客—示例查詢是“2010年有多少獨立訪客訪問這個域名?”和“過去三天內每個小時,有多少訪客訪問這個域名?”
跳出率分析—“用戶訪問該站點的某個頁麵,沒有訪問其他任何頁麵的百分比是多少?”
我們將構建存儲、處理並為應用程序提供查詢的層。
最後更新:2017-10-02 21:08:13