2017云栖大会·杭州峰会:《云数据·大计算:海量日志数据分析与应用》之《数据分析展现:可视化报表及嵌入应用》篇
2017云栖大会·杭州峰会:《云数据·大计算:海量日志数据分析与应用》之《数据分析展现:可视化报表及嵌入应用》篇
实验背景介绍
了解更多2017云栖大会·杭州峰会 TechInsight & Workshop.
本手册为云栖大会·杭州峰会Workshop《云计算·大数据:海量日志数据分析与应用》的《数据分析展现:可视化报表及嵌入应用》篇而准备。主要阐述如何使用BDP个人版制作报表,将前面几个实验处理分析得来的数据进行有效的展现和洞察。
《数据加工:用户画像》实验中的结果表数据已经事先导入RDS中,表名为rpt_user_info_all_d。该表包含了:用户id、地区、性别、年龄范围、星座、访问设备、PV 等访问信息。
实验目标
承接前述实验加工好的数据表,通过BDP个人版完成网站用户分析画像的仪表板。
- 在该仪表板中,将展示用户的地区分布、设备分布和访问明细记录。
- 并能够根据年龄范围的查询条件,动态更新图表数据内容。
涉及大数据产品
实验环境准备
必备条件:
确保阿里云账号处于登录状态。
- step1:点击进入BDP个人版。
- step2:**选中规格为“金钻会员”,周期为“单月”**。
- step5:成功开通BDP个人版。
进入BDP个人版
确保阿里云账号处于登录状态。
- step1:点击进入BDP个人版。
- step2:点击进入BDP个人版。
添加数据源
《数据加工:用户画像》实验将数据导入云数据库RDS后,可以利用BDP个人版添加为数据源进行分析和展示。本章节为了大家快速的掌握BDP个人版的使用提前将数据给大家拷贝了一份在官方的RDS里,大家只需要配置即可用。
- step1:点击顶部**数据源**,进入数据源管理页,点击**添加数据源**。
- step2:在**添加数据源**界面,切换至**数据库**标签页,点击**RDS For MySQL**。
[说明] 数据量千万级别,响应速度秒级。添加RDS数据源,可以直联任何一个云上RDS数据库,或ECS中用户自建的RDS。
- step3:在**添加数据源 MySQL**界面,进行**连接配置**后,点击**下一步**。
RDS for MySQL数据源配置信息如下:
- 显示名称:workshop
- 数据库地址:rds955b606xk7e564006.mysql.rds.aliyuncs.com
- 端口:3306
- 数据库:workshop
- 用户名/密码:demo_001/demo_001
- step4:在**添加数据源 MySQL**界面,进行**数据表配置**后,点击**下一步**。
- step5:在**添加数据源 MySQL**界面,进行**高级配置**后,点击**确定**。
- step6:在“添加成功”界面,击**回到我的数据源**。在**数据源**页面中,能够看到新添加的数据源。
工作表建模
说明:
- 1. 将对表的加工过程固化保存下来以避免重复操作。
- 2. 常见加工:修改字段的数据类型、修改维度的类型、增加计算字段、创建合表、切换工作表类型。
- step1:点击**工作表**按钮,进入编辑工作表页面,点击左侧文件夹workshop,查看工作表rpt_user_info_all_d。
- step2:确认工作表中各字段数据类型是否合理。pv为数值类型,其他所有字段均为文本类型。
制作仪表板
与上一节衔接,将分析结果固化为可视化报表。随着数据的更新,报表可视化展现最新数据。我们把这个过程叫制作仪表板。
制作思路:确定内容->确定布局和样式->制作图表->实现动态联动查询。
制作模板如下:
【说明】仪表板创作界面的工具布局:
- step1:点击主导航上的**仪表盘**菜单,点击**+**下拉菜单下的**创建文件夹**按钮,在弹出的窗口中,**所属文件夹**选择**根目录**,**文件夹名称**填写**我的文件夹**。
- step2:点击**+**下拉菜单下的**创建仪表盘**按钮,在弹出的窗口中,**文件夹名称**选择**我的文件夹**,**仪表盘名称**填写**我的仪表盘**,**仪表盘类型**为**普通仪表盘**。
step3-5为创建含有钻取层级的图表,能够钻取查看用户访问的地域分布情况。
- step3:点击**添加图表**,在新建图表弹框中,选择**普通图表**,在图表编辑页面,将**region**拖拽到维度,**pv**拖拽到数值,默认聚合方式为求和,图表类型调整至**地图(面积)**,统计设置为默认状态**(按省汇总,显示全国)**,图表样式调整为**显示图表标签**,图表命名为**PV按地区分布**。
业务目的:查看PV按省份分布情况.
- step4:在**PV按地区分布**中,将gender拖拽到region标签之上,自动生成钻取层图表。点击“浙江省”进入到钻取层,调整图表类型为**饼图**,图表样式为**环形**。
业务目的:查看某个省份的PV按性别分布情况.
- step5:在**PV按地区分布**中,将zodiac拖拽到gender标签之上,自动生成钻取层图表。点击“女”进入到钻取层,调整图表类型为**条形图**,按PV**降序**排序。
业务目的:查看某个省份某个性别的PV按星座分布情况。
- step6:点击左上角返回按钮,完成该图表的编辑。
step7.1:创建三张图表,用于图表联动筛选其他图表。
step7.2:第一张图表 - PV按年龄段分布,拖拽标签**age_range**至维度, pv至数值;设置图表类型 – 条形图;
- step7.3:第二张图表 - PV按设备分布,拖拽标签**device**至维度, pv至数值;设置图表类型 – 饼图,图表样式 - 环形;
- step7.4:第三张图表 - PV按性别分布,拖拽标签**gender**至维度, pv至数值;设置图表类型 – 饼图,图表样式 - 环形;
- step8:在第一张图表 - PV按年龄段分布 - 中设置联动,点击图表右上角点状按钮,在弹出框中选中**联动设置**,在弹出框中设置联动图表,选中**PV按设备分布**和**PV按性别分布**,点击确定即可。
- step9:联动效果展示,在仪表盘中,点击**PV按年龄段分布**中的任意根柱子,即可看到**PV按设备分布**和**PV按性别分布**中的数据变化。
恭喜各位已经完成了数据导入、加工到展现的链路。最后我们将会将做好的仪表盘分享到微信朋友圈、QQ空间或微博平台。
- step10:点击仪表盘右上角的**分享**,在弹出框中输入对于仪表盘的解读,例如**这是我在BDP个人版上的第一个仪表盘,快来围观吧!**,点击**公开分享**。
- step12:在弹出框中,可复制链接直接分享,也可以选择微信,QQ空间,微博等平台分享。以微信分享为例,点击微信图标,使用手机微信扫描二维码即可分享。
分享效果如下图所示。
最后更新:2017-09-27 14:04:09