901
阿里云
步骤二:准备实验数据__快速入门_推荐引擎-阿里云
操作如下:
- 下载实验数据
- 解压数据
1. 下载实验数据
本实验将会使用公开数据集 MovieLens (ml-100k)作为数据源,该数据集可以通过网页https://grouplens.org/datasets/movielens/?spm=5176.docshujia/RE/startup/re-startup-pre1.2.5.ekLsL3 下载。
2. 解压数据
下载完成后解压缩,目录中会有多个文件,其中我们实验中会用到以下几个数据文件:
u.user:用户信息
u.item:电影信息
u.data:用户对电影的评分信息
具体的表结构如下:
用户表 users:
字段名 | 字段含义 |
---|---|
User_id | 用户标识,数值型,唯一标识一个用户 |
Age | 年龄,数值型 |
Gender | 性别,字符串型,M:男,F:女 |
Occupation | 职业,字符串型,如student,artist等 |
Zip_code | 邮编,字符串型,用户邮寄地址的邮编 |
电影信息表 movies:
字段名 | 字段含义 |
---|---|
movie_id | 电影标识,唯一标识一部电影 |
movie_title | 电影名字 |
release_date | 上映日期 |
video_release_date | VCD发行日期 |
IMDb_URL | 在IMDB中的链接地址 |
Unknown | 电影类型为“未知”,1:是 0:否 |
Action | 电影类型为“动作片”,1:是 0:否 |
Adventure | 电影类型为“探险片”,1:是 0:否 |
Animation | 电影类型为“动画片”,1:是 0:否 |
Childrens | 电影类型为“儿童片”,1:是 0:否 |
Comedy | 电影类型为“喜剧片”,1:是 0:否 |
Crime | 电影类型为“犯罪片”,1:是 0:否 |
Documentary | 电影类型为“纪录片”,1:是 0:否 |
Drama | 电影类型为“喜剧片”,1:是 0:否 |
Fantasy | 电影类型为“幻想片”,1:是 0:否 |
Film_Noir | 电影类型为“黑色片”,1:是 0:否 |
Horror | 电影类型为“恐怖片”,1:是 0:否 |
Musical | 电影类型为“英语片”,1:是 0:否 |
Mystery | 电影类型为“推理片”,1:是 0:否 |
Romance | 电影类型为“爱情片”,1:是 0:否 |
Sci_Fi | 电影类型为“科幻片”,1:是 0:否 |
Thriller | 电影类型为“惊悚片”,1:是 0:否 |
War | 电影类型为“战争片”,1:是 0:否 |
Western | 电影类型为“西部片”,1:是 0:否 |
用户评分表 ratings:
字段名 | 字段含义 |
---|---|
User_id | 用户标识,数值型,唯一标识一个用户 |
Movie_id | 电影标识,数值型,唯一标识一部电影 |
Rating | 用户评分,数值型,从1-5,的整数 |
Timestamps | 用户评分时间,数值型,Unix时间,即从1970/1/1开始的秒数 |
最后更新:2016-11-23 17:16:08
上一篇:
步骤一: 实验环境准备__快速入门_推荐引擎-阿里云
下一篇:
步骤三:实验数据上传和加工__快速入门_推荐引擎-阿里云
架构介绍__产品与_画像分析-阿里云
PHP SDK开发包__历史版本SDK下载_SDK 参考_对象存储 OSS-阿里云
查看实时性能__性能管理_用户指南(RDBMS)_数据管理-阿里云
上云须知__金融云介绍_金融云-阿里云
取消安全组规则__安全组_用户指南_云服务器 ECS-阿里云
经典网络专线接入__使用金融云产品_金融云-阿里云
删除用户__用户管理_DMS for MongoDB_用户指南(NoSQL)_数据管理-阿里云
RAM__操作事件(Event)样例_用户指南_操作审计-阿里云
云监控【主题模型】__开发人员指南_消息服务-阿里云
机器翻译服务协议__相关协议_平台介绍_数加平台介绍-阿里云
相关内容
常见错误说明__附录_大数据计算服务-阿里云
发送短信接口__API使用手册_短信服务-阿里云
接口文档__Android_安全组件教程_移动安全-阿里云
运营商错误码(联通)__常见问题_短信服务-阿里云
设置短信模板__使用手册_短信服务-阿里云
OSS 权限问题及排查__常见错误及排除_最佳实践_对象存储 OSS-阿里云
消息通知__操作指南_批量计算-阿里云
设备端快速接入(MQTT)__快速开始_阿里云物联网套件-阿里云
查询API调用流量数据__API管理相关接口_API_API 网关-阿里云
使用STS访问__JavaScript-SDK_SDK 参考_对象存储 OSS-阿里云