901
財經資訊
步驟二:準備實驗數據__快速入門_推薦引擎-阿裏雲
操作如下:
- 下載實驗數據
- 解壓數據
1. 下載實驗數據
本實驗將會使用公開數據集 MovieLens (ml-100k)作為數據源,該數據集可以通過網頁https://grouplens.org/datasets/movielens/?spm=5176.docshujia/RE/startup/re-startup-pre1.2.5.ekLsL3 下載。
2. 解壓數據
下載完成後解壓縮,目錄中會有多個文件,其中我們實驗中會用到以下幾個數據文件:
u.user:用戶信息
u.item:電影信息
u.data:用戶對電影的評分信息
具體的表結構如下:
用戶表 users:
字段名 | 字段含義 |
---|---|
User_id | 用戶標識,數值型,唯一標識一個用戶 |
Age | 年齡,數值型 |
Gender | 性別,字符串型,M:男,F:女 |
Occupation | 職業,字符串型,如student,artist等 |
Zip_code | 郵編,字符串型,用戶郵寄地址的郵編 |
電影信息表 movies:
字段名 | 字段含義 |
---|---|
movie_id | 電影標識,唯一標識一部電影 |
movie_title | 電影名字 |
release_date | 上映日期 |
video_release_date | VCD發行日期 |
IMDb_URL | 在IMDB中的鏈接地址 |
Unknown | 電影類型為“未知”,1:是 0:否 |
Action | 電影類型為“動作片”,1:是 0:否 |
Adventure | 電影類型為“探險片”,1:是 0:否 |
Animation | 電影類型為“動畫片”,1:是 0:否 |
Childrens | 電影類型為“兒童片”,1:是 0:否 |
Comedy | 電影類型為“喜劇片”,1:是 0:否 |
Crime | 電影類型為“犯罪片”,1:是 0:否 |
Documentary | 電影類型為“紀錄片”,1:是 0:否 |
Drama | 電影類型為“喜劇片”,1:是 0:否 |
Fantasy | 電影類型為“幻想片”,1:是 0:否 |
Film_Noir | 電影類型為“黑色片”,1:是 0:否 |
Horror | 電影類型為“恐怖片”,1:是 0:否 |
Musical | 電影類型為“英語片”,1:是 0:否 |
Mystery | 電影類型為“推理片”,1:是 0:否 |
Romance | 電影類型為“愛情片”,1:是 0:否 |
Sci_Fi | 電影類型為“科幻片”,1:是 0:否 |
Thriller | 電影類型為“驚悚片”,1:是 0:否 |
War | 電影類型為“戰爭片”,1:是 0:否 |
Western | 電影類型為“西部片”,1:是 0:否 |
用戶評分表 ratings:
字段名 | 字段含義 |
---|---|
User_id | 用戶標識,數值型,唯一標識一個用戶 |
Movie_id | 電影標識,數值型,唯一標識一部電影 |
Rating | 用戶評分,數值型,從1-5,的整數 |
Timestamps | 用戶評分時間,數值型,Unix時間,即從1970/1/1開始的秒數 |
最後更新:2016-11-23 17:16:08
上一篇:
步驟一: 實驗環境準備__快速入門_推薦引擎-阿裏雲
下一篇:
步驟三:實驗數據上傳和加工__快速入門_推薦引擎-阿裏雲
架構介紹__產品與_畫像分析-阿裏雲
PHP SDK開發包__曆史版本SDK下載_SDK 參考_對象存儲 OSS-阿裏雲
查看實時性能__性能管理_用戶指南(RDBMS)_數據管理-阿裏雲
上雲須知__金融雲介紹_金融雲-阿裏雲
取消安全組規則__安全組_用戶指南_雲服務器 ECS-阿裏雲
經典網絡專線接入__使用金融雲產品_金融雲-阿裏雲
刪除用戶__用戶管理_DMS for MongoDB_用戶指南(NoSQL)_數據管理-阿裏雲
RAM__操作事件(Event)樣例_用戶指南_操作審計-阿裏雲
雲監控【主題模型】__開發人員指南_消息服務-阿裏雲
機器翻譯服務協議__相關協議_平台介紹_數加平台介紹-阿裏雲
相關內容
常見錯誤說明__附錄_大數據計算服務-阿裏雲
發送短信接口__API使用手冊_短信服務-阿裏雲
接口文檔__Android_安全組件教程_移動安全-阿裏雲
運營商錯誤碼(聯通)__常見問題_短信服務-阿裏雲
設置短信模板__使用手冊_短信服務-阿裏雲
OSS 權限問題及排查__常見錯誤及排除_最佳實踐_對象存儲 OSS-阿裏雲
消息通知__操作指南_批量計算-阿裏雲
設備端快速接入(MQTT)__快速開始_阿裏雲物聯網套件-阿裏雲
查詢API調用流量數據__API管理相關接口_API_API 網關-阿裏雲
使用STS訪問__JavaScript-SDK_SDK 參考_對象存儲 OSS-阿裏雲