步骤四:配置推荐引擎__快速入门_推荐引擎-阿里云
本章节内容介绍了如何通过管理控制台的图形界面配置推荐引擎,通过简单的界面花操作,完成数据和算法的配置。
操作步骤如下:
- 添加资源
- 添加推荐业务
- 添加配置推荐场景
- 了解算法流程模板
1. 添加资源
在数加平台的控制台上,点击左侧导航栏中的“推荐引擎”,进入推荐引擎的管理界面:
进入推荐引擎管理页面后,点击左侧导航栏中的“资源管理”先把我们准备工作中创建的资源配添加进来,让推荐引擎知道后续计算时需要使用的资源:
需要添加的资源有三类:大数据计算服务、表格存储服务以及云监控,其中大数据计算服务是存储数据和进行推荐算法计算的地方,表格存储是用来保存结果的,可以支持在线访问,云监控是用来监控整个处理过程的,有问题的时候可以报警。前一项是必选项,后两项是可选项,此处我们只配置必选项。
首先,添加我们开通的ODPS Project到大数据计算服务资源:点击右上角的“添加云计算资源”,在弹出的页面中添加ODPS Project:
其中,“云计算资源标识”是该资源的名称,只要符合命名规则即可,“项目名称”为我们专门创建的ODPS project的名字,此case中为 auto_rec_demo,AccessID和AccessKey可以在阿里云管理控制台首页中去获得,填写完成后点击“提交”。
2. 添加推荐业务
推荐业务是推荐引擎的基本管理单元,业务定义了算法所能使用的数据范围,例如商品推荐业务的数据范围是用户数据、商品数据和行为数据等。在推荐业务中,最重要的事情就是配置需要使用的数据。
点击“我的推荐”,返回推荐引擎管理控制台首页,点击新建业务,添加一个新的推荐业务:
在弹出的“添加业务信息”页面中,包含了三个主要部分,分别是:配置业务信息、配置业务依赖云资源以及配置业务数据表,首先填写“配置业务信息”部分的内容:
注意: 业务Code在推荐引擎中是全局唯一,您填写的名称可能会和其他客户填写的名称冲突。
接下来填写“配置业务依赖云资源”内容:
“大数据计算资源”选择 MyFirstRecEngine,在线存储资源选择勾选“使用系统自带在线存储资源”。
最后填写“配置业务数据表”,物品属性维度表不需要填写数据表名称,其他都按要求输入表名:
将我们在之前的实验中添加过的数据表名称,分别填写到对应的位置:
“用户表”为movielens_user_meta,
“用户属性维度表”为 movielens_user_meta_config
“物品表”为movielens_item_meta
“行为表”为 movielens_user_behavior
信息填充完成后,点击提交,完成业务的添加和配置。整个提交过程实际上会去初始化环境,整个过程大概需要几分钟的时间,请耐心等待。提交完成后,可以查询该业务的信息:
3. 添加配置推荐场景
一个推荐业务支持包含多个推荐场景,每个推荐场景可以看做是APP或网站中提供个性化推荐的功能模块。场景隶属于某一个业务,使用到的数据就是在业务中配置的数据。
场景包含一个或多个算法流程,每一个算法流程代表一种推荐物品的逻辑,由离线流程和在线流程组合而成,离线流程和在线流程分别由多个算法拼装组成。离线流程用于处理批量数据计算,在线流程用于处理在线数据计算。
创建完推荐业务后,会自动生成两个推荐场景:“详情页推荐”和“首页推荐”:
可以看到这两个场景后都有红色的小图标,表明这两个场景中有算法流程尚未发布,简单的讲,这两个场景还需要进一步的配置。
另外,可以看到两个Tab页,即上方的红色框中的部分。一个是线上生产环境,一个是开发测试环境。用户可以在开发测试环境中新建场景,配置好后发布到线上生产环境中来,本Case中直接使用默认创建的场景,感兴趣的同学可以自己动手去测试:
接下来我们来完成两个场景的配置。首先,点击线上生产环境中的“首页推荐”:
进入“编辑推荐场景”页面,我们看到已有算法流程main,该算法流程并不适用于本case,因此我们需要新建一个算法流程main_new,点击“新建算法流程”:
在弹出的“添加算法流程”对话框里,填写新增算法流程main_new的配置信息:
提交后,点击“发布”,我们需要将刚添加的算法流程从开发测试环境发布到正式环境中去:
勾选main_new算法流程,然后点击下一步:
在设置流量占比时,由于只有一个main_new,所以系统会默认将其流量占比设置成100%,表示所有的首页流量将都将使用算法流程main_new的推荐结果,配置完成后点击“完成”:
在“编辑推荐场景”页面中,点击完成:
页面返回到“我的推荐”,可以看到“首页推荐”所在行的算法流程中包含了我们新增的算法流程main_new以及该算法流程的流量。红色感叹号标志依然存在是由于还有一个main算法流程没有发布到正式环境中,在本case中我们不用理会这个红色感叹号:
至此,首页推荐已经完全配置成功。接下来配置“详情页推荐”,操作流程和配置“首页推荐”是完全一样的:点击“详情页推荐”,进入“编辑推荐场景”页:
点击“新增算法流程”:
在弹出的“添加算法流程”窗口中,填写配置信息后提交:
点击“发布”,将场景的detail_new流程从开发测试环境提交到在线生产环境:
在弹出窗口中,选择detail_new算法流程,点击下一步:
设置流量占比,流程detail_new的流量占比为100%,点击完成:
在“编辑推荐场景”页面中点击“完成”,返回“我的推荐”页面:
在“我的推荐”页面中可以看到两个场景均已经配置成功:
4. 了解算法流程模板
本章节内容为附加阅读内容,可以帮助理解推荐引擎所使用的算法模板(即在上一节配置场景的过程中用到的算法模板)。已经了解的或者不想了解太多技术细节的同学可以跳过,不影响后续试验操作。
离线流程以客户提供的原始离线数据表,包括用户信息,物品信息,用户行为日志开始,通过离线计算得到每个用户、每个物品的特征,以及每个用户可能感兴趣的物品,和每个物品计算出与之相似的物品等,并将这些结果同步到在线存储上。
在线流程从客户的产品发起的推荐API请求开始,根据API的参数获取指定用户在离线流程中计算好的信息,并根据在线流程定义的规则和算法进行过滤和排序处理,并最终返回给客户的产品。
所谓算法流程模板,是指客户可以把配置好的算法流程保存起来作为模板以备后用。目前推荐引擎提供了两类算法流程模板,一种是离线计算模板,一种是在线计算模板。
推荐引擎提供了多个内置的离线计算模板和在线计算模板,用户可以直接使用这些模板,也可以根据自己的实际业务定制自定义的模板。
如想了解模板和算法的详情,请访问内置算法和模板说明。
最后更新:2016-11-23 16:04:12
上一篇:
步骤三:实验数据上传和加工__快速入门_推荐引擎-阿里云
下一篇:
步骤五:启用推荐业务__快速入门_推荐引擎-阿里云
DRDS分库分表__开发手册_分布式关系型数据库 DRDS-阿里云
报表制作-功能概述___制作报表_Quick BI-阿里云
RemoveTags__标签相关API_API 参考_负载均衡-阿里云
4.2 逻辑表达式和特殊语法__第四章 DML_使用手册_分析型数据库-阿里云
表详情页介绍__数据管理手册_用户操作指南_大数据开发套件-阿里云
通知__使用须知_用户指南_弹性伸缩-阿里云
专属账号申请流程?__充值介绍_账户资产_财务-阿里云
归档存储__常见问题_-阿里云
应用连接池选择__最佳实践_分布式关系型数据库 DRDS-阿里云
使用金融云SLB(经典网络)__使用金融云产品_金融云-阿里云
相关内容
常见错误说明__附录_大数据计算服务-阿里云
发送短信接口__API使用手册_短信服务-阿里云
接口文档__Android_安全组件教程_移动安全-阿里云
运营商错误码(联通)__常见问题_短信服务-阿里云
设置短信模板__使用手册_短信服务-阿里云
OSS 权限问题及排查__常见错误及排除_最佳实践_对象存储 OSS-阿里云
消息通知__操作指南_批量计算-阿里云
设备端快速接入(MQTT)__快速开始_阿里云物联网套件-阿里云
查询API调用流量数据__API管理相关接口_API_API 网关-阿里云
使用STS访问__JavaScript-SDK_SDK 参考_对象存储 OSS-阿里云