638
技术社区[云栖]
蚂蚁金服李小龙:“人工智能+金融”机遇与挑战并存,蚂蚁金服都做了什么?
编者按:由中国人工智能学会、阿里巴巴以及蚂蚁金服联合主办,CSDN、中国科学院自动化研究所承办的第三届中国人工智能大会(CCAI 2017)将于7月22-23日正式召开,届时,蚂蚁金服人工智能部技术总监李小龙将在智能金融论坛上分享蚂蚁金服在“人工智能+金融”的进展。在此之前,阿里云云栖社区作为独家直播合作伙伴对其作了专访。
蚂蚁金服只做Tech(技术),用技术支持金融机构做好Fin(金融),这样的定位和大多数试水“人工智能+金融”企业大相径庭。
而这只是蚂蚁金服用技术服务金融行业的冰山一角,从支付、智能风控、信贷决策、理财、保险定价、信用到智能客服,蚂蚁金服正在在用人工智能来影响和助力金融行业。
蚂蚁金服人工智能部技术总监李小龙表示,蚂蚁金服所做的人工智能研究都是基于场景,而这样的尝试远比单纯的学术研究复杂。以定损宝为例,产品核心的技术是图像识别,但它的实现比人脸识别、普通的图像识别难度更高;除此之外,还需要根据不同的输出结果来计算出保费的变化情况。
问题的维度更加复杂,这是金融行业独有的挑战,这种情况下算法需要怎样的创新?模型是否具备可解释性?蚂蚁金服正在攻克“人工智能+金融”领域最棘手的问题。
云栖社区:您一直专注机器学习和数据挖掘等领域,这些技术在蚂蚁金服业务中发挥了什么样的价值?
李小龙:机器学习和数据挖掘在蚂蚁金服很多场景上都有应用。金融行业非常关键的能力之一是洞察用户,给用户更精准的画像,这是数据挖掘里面很重要的一环,我们可以根据用户画像更好的进行产品推荐,或者是智能营销。
比如支付宝线下支付的营销活动(奖励金),应该给什么样的人发奖励金?发多少奖励金会进一步提升他消费的活跃度?这些会涉及NLP、语义匹配、长句分析匹配等问题。
云栖社区:蚂蚁金服一直希望用技术助力金融行业,现在做出了哪些创新?
还有在智能客服里面,我们采用了基于语义匹配的大规模层次聚类算法来做用户原始问句的聚类,然后用聚类产生的标准问题来代替原来人工定义的知识点的问题,这可以更好的反映用户的真实诉求,也能简化知识库的建设过程。
另一个值得一提的是机器人问答,蚂蚁金服客服机器人的解决率现在已经超过了人工(比人工高了三个百分点),这是怎么实现的呢?除了应用很多业界比较新的深度学习的算法并且结合我们的实际进行模型创新之外,我们还采用了问题推荐和相关问题推荐,也就是在精准匹配模型的信心分较低的情况下,把多个问题的推荐作为问答机器人的一种输出方式,另外,即使在信心分较高的情况下,在直接输出知识点的同时,也会输出相关问题的推荐(一般对于比较复杂的问题,相关问题往往也是用户关心的),然后通过点击数据就能够得到用户的反馈来训练模型,从而通过不断自学习来提升模型效果,这在QA上是相对比较少的一种做法,但在我们的客服机器人上取得了很好的效果。
云栖社区:不久前,蚂蚁金服向保险行业开放了“定损宝”,这其中使用了哪些人工智能技术?
云栖社区:您之前提到过深度学习的局限性,例如小样本场景下的挑战?蚂蚁金服是如何解决的?
李小龙:深度学习需要克服的一个问题是不可解释性,例如芝麻信用是需要强解释性的,减分和加分都需要解释,如果用深度学习则是比较难解释的;另一个例子是信用风控,虽然目前在中国拒绝贷款不需要给理由(在美国是必须要给理由的),但实际上这会给客服带来很大的压力,如果不给理由,用户会打很多电话去问客服。
云栖社区:针对大规模数据训练,蚂蚁金服现在在使用大规模参数服务器“鲲鹏”,介绍一下这其中的应用。
李小龙:鲲鹏是蚂蚁金服和阿里巴巴一起合作研发的大规模参数服务器,我们从2014年就开始研发,2015年在阿里集团正式上线。目前它的规模能够支持百亿甚至千亿的特征,千亿级别的样本,以及最大万亿的参数规模,这是业界的一流水平。阿里经济体内部包括几乎所有BU的120多个场景都在用鲲鹏训练模型,包括现在蚂蚁很多场景也都在使这个功能,比如前面提到的智能营销、智能推荐,还有智能客服。另外,在安全风控领域我们也用到了鲲鹏来训练大规模的深度学习模型。借这个机会也打个广告:今年8月份在加拿大举行的全球顶级数据挖掘会议KDD上我们会以Oral报告的方式第一次向学术界和工业界介绍鲲鹏系统和算法的特点、我们的创新以及在阿里和蚂蚁业务的应用,欢迎大家到时候参加和指正。
云栖社区:金融领域会面临很多安全问题,蚂蚁金服如何通过人工智能技术来规避这些风险?
李小龙:金融领域最核心的两个问题就是安全风控和信用风控,针对安全风控问题,蚂蚁金服人工智能部和安全业务部门正在进行紧密的合作,用先进的人工智能技术,如深度学习模型来代替代原来人工规则为主的体系,这可以大大提高效率。举几个例子,我们目前把深度学习用在了可信领域,即在每天的几亿笔交易中判断是不是可信的交易,如果不可信就中断,我们的模型能在尽可能减少用户打扰的情况下,保持很高的安全性。第二种情况下是盗账号模型,当一笔交易被系统判断它是不可信的情况下,我们还要再确认是不是盗帐号,这需要更多精细的特征来描述,也需要创新的算法才能实现。我们采用了业界创新的GBDT+DNN的模型,超越了之前的单个模型以及GBDT+LR的效果,在实际业务中取得了很好的效果。
云栖社区:越来越多的互联网企业和传统金融机构都开始着手研究人工智能+金融,蚂蚁金服有哪些技术特点?
因为现在有很多研究是纯研究,或者纯应用的,而蚂蚁金服是基于场景在研究,结合了研究和应用两个方面,它带来的挑战更大。例如,车险定损就是非常好的例子,它比一般意义上的人脸识别或者图像识别的挑战更大,因为这些都是基于真实的用户问题出发的场景。基于真实的用户问题,基于真实的场景来研究,最终是解决这些大规模的实际问题,实现普惠金融的目标,让金融触达80%以上的用户,这比单纯的学术研究更具挑战性,也更有价值和意义。
云栖社区:未来,人工智能+金融的发展方向在哪?现在最需要哪方面的人才?
关于人才,懂算法又懂工程是我们最需要的,同时,算法不仅要要紧随国际前沿,在功能上它还需要快速的落地。目前蚂蚁金服非常缺的是图像、信息安全加密算法以及大规模分布式系统的人才。
云栖社区:作为 CCAI 智能金融论坛的主席,组织这一论坛的出发点是什么?本次论坛将主要围绕哪些内容展开?希望为听众解决哪些问题?
李小龙:组织智能金融论坛的目的是为了针对金融智能前沿的一些挑战,集中学术界和工业界的智慧,大家一起来碰撞然后产生更好的观点和可能的方向,从而推进人工智能+金融的进展。
我们邀请了许多学术界和工业界的顶级专家:例如工业界的嘉宾有柳崎峰老师,他现在专注做量化交易的工具,通俗点说是通过智能的方法去判断交易的风险,然后帮用户做决策;学术界的嘉宾比如ACM Fellow邓小铁老师是专门做博弈论市场机制的,对于金融博弈下的价值学习有很好的经验和观点;香港中文大学计算机系的张胜誉老师,他正在研究计算复杂性理论以及AI在资源分配中的应用;王梦迪老师是普林斯顿大学的助理教授,研究的内容包括增强学习在智能金融的应用;还有佐治亚理工学院的杰出教授Sudheer Chava,专注计算金融学的研究,他将带来对于AI应用在金融界的优势和挑战的一些整体思考。
CCAI大会简介:
CCAI 2017大会由中国科学院院士、中国人工智能学会副理事长谭铁牛,阿里巴巴技术委员会主席王坚,香港科技大学计算机系主任、AAAI Fellow 杨强,蚂蚁金服副总裁、首席数据科学家漆远,南京大学教授、AAAI Fellow 周志华共同甄选出在人工智能领域本年度海内外最值得关注的学术与研发进展,汇聚了超过 40 位顶级人工智能专家,带来 9 场权威主题报告,以及“语言智能与应用论坛”、“智能金融论坛”、“人工智能科学与艺术论坛”、“人工智能青年论坛”4 大专题论坛,届时将有超过 2000 位人工智能专业人士参与。报名请戳这里!
大会讲师采访:
阿里人工智能实验室王刚:找到合适的应用场景是实现人工智能商业化的关键点
CCAI 2017 | 小数据学习对人工智能究竟有着怎样的影响?
CCAI 讲师专访 | 机器学习奠基人Thomas Dietterich:人类将如何受到AI威胁
CCAI讲师专访 | Toby Walsh:用AI提高器官移植的成功率
最后更新:2017-07-18 21:32:39