23
天猫
未来的智能家居中枢——天猫精灵X1体验评测

不久前,阿里巴巴人工智能实验室与飞猪在海南三亚宣布,正式启动“未来酒店2.0”全功能的规模化落地。天猫精灵将与飞猪合作,进入10万间酒店客房,为酒店提供从下单到入住全流程的智能化解决方案。以后,游客入住酒店可以通过客房内的天猫精灵,用语音控制窗帘、灯具和电视等设备,还能通过语音直接呼叫与酒店客房相关的服务。也许你已经体验过,也许你即将体验到这种未来酒店的魅力。
当全世界都在讨论人工智能的时候,我们就有理由相信,这个时代真的正向我们一步步走来。正如阿里人工智能实验室负责人陈丽娟所说:“语言是人与人之间最主要的沟通方式,也应该是人与另外一种智能进行交流的主要方式。”本次门罗公园收到一台全新的天猫精灵X1,相信大家对它的评测充满期待。
规格表
一、时尚简约,工业设计较出色
当天猫精灵X1第一天来到门罗公园办公室的时候,一度吸引了见惯各种智能硬件的同事们的眼球。它能获得大家的关注,显然跟它独具特色的极简风格有关。
天猫精灵X1共有黑白两色,门罗公园本次评测的是白色款。它采用了当前智能音箱较为主流的圆柱形设计,体积相当迷你,直径为83mm,高仅126mm,重量为400g,成年人很容易单手握持使用。其白色的配色非常时尚简约,放在家里配合白色家电等,能够自然地融入家居环境。
它的外观具有较高的品牌辨识度,它来源于机体身上的醒目logo。其logo设计以天猫logo的框架为基础,进行了更有科技感的视觉提炼——采用了点阵式风格,形象地体现出音箱的本质属性。
其机身分上下两个部分:上端采用塑料材质,经过了一定的磨砂处理,带来了良好的握持触感,也不易留下手印;下端用灰白色的细织网布包裹,提升了格调,还具有较好的防滑效果。
这款产品全身只有三个按钮,集中在顶部,一个实体的静音按钮,两个虚拟的音量加减键。在顶部还有6个环形布局的拾音MIC,配合主动降噪和远近场拾音技术,能够在5米的范围内有效拾取声音信息。
它的底座采用硅胶材质,具有一定的防滑效果,也减轻了在桌面上的共振现象。除此之外,底座上还标注了产品信息和天猫精灵APP的二维码,以及具有一个电源输入孔和一个Reset孔位。
底座和音箱的机身之间有一个过渡带,内置了12颗高亮RGB环形氛围灯带,1600万种细腻颜色呈现。同时,创新的内反射路径设计,灯光舒适温馨不刺眼。另外,天猫精灵X1还会根据音源定位亮灯并进行语音反馈。
点击播放
GIF/262K
正常使用灯光效果
点击播放
GIF/249K
静音状态灯光效果
点击播放
GIF/299K
音源定位灯光效果
二、上手容易,智能语音初体验
任何一件新产品,人们都希望它简单好用,天猫精灵X1能做到吗?
首先,将其电源连接,在移动端(手机、平板电脑)安装并打开天猫精灵APP,通过提示使用淘宝账号登录。然后,长按天猫精灵X1顶部的静音按钮,直到底部光带变成白色,按照APP提示选择网络,输入密码,即可联网。
“智能音箱只是一个语音交互的入口,而之后服务的深度和场景的宽度,才决定了入口的价值。”阿里人工智能实验室负责人浅雪如是说。作为一个智能音箱,本职工作当然是播放歌曲——它依靠庞大的互联网数据库,能提供大量的音乐,以满足不同用户的需求。
经过大量的歌曲播放测试,门罗评测师发现天猫精灵X1的曲库虽然较为丰富(主要由“虾米”音乐平台提供服务),但是对于英文歌名及歌星的识别较差。这就对用户的口语水平有着较高的要求,在搜索英文的时候常常需要放慢语速,一个一个单词地读出来,并反复多次,它才能正常识别并播放。
以下表格就是我们抽样选取了五首中文歌曲和五首英文歌曲所做的测试结果对比展示。“识别情况”的数字对比是指语音命令的次数和成功播放的次数,例如“The Next Episode”的部分指我们门罗评测师发出同样的语音播放命令5次后,才成功播放出1次。
除此之外,天猫精灵X1绝对不仅仅只是一个音箱,它还汇集了新闻播报、天气查看、备忘设置、家电控制、健身KEEP、儿童教学等功能于一身。它的远场拾音支持较好,反应迅速,在开敞的办公或家居场景里都可以放心使用。
在智能语音初体验的过程中,我们发现的明显问题汇总如下。
1.如前所述,天猫精灵X1是一个很“中国”的产品,很多英文歌名或者外国歌手它识别不了,会自动识别成谐音的中文。这一点让门罗评测师有点哭笑不得,对自己英文发音怀疑到死。
2.天猫精灵X1可控制的家电仅限“阿里智能”品牌旗下的智能家电,局限性比较大,例如小米智能家电等就无法使用。
3.在发出语音指令时,需要一次又一次地用“天猫精灵”将其唤醒,然后才能下达指令。其唤醒词比较拗口,反复唤醒影响到了用户体验的效果。
4.天猫精灵X1很容易受到噪音干扰,在执行语音指令的过程中,常常因为周围的噪音干扰而中断任务。
三、声纹购物,个性化服务
当大多数人还在惊叹无人商店的时候,天猫精灵X1已经把便利店带到了家里。它拥有独特的语音购物功能,只要用户在“声纹管理”里启用“声纹购物”,并在支付宝中开通免密支付,它就可以通过声纹来识别用户的个人特征,让用户只须动动口就可以买买买。
门罗评测师在体验声纹购物的过程中,利用天猫精灵X1成功缴纳了话费。而其他声纹购物的体验与缴纳话费相似,比如告诉它“我想买牛奶”时,系统会自动推荐一款牛奶产品,并语音播报其价格、月销量以及邮费等信息,并询问用户是下单还是加入购物车。
以下是天猫精灵X1购物体验视频。

相信大家从视频中也能看出,购物就真的只需要动动口了。但是不得不说,天猫精灵X1确实继承了阿里巴巴有钱的基因:当你说出想要买的物品时,它会自动为您筛选出产品,但是它筛选的这个产品一定是价格相对较贵的。用户在购物的时候,没有产品具象化,也不能横向对比,所以还是一种不足。如果只是缴纳话费,还是很实用。
在声纹购物的体验中,门罗评测师发现四点值得肯定的地方。
1.一旦用户输入过自己的手机号码,系统就会记住它,下次再要缴纳话费时就不用重复输入了。
2.当你告诉天猫精灵X1要购买某种商品之后,它会自动提供该商品的价格、销量以及你在淘宝与支付宝上绑定的收货地址等个人信息,避免用户购买出错。
3.下单之后如果支付未成功(比如普通话不够标准,验证码识别不准等因素),系统会自动下单到淘宝,用户可以进入移动端淘宝采用传统的方式进行支付。
4.在特定的应用场景下(设置日程、购物、缴纳话费),它不需要每句都使用“天猫精灵”唤醒词,这部分的应用比较便利。
四、语音评测,多维度测试
在天猫精灵X1的语音评测中,门罗评测师采用了门罗智能音箱评测标准方案进行测试。先根据其功能属性来选用测试的语料库,然后在办公和家居两个场景中进行了相关项目的测试。
以下是本次语音评测中,部分语料库的测试结果展现。因近场和远场不同距离的信息采集量大,只代表性地展示了办公场景的1米近场和家居场景的5米远场。
4.1 反馈时间
从上表不难看出,天猫精灵X1的反馈时间较短,都在3秒之内。近场识别在1.7秒-2.2秒之间;远场识别在1.8秒-3秒之间。
4.2 多轮对话
表格中6、7、8为一次多轮对话的测试展示。在近场条件下,天猫精灵X1顺利完成了多轮对话;在远场条件下则不能,当回答了第一轮对话后,后面的提问均无反应。
4.3 问答
天猫精灵X1内置阿里人工智能实验室第一代中文人机交流系统Aligenie,拥有较为智能的交互功能。从表格中我们选样展示的语料可以看出,它支持播音乐、听故事、讲笑话、查运势、玩游戏、查天气、找手机、问百科、设闹钟、充话费和查价格,以及天猫超市购物、智能家电操控等语音问答。另外,对于无法回答的问题,它也不会失去响应,而是回答“对不起,我也不知道这个问题的答案呢”。
4.4 开放域聊天
天猫精灵X1还支持开放域聊天,这也正是它智能的一种体现,可惜量较少。比如,你问它“天气情况”的时候,它除了播报天气和气温,还会告诉你应该如何穿衣服等。当你随口问它“你是不是有点傻?”,它会回答“虽然我现在不是很聪明,但是我在慢慢学习,让自己变得更好”等。
4.5 普通话及方言识别准确率
综合整个语音评测——静音环境与噪音环境,近场与远场及其不同距离等等维度的语音识别结果(因表格数据太大暂不展示),天猫精灵X1对标准普通话的近场识别率达到98%以上,远场识别率近90%。在官方设定的5米远场距离之外,我们门罗评测师还多测了更远的距离,它也能够有效拾音并识别,只是音量须增大至80分贝左右。另外,除了标准普通话的测试,我们还测试了一系列的方言,发现天猫精灵X1居然可以正常识别四川方言等。
在语音合成这一方面,天猫精灵X1采用了成熟女性的声音,发音较为自然、不机械,但也有少许生硬的地方。比如“表情包”这个词组,它会说成“表情-包”等。
需要注意的是,我们发现天猫精灵X1在工作时的各种表现及效果,与实际网络环境的关系很大。另外,它没有内置锂电池,必须连接电源才能使用的设计,大大限制了它的应用场景,只能在供电场所使用,没有移动便携性。
五、用户体验,满足不同需求
这一次由于产品的特殊性,我们特意邀请了来自社会各个阶层的人,请他们对天猫精灵X1进行了2-5天时间的试用体验。
以下是精选的五位用户体验。
六、门罗观点:值得肯定但还需改进
我们门罗评测师曾经体验过叮咚、出门问问、若琪·外星人等一系列表现较好的智能音箱,可以明显感受到,天猫精灵X1的用户体验与它们处于相近的水平。并且它还具备语音购物等特色功能,官方售价也仅499元人民币,性价比更高。
对于它的一些不足,如没内置锂电池只能插电使用,和“天猫精灵”四个字的唤醒词叫起来麻烦、拗口等,建议厂商酌情改进,以增加更多的应用场景,并提高用户体验。
最后更新:2017-10-08 07:45:36