阿里云如何炼就“神龙”这个“新物种”?
10月12日,在2017杭州云栖大会上,阿里云发布了一个全新的重磅产品——神龙云服务器(X-Dragon Cloud Server)。
从官方介绍来看,“神龙云服务器”是一种弹性可水平伸缩的高性能计算服务,具有四大突出亮点:极致性能、加密计算、秒级交付,与阿里云全站云产品互联互通。在售卖方式上和其它云产品保持一致,支持秒级计费的按量付费和包年包月付费两种模式。
“作为计算产品线的一个新产品,神龙云服务器本质既不是虚拟机产品,也不是物理机产品,而是一个兼具虚拟机和物理机优势的新物种”,对于神龙服务器,阿里云事业群虚拟化平台研发总监张献涛给出了这样的描述。
众所周知,如今公有云上的计算实例要么是虚拟机,要么是裸金属服务器(物理机),而神龙云服务器这种“非虚非实”、“虚实结合”的产品,在业内还是第一次出现。
这让我非常想搞清楚这条“神龙”背后的故事。所幸,我在云栖大会间隙“抓住”了忙碌的张献涛,一番深入沟通之后,心中所有的“问号”都变成了“惊叹号”。
前生今世
“服务器就应该长成今天这个样子吗?标准化服务器对云计算就是好的吗?对虚拟化就是好的吗?”,当我把“阿里云为什么要做神龙服务器”的问题抛给张献涛,他反问道。
在福特造出汽车之前,人们普遍认为没有什么车子比马车跑的更快;在iPhone诞生之前,人们普遍认为手机应当有键盘;而在神龙云服务器诞生之前,人们也普遍认为服务器应当是标准化的,因为从大型机、小型机到x86服务器,服务器一直在向标准化演进。
阿里云事业群虚拟化平台研发总监
张献涛
然而随着云计算时代的到来,“变革”已经成为常态。在张献涛看来,标准化的服务器已经不能完全满足云计算用户的需求,服务器架构又到了需要被重新定义的时刻。
这并不是张献涛的“主观臆断”,而是对大量客户走访的心得总结。“我现在基本上全国到处跑,各种客户都要去聊,然后把用户需求做汇总,然后反映到产品端”,张献涛说。
在这个过程中,张献涛看到越来越多的中大型企业客户对业务的稳定性、对业务的性能有着极致追求,或者希望服务器能够支撑业务长期发展并深挖其他一些新用途。这些客户当前可以选择的服务器一般有两种形式:虚拟机和物理机,但两者均不能完美的解决这些客户的需求和痛点。
“在2005年之前,服务器对虚拟化并不友好;2005年后,服务器CPU才能对虚拟化提供很好地支持”,张献涛指出,虚拟机虽然非常灵活,但天生存在缺陷,存在特性损失,性能也存在一定的损耗,这些缺陷在一些业务上表现不明显,但是在很多互联网业务上面会表现得比较明显。
例如,我们平时在谷歌上做个搜索,150毫秒和300毫秒返回结果其实对我们来说没有太大感觉,但是300毫秒的返回时间会直接把广告的营收拉低20%。对于这些对性能有着极致要求的客户来说,即便是虚拟机已经能够和物理机的性能达到差不多的程度(如90%,性能波动下的平均值),但性能波动导致的虚拟机性能的损耗会放大在业务上面。
张献涛表示,正因为虚拟机有着性能损耗,导致很多客户选择了物理机。物理机虽然性能具有优势,但存在着很多“坑”,比如部署周期慢、运维复杂、服务速度慢、架构僵化、存在数据安全隐患等问题。即便是现在有厂商宣称可以4小时交付物理机,但其中仍旧涉及大量的人肉操作,无论交付速度和灵活性都无法和云计算相提并论。“当前业界的物理机云服务简直可以用‘人肉云计算’来形容”, 张献涛幽默地说。
所以,总结来说,无论是虚拟机还是物理机,两者在计算性能,管理运维方面各有优势,又都存在不足。这对于很多追求极致性能又希望获得云计算诸多优势的企业客户来说,必须要在“鱼”和“熊掌”之间做出抉择和取舍,这个过程并不是那么容易,也势必要忍痛割爱。
“我们团队的第一要求是要创新,都要以真正能够解决用户的需求、痛点为第一要务”,张献涛说,所以阿里云希望重新定义一个新的计算架构——它不仅具有虚拟机的灵活性和弹性,同时具备物理机的一切特性和优势。
这意味着神龙云服务器也具备了再次虚拟化的能力,客户线下的专有云均可无缝平移到阿里云上,而不用担心嵌套虚拟化带来的性能开销,为客户上云提供一种新途径,也让客户不必在虚拟机和物理机之间取舍和纠结。
至于这个全新的云服务器为何要叫做“神龙”,其实很简单。阿里以武侠文化着称,一些重要项目也会有富有寓意的代号,如存储项目被称之为“盘古”、调度项目叫做“夸父”、网络项目叫做“洛神”等;而“神龙”这个“新物种”的命名则是源于阿里云着名的“飞天”。
“啥能飞天呢?就神龙吧!”,张献涛笑着告诉我。
“神”副其实
从阿里云官网我们能够看到神龙云服务器的一些具体情况:
神龙云服务器采用了阿里云自主研发的虚拟化2.0技术,其最大革新之处在于,不仅支持普通虚拟云主机,而且全面支持嵌套虚拟化技术,保留了普通云主机的资源弹性,并借助嵌套虚拟化技术保留了物理机的体验。
如前文所提,神龙云服务器有着四大特性:极致性能、加密计算、秒级交付、云产品兼容。
首先,极致性能,是指区别于虚拟机,神龙云服务器让客户独占计算资源,无虚拟化性能开销和特性损失;目前在规格选择上支持8核、16核、32核、64核、96核等多个规格,并支持超高主频实例。以8核产品为例,神龙云服务器实例支持超高主频至3.7GHz-4.1GHz,能够让游戏以及金融类业务的性能和响应达到极致。
其次,加密计算,是指除了具备物理隔离特性之外,为了更好地保障客户云上数据安全,神龙云服务器采用了芯片级可信执行环境具备“加密计算”能力,确保加密数据只能在安全可信的环境中计算。这种芯片级的硬件安全保障相当于为云上用户的数据提供了一个保险箱功能,用户可以自己掌控数据加密和密钥保护的全部流程。
第三,秒级交付,是指神龙云服务器在运维管控方面则具备云服务器的优势,使用体验和ECS保持一致。在售卖方式上,神龙云服务器也和阿里云其它产品保持一致,支持秒级计费的按量付费和包年包月付费两种模式。同时,秒级交付的特性将更好地满足大中型企业的高性能弹性计算的需求。
最后,云产品兼容,则是指神龙云服务器能够与阿里云全站云产品互联互通,如ECS、VPC、SLB、RDS、EIP等,能够提供给客户更多的选择,打造更完整的云端解决方案。
对此,张献涛指出,神龙云服务器能够兼具物理机和虚拟机优势,是由于在计算架构层面做了深度的变革,和今天主流的服务器架构是完全不一样的。例如,阿里云为神龙云服务器自研了芯片、一些关键部件和系统软件,通过大量自研部件的有机结合,神龙云服务器能够更好的去适应当前客户的虚拟化计算的需求。
简而言之,区别于主流的通用服务器,神龙云服务器是一类深度定制的云服务器产品,它打破了标准化服务器的条条框框,一切设计是为了帮助客户达到极致性能和云服务器的弹性和便捷——它天然支持嵌套虚拟化技术,能够让客户不需要额外的适配工作平移上云,和线下专有云无缝对接,扩展到阿里云上,从而帮助客户构建新型的混合云。
此外,神龙云服务器的极致性能也使之适用于高性能计算场景。基于神龙云服务器构建的SCC集群,和阿里云ECS,EGS等计算类产品一起,为阿里云弹性高性能计算平台E-HPC提供了堪比超算中心的并行计算资源,使云上超算真正实现。
新的起点
阿里云最近的一些表现令人印象深刻。
今年阿里云IaaS和云存储相继进入Gartner魔力象限,在全球公有云市场已经举足轻重;在Gartner最新发布的IaaS公有云服务市场份额(2015~2016年)报告中,阿里云超越谷歌,位居全球第三。
在产品布局上,阿里云今年8月一口气发布了19款企业级ECS实例,将产品进一步细分;今年9月,阿里云发布了弹性高性能计算平台E-HPC,这是中国首个公共云上的“HPC as a Service”产品,阿里云迈出了“云上超算”规模化商用的第一步。
阿里云副总裁李津
随着神龙云服务器的问世,阿里云又成为中国首个自研服务器的云服务提供商,在我看来此举意义深远。
第一,如今企业客户需求日趋多元化、场景化、精细化,通用化的解决方案越来越难以满足企业客户的需求,故而基于客户不同应用场景进行优化和改进必然成为云计算的演进趋势,在这方面阿里云已经走到了前面。
第二,随着云服务商规模不断扩大,自研服务器也是必然趋势。神龙服务器的问世证明了阿里云的自研服务器能力,无疑成为了中国公有云服务提供商的标杆。
实际上,在云栖大会上,阿里云副总裁李津就表示,2016年阿里云在中国的市场份额已经达到40%,或许今年将达到50%或者更高;在全球,超越谷歌之后,阿里云有信心再次超越:“这个世界很快在两到三年之后变成在云计算服务领域的两强、两极,阿里云一定是两极之一。”
在我看来,作为在本次云栖大会上发布的的一个重头产品,神龙云服务器也肩负着帮助阿里云实现“两极”梦想的重担。
不过,张献涛表示,神龙云服务器的“万里长征”才迈出了第一步,阿里云还有很多工作要去做,让它在新一代的云数据中心里面能够做到更加高端、更加自动化、更加省钱、更加灵活。
目前,神龙云服务器已经开始邀测。在未来的两到三年,“神龙”能否颠覆云服务器设计理念,阿里云能否实现“两极”梦想,都让外界非常值得期待。
申耀的科技观察,由非着名科技媒体人申耀创办、10万公里公路自驾经验老斯基,在各大自媒体平台拥有专栏,致力于科技行业的观察和思考,在这里读懂科技行业,知趋势,赢未来!
最后更新:2017-10-16 19:31:10
上一篇:
刘强东版智能加油站来了;阿里云承建国家级工业云平台
下一篇:
阿里云与芯讯通SIMCom——互联网生态与垂直行业的深度融合
禁用关键字表__附表_API 参考_云数据库 RDS 版-阿里云
日志查询__常见问题_日志服务-阿里云
步骤 2:创建Windows实例__快速入门(Windows)_云服务器 ECS-阿里云
Web控制台__快速入门_归档存储-阿里云
企业邮箱在Outlook office 2010上POP3/IMAP的设置方法__客户端使用_邮箱常见问题_企业邮箱-阿里云
Web防护规则低中高__功能说明_Web 应用防火墙-阿里云
删除订阅__订阅操作_快速入门_消息服务-阿里云
购买云虚拟主机流量__流量购买_购买指导_云虚机主机-阿里云
CID 投递统计__发布订阅统计接口_Open API_消息队列 MQ-阿里云
iOS 推流SDK使用说明__SDK文档及下载_API及SDK_视频直播-阿里云
相关内容
常见错误说明__附录_大数据计算服务-阿里云
发送短信接口__API使用手册_短信服务-阿里云
接口文档__Android_安全组件教程_移动安全-阿里云
运营商错误码(联通)__常见问题_短信服务-阿里云
设置短信模板__使用手册_短信服务-阿里云
OSS 权限问题及排查__常见错误及排除_最佳实践_对象存储 OSS-阿里云
消息通知__操作指南_批量计算-阿里云
设备端快速接入(MQTT)__快速开始_阿里云物联网套件-阿里云
查询API调用流量数据__API管理相关接口_API_API 网关-阿里云
使用STS访问__JavaScript-SDK_SDK 参考_对象存储 OSS-阿里云