初创企业的选择——MaxCompute
前不久刚加入了一家初创公司,公司立足于已有数据资产,计划全力打造自有数据平台。对于刚起步的初创企业,节省的一分钟,无疑都能提高企业在众多竞争对手中的存活率。而自建大数据计算平台对于一个初创团队无论实在时间,人手,技术上无疑是难以实现的,而团队应该专注于业务逻辑的开发。上云成了创业团队踏入大数据大门的唯一选择。
在选择产品之前,我们先对自己的需求进行了梳理。
首先,日常的业务数据需要存储在关系型数据库中,用以保证事务的一致性。然后,需要在业务数据的基础上,周期性计算指标值,周期一般为日、周、每月。此外,为了实现数字化营销,还需要做大量的数据分析和部分数据挖掘。通过预估发现,业务数据中将有超过3张以上的核心表数据量达到千万以上,当需要进行指标计算时,无法在关系型数据库中完成关联查询。为了得到结果,必须选择另外一种数据计算和存储方式来完成清洗转换以及逻辑处理。同时要满足从关系型数据库到数据仓库的快速数据同步。
经过多番对比选择,发现阿里的MaxCompute是一个具有良好生态,以及周边服务套件的大数据开发平台。从数据的采集,清洗到数据的处理,数据挖掘,数据的应用展现,数据流转的生命周期中,MaxCompute都有很好的周边产品。而MaxCompute也能无缝对接在ec2,存储等其他服务的数据。因此我们决定使用阿里云MaxCompute作为我们的大数据开发平台。
系统中每天都有大量的运行结果从用户的iot设备中返回,进入Datahub中暂存,然后统一归档到MaxCompute等待处理。而有些返回的数据是错误的,或者是重复的,需要编写SQL计算任务来清洗与转换。
经过多番对比选择,发现阿里的MaxCompute是一个具有良好生态,以及周边服务套件的大数据开发平台。从数据的采集,清洗到数据的处理,数据挖掘,数据的应用展现,数据流转的生命周期中,MaxCompute都有很好的周边产品。而MaxCompute也能无缝对接在ec2,存储等其他服务的数据。因此我们决定使用阿里云MaxCompute作为我们的大数据开发平台。
系统中每天都有大量的运行结果从用户的iot设备中返回,进入Datahub中暂存,然后统一归档到MaxCompute等待处理。而有些返回的数据是错误的,或者是重复的,需要编写SQL计算任务来清洗与转换。

数据仓库经过处理的数据,不单为业务数据库提供支持,另一个十分重要的进入Quick Bi。Qucik Bi为我们的运营人员提供了可量化的运营分析指导。对公司的运营方向,以及决策指导,都提供了意义巨大的作用。
另一个作用巨大的套件则是推荐引擎。一部分数据通过在APP进行客户端埋点,另一部分则是数据仓库中的身体运动数据。和MaxCompute对接后,产出API接口供业务服务器调用。我们的业务主要是一些运动建议,以及周边产品的一些推荐。在推荐引擎控制台中,通过对指标的定义,来修正推荐效果。
上云的好处是显而易见的。大大减少了无用的技术资源投入,尽可能的专注于业务开发。无需在基础设施中投入,为平台的部署,运维,稳定性投入大量的精力。另外MaxCompute图形化的任务界面,也让开发人员轻松的了解任务的运行状态,数据的流转流程。
另一个作用巨大的套件则是推荐引擎。一部分数据通过在APP进行客户端埋点,另一部分则是数据仓库中的身体运动数据。和MaxCompute对接后,产出API接口供业务服务器调用。我们的业务主要是一些运动建议,以及周边产品的一些推荐。在推荐引擎控制台中,通过对指标的定义,来修正推荐效果。
上云的好处是显而易见的。大大减少了无用的技术资源投入,尽可能的专注于业务开发。无需在基础设施中投入,为平台的部署,运维,稳定性投入大量的精力。另外MaxCompute图形化的任务界面,也让开发人员轻松的了解任务的运行状态,数据的流转流程。
最后更新:2017-07-26 13:32:29