阅读50 返回首页    go 阿里云 go 技术社区[云栖]


《Scala机器学习》一一1.7 总结

本节书摘来自华章计算机《Scala机器学习》一书中的第1章,第1.7节,作者:[美] 亚历克斯·科兹洛夫(Alex Kozlov),更多章节内容可以访问云栖社区“华章计算机”公众号查看。

1.7 总结

本章试图为后面更复杂的数据科学建立一个通用平台。不要认为这里介绍了一套完整的探索性技术,因为探索性技术可扩展到非常复杂的模式上。但是,本章已经涉及了简单的汇总、抽样、文件操作(如读和写),并使用notebook和Spark DataFrame等工具来工作,Spark的DataFrame也为使用Spark/Scala的数据分析师引入了他们所熟悉的SQL结构。
下一章开始介绍数据管道,可将其看作基于数据驱动企业的一部分,并从商业角度给出数据发现的过程:做数据分析试图要完成的最终目标是什么。在介绍更复杂的数据表示之前,会先介绍一点传统的机器学习内容,如监督学习和无监督学习,从中也能看出Scala相对于SQL的优势。

最后更新:2017-07-07 10:02:31

  上一篇:go  Kubernetes解决方案 Release Notes
  下一篇:go  Chrome 56 Android 版已引入 WebVR API