《Scala机器学习》一一1.7 总结
本节书摘来自华章计算机《Scala机器学习》一书中的第1章,第1.7节,作者:[美] 亚历克斯·科兹洛夫(Alex Kozlov),更多章节内容可以访问云栖社区“华章计算机”公众号查看。
1.7 总结
本章试图为后面更复杂的数据科学建立一个通用平台。不要认为这里介绍了一套完整的探索性技术,因为探索性技术可扩展到非常复杂的模式上。但是,本章已经涉及了简单的汇总、抽样、文件操作(如读和写),并使用notebook和Spark DataFrame等工具来工作,Spark的DataFrame也为使用Spark/Scala的数据分析师引入了他们所熟悉的SQL结构。
下一章开始介绍数据管道,可将其看作基于数据驱动企业的一部分,并从商业角度给出数据发现的过程:做数据分析试图要完成的最终目标是什么。在介绍更复杂的数据表示之前,会先介绍一点传统的机器学习内容,如监督学习和无监督学习,从中也能看出Scala相对于SQL的优势。
最后更新:2017-07-07 10:02:31
上一篇:
Kubernetes解决方案 Release Notes
下一篇:
Chrome 56 Android 版已引入 WebVR API
octave入门
OSS WordPress插件(Aliyun OSS For WordPress)
读书笔记:Apache Hadoop YARN: Yet Anothe Resource Negotiator
几个常用命令小记
JRainbow 0.2版本发布
Oracle中的nvl函数
《Spark大数据分析:核心概念、技术及实践》Scala编程
同时学习多种编程语言其实很容易
收(网络控(中华人民共和国税收征收管理法(主席令第四十九号) 2015年8月15日 - 会关于修改〈中华人民共和国文物保护法〉等十二部法律的决定》(主席令第...第八十九条 纳税人、扣缴义务人可以委托税务代理人代为办理税务事宜。 第...)制集团一体)起相
CDN和SLB正式售卖