閱讀50 返回首頁    go 阿裏雲 go 技術社區[雲棲]


《Scala機器學習》一一1.7 總結

本節書摘來自華章計算機《Scala機器學習》一書中的第1章,第1.7節,作者:[美] 亞曆克斯·科茲洛夫(Alex Kozlov),更多章節內容可以訪問雲棲社區“華章計算機”公眾號查看。

1.7 總結

本章試圖為後麵更複雜的數據科學建立一個通用平台。不要認為這裏介紹了一套完整的探索性技術,因為探索性技術可擴展到非常複雜的模式上。但是,本章已經涉及了簡單的匯總、抽樣、文件操作(如讀和寫),並使用notebook和Spark DataFrame等工具來工作,Spark的DataFrame也為使用Spark/Scala的數據分析師引入了他們所熟悉的SQL結構。
下一章開始介紹數據管道,可將其看作基於數據驅動企業的一部分,並從商業角度給出數據發現的過程:做數據分析試圖要完成的最終目標是什麼。在介紹更複雜的數據表示之前,會先介紹一點傳統的機器學習內容,如監督學習和無監督學習,從中也能看出Scala相對於SQL的優勢。

最後更新:2017-07-07 10:02:31

  上一篇:go  Kubernetes解決方案 Release Notes
  下一篇:go  Chrome 56 Android 版已引入 WebVR API