《Scala機器學習》一一1.7 總結
本節書摘來自華章計算機《Scala機器學習》一書中的第1章,第1.7節,作者:[美] 亞曆克斯·科茲洛夫(Alex Kozlov),更多章節內容可以訪問雲棲社區“華章計算機”公眾號查看。
1.7 總結
本章試圖為後麵更複雜的數據科學建立一個通用平台。不要認為這裏介紹了一套完整的探索性技術,因為探索性技術可擴展到非常複雜的模式上。但是,本章已經涉及了簡單的匯總、抽樣、文件操作(如讀和寫),並使用notebook和Spark DataFrame等工具來工作,Spark的DataFrame也為使用Spark/Scala的數據分析師引入了他們所熟悉的SQL結構。
下一章開始介紹數據管道,可將其看作基於數據驅動企業的一部分,並從商業角度給出數據發現的過程:做數據分析試圖要完成的最終目標是什麼。在介紹更複雜的數據表示之前,會先介紹一點傳統的機器學習內容,如監督學習和無監督學習,從中也能看出Scala相對於SQL的優勢。
最後更新:2017-07-07 10:02:31
上一篇:
Kubernetes解決方案 Release Notes
下一篇:
Chrome 56 Android 版已引入 WebVR API
octave入門
OSS WordPress插件(Aliyun OSS For WordPress)
讀書筆記:Apache Hadoop YARN: Yet Anothe Resource Negotiator
幾個常用命令小記
JRainbow 0.2版本發布
Oracle中的nvl函數
《Spark大數據分析:核心概念、技術及實踐》Scala編程
同時學習多種編程語言其實很容易
收(網絡控(中華人民共和國稅收征收管理法(主席令第四十九號) 2015年8月15日 - 會關於修改〈中華人民共和國文物保護法〉等十二部法律的決定》(主席令第...第八十九條 納稅人、扣繳義務人可以委托稅務代理人代為辦理稅務事宜。 第...)製集團一體)起相
CDN和SLB正式售賣