閱讀488 返回首頁    go 阿裏雲 go 技術社區[雲棲]


機器學習:數據驅動的科學

引言:傳統上,計算機會按照我們輸入的指令一步步執行。而機器學習卻是通過輸入數據而不是指令來進行各種工作。
本文選自《深入淺出深度學習:原理剖析與Python實踐》。

  機器學習,也被稱為統計機器學習,是人工智能領域的一個分支,其基本思想是基於數據構建統計模型,並利用模型對數據進行分析和預測的一門學科。
  傳統上,如果想讓計算機工作,我們會編寫一段指令,然後讓計算機遵照這個指令一步一步執行下去。而機器學習則是采用另一種解決問題的思路,機器學習解決問題的方式不是通過輸入指令邏輯,而是通過輸入的數據,也就是說,機器學習是一種讓計算機利用數據而不是指令來進行各種工作的方法。
  機器學習最基本的做法是使用算法來解析數據,從數據中學習到規律,並掌握這種規律,然後對真實世界中的事件做出決策或預測。與傳統的為解決特定任務、硬編碼的軟件程序不同,機器學習的核心是使用大量的數據來訓練,通過各種算法從數據中學習如何完成任務。機器學習直接來源於早期的人工智能領域,在模式識別和計算機學習理論的研究中逐漸發展,並最終形成一門新的學科。與人工智能類似,機器學習也是一個跨學科的領域,涉及多個基礎學科,包括統計學、線性代數和數值計算等。
  機器學習是基於訓練數據構建統計模型,從而使計算機具有對新數據進行預測和分析的能力,機器學習方法按其實現的目標不同,可以分為:監督學習、無監督學習和強化學習。
  :監督學習使用帶有標簽的訓練數據集進行訓練,輸入的訓練數據由物體的特征向量(輸入)和物體的標簽(輸出)兩部分構成,其中,若輸出的標簽是一個連續的值,則稱為回歸監督學習;若輸出標簽是一個離散的值,則稱為分類監督學習。
  監督學習涉及兩個方麵的工作:首先,根據提供的訓練數據,選擇一種合適的模型進行訓練,直至模型的訓練收斂。常見的監督學習模型包括:Logistic回歸、決策樹、SVM(Support Vector Machines,支持向量機)、KNN、樸素貝葉斯等。下圖展示的是一個水果分類的例子,每一個樣本數據的輸入是由物體的特征構成的特征向量,如物體的顏色、大小、形狀等,輸出的是物體的類別,如蘋果、葡萄、香蕉等。
          圖片描述
監督學習模型訓練,算法利用訓練數據提供的特征信息,如顏色、大小、形狀等,構建概率模型p(y|x)或非概率模型y=f(x)

  其次,當模型訓練完畢,就可以把新的輸入數據代入模型,模型將根據新數據的特征信息,找出最符合這種特征的輸出結果,其過程如下。
          圖片描述
                          模型預測

  :無監督學習的訓練樣本數據沒有任何的標簽和輸出,其目的是對原始數據結構進行深入分析,找出數據間存在的規律與關係。典型的無監督學習任務包括:聚類、降維、特征提取等。
     圖片描述
                 兩種常見的無監督學習,(a)數據聚類,(b)數據降維

  雖然監督學習的準確率更高,但在現實生活中,我們獲取的大量數據一般是沒有標簽數據的,因此,我們不得不訴諸於無監督學習,但傳統的無監督學習方法在特征提取上並不令人滿意,而深度學習則被證明具有強大的無監督學習能力,特別是在計算機視覺領域,運用深度學習技術所達到的效果更是要遠優於傳統的機器學習。
  :強化學習也稱為增強學習,強調如何基於環境而行動,以取得最大化的預期利益。其靈感來源於心理學中的行為主義理論,即有機體如何在環境給予的獎勵或懲罰的刺激下,逐步形成對刺激的預期,產生能獲得最大利益的習慣性行為。
  強化學習與前麵的監督學習、無監督學習之間的區別在於,它並不需要出現正確的輸入輸出對,也不需要精確校正次優化的行為。強化學習更加專注於在線規劃,需要在探索未知的領域和遵從現有知識之間找到平衡,它的學習過程是一個從實際環境中不斷學習積累,不斷進化的過程。因此,強化學習更接近生物學習的本質,也是有望讓機器獲得通用智能的一項技術。

      圖片描述
             DeepMind利用強化學習技術在迷宮遊戲中執行搜索任務(圖片摘自網絡)

  本文選自《深入淺出深度學習:原理剖析與Python實踐》,點此鏈接可在博文視點官網查看此書。
                       圖片描述
  想及時獲得更多精彩文章,可在微信中搜索“博文視點”或者掃描下方二維碼並關注。
                         圖片描述

最後更新:2017-05-27 10:01:56

  上一篇:go  如何在 Linux 中讓 sudo 密碼會話的超時更長些
  下一篇:go  vmstat:一個標準的報告虛擬內存統計工具