閱讀925 返回首頁    go 阿裏雲 go 技術社區[雲棲]


了解人工智能之基礎概念-基本概念問答

在關注了機器學習一段時間以後,最近我開始投入到這個領域的研究中。 去年,我開始學習自然語言處理的相關知識,並撰寫了一些這方麵的文章。 同時我開始更廣泛地接觸機器學習理論,並主要專注於文本理解和文本處理。周圍一些對人工智能有興趣的朋友和同事時常會問我一些相似的問題,而我盡可能地就我所知道的給予他們回答。因為在理解以及真正運用那些高深的數學知識之前,還要具備一些必要的基本概念。因此我也越來越意識到普及這些基礎知識的重要性和必要性。


“人工智能,機器學習,神經網絡,深度學習,到底有啥區別”,這是我常常被問及的一個話題。人工智能,機器學習,神經網絡,深度學習,它們是具有不同含義的四個術語。不過人們往往把它們交替使用。 就我的理解,這樣的互換在大多數情況都沒有太大的錯誤。不過準確的區分它們可以幫助我們了解行業的現狀與發展方向。


人工智能(AI-Artificial intelligence )就是讓計算機幫助人類解決問題,它可以被看成是這個領域的總稱。 我將它區別於軟件工程。在軟件工程中,我們更專注於如何編程,從而讓計算機執行某項任務。在今天,人工智能幾乎包含現實世界的方方麵麵,毫不誇張的說人工智能已經無處不在了。隨著現代化帶來的便利,有些已經被我們習以為常的事物,已經不會被大家當成是人工智能了。比如,路徑導航,聯想輸入,全文搜索等,這些我們日常生活中常常用到的功能,在幾十年前它們就屬於人工智能的研究方向。而現在,這些技術隻是被當成理所當然的了。(動物研究中也有類似的趨勢,“能夠使用工具”曾經被認為是智人的定義之一,但是當我們發現“章魚也能打開罐子”或者“烏鴉竟能解決字謎”時,智人的這個標準也隨之被提升。同樣,我們也可以認為人工智能主要是專注於那些計算機還不能熟練解決的問題。)


機器學習(Machine Learning)我們可以把它看作人工智能的一個子集。 其中的核心是“學習”,而不是通過人來教會機器完成某項工作。機器學習係統是通過大量的樣本對計算機進行訓練,從而使機器獲取解決問題的能力,而不是直接告訴機器解決某個問題的方法。

我們可以把訓練機器學習係統比作教小朋友學習:我們提供許多例子來對兒童進行訓練,並給他們足夠的反饋信息,讓他們知道是對還是錯。 一個更好的類比是訓練警犬 - 特別是訓練它們做一些人類能力範圍之外的任務,比如甄別炸彈等危險品。 我們對警犬進行很多的訓練,但是我們並不能準確地告訴它們如何做。我們能做的隻是每當他們找到目標以後,給予相應的獎勵。之後,它們就知道了哪些特征對它們來說是可以獲得獎勵的,而這些反饋的結果等同於“找到了炸彈”。

在機器學習之前,人工智能(那時人們通常稱其為專家係統)可能已經很“聰(wan)明(shan)”了,但其背後的工作原理是我們已經明確地告訴它們一切必要的知識。 專家係統就好比對照著一份龐大的列表清單來進行工作。我們不可否認,使用這樣的清單是非常有效的決策方式,但是構建這樣一份完備的清單是非常耗時的。同時這類清單隻能狹隘地解決一個特定領域的問題:比如診斷某一類疾病或對某種型號的飛機進行安全檢查。

而在沒有指導的情況下提取相關特征的能力是機器學習革命性的核心。 通過建立一組僅能由機器識別的特征,機器學習係統就能用這些特征對目標示例進行泛化。比如,通過一組貓的圖片與狗的圖片讓機器學習進行學習,提取貓與狗的不同特征,從而構建出分類網絡。這個分類網絡就能夠對測試圖片(未識別過的新圖片)進行相同的任務,分辨出圖片中的是狗還是貓。就目前的發展來看,我們完全可以將機器學習和人工智能劃上等號。 雖然專家係統和類似的一些方法仍然有其存在的意義,但我們已經不把它們稱為人工智能了,就像前麵提到的門檻已經變高了。

神經網絡(Neural networks)是目前實現機器學習比較有效的方法之一。雖然現在“神經網絡”的熱度很高,但機器學習並非一定要使用神經網絡,使用其他看似普通的架構也能達到不錯的效果。如果沒有一點相關的知識,想要解釋清楚到底什麼是神經網絡是有難度的,而我在這個係列之後的文章中會有涉及具體的細節。 概括的說,神經網絡是由非常簡單的組件組成的複雜係統,它們將單個任務分解成多個子任務進行學習。某種程度上來說神經網絡是借鑒了真正的神經元的工作模式,但我認為從長遠來看,人工智能係統遠達不到真正的人腦能力。就像飛機的翅膀模仿的是鳥類,但目前飛機的翅膀遠遠達不到鳥類翅膀的功能。

深度學習(Deep learning是指一類神經網絡。 它有著特定的技術含義,但如今也成了這個領域的流行語。 這裏指的是網絡架構具有多層結構。(三層我們就稱為“深”。而一層,我們則稱之為“淺”)。 實際工作中,我們發現深層網絡可以比單層網絡能更有效地進行學習和推理。通過將虛擬神經元堆疊成層次結構,我們可以表現更多樣本的特征。




這裏是一些關於人工智能的描述,它們能幫你在與朋友們閑聊人工智能時建立一點信心:

  • 機器學習是一種人工智能,它的核心是通過大量的樣本學習來發現其中的某些模式。
  • 人工智能係統既可以是授以於魚(直接告訴答案),也可以是授以於漁(解決問題的方法)。或兩者兼而有之。
  • 目前大量的機器學習係統是基於神經網絡的,他們利用數以百計的工作單元協同工作來解決問題。
  • 深度學習係統是神經網絡結構的最新研究進展,通過深度學習,計算機可以提取出複雜的特征,這種能力有時會超過人類專家。

請參閱該係列第二篇:人工智能之分類與預測

本文由北郵@愛可可-愛生活老師推薦,@阿裏雲雲棲社區組織翻譯。

文章原標題《AI Literacy: The basics of machine learning simple

作者:

譯者:friday_012 審閱:

文章為簡譯,更為詳細的內容,請查看原文

最後更新:2017-08-13 22:25:43

  上一篇:go  Navigate.重器| 新華三集群路由器出“大招”
  下一篇:go  Spring MVC學習筆記之Hello World