閱讀145 返回首頁    go 阿裏雲 go 技術社區[雲棲]


有人研究出了AI支持操作係統,據說可以讓AI開發變得像Excel簡單上手

嚴格的說,Scot Barton似乎不像是一名人工智能先驅。他並沒有在建造自動駕駛車輛,也沒有訓練電腦如何在電腦遊戲中擊敗人類。但是值得注意的是,在其所就職的農夫保險公司(Farmers Insurance)裏,他正在為某技術開創道路。

Barton領導著一個分析數據的團隊,主要回答關於客戶行為和不同政策設計等問題。從深層神經網絡到決策樹,他的團隊現在正在使用各種尖端的機器學習技術。但是Barton並沒有雇用一批人工智能魔法師來實現這一點。他的團隊使用了一個被稱為DataRobot的平台,它可以將所涉及的很多困難工作自動化。

未來幾年人工智能會如何發展。除了阿爾法狗令人歎為觀止的表現,人工智能確實也正在改變整個行業。但有一點我們是需要注意的,有必要讓AI從總體上變得更加易於使用。

問題是,現有的人工智能技術涉及到的許多步驟目前都需要大量的專業知識。而且,這不像是在表麵上搭建一個友好的界麵那麼簡單,因為工程師們在編寫和調整代碼的時候經常需要進行判斷並需要使用到專門的技術。

但是,人工智能研究人員和公司正在通過將這項技術應用於自身來解決這個問題,利用機器學習將人工智能算法開發中棘手的問題自動化。一些專家甚至建立了相當於人工智能支持的操作係統,旨在使該技術的應用程序與今天的微軟Excel一樣簡單易用

DataRobot是朝著這個方向邁出的一步。你提供原始數據,平台對其進行自動清理並重新格式化。然後,它一次運行數十種不同的算法,並對其性能進行排名。Barton首先通過輸入一堆保險數據來查看是否可以預測特定的美元價值的方法來嚐試使用這個平台。與標準的手工統計方法相比,所選擇的模型的錯誤率降低了20%。他表示,“開箱即用,按一個按鈕;這實在是非常令人印象深刻。”

人工智能技能缺口

今年六月,谘詢公司麥肯錫發布了一份報告,披露了人工智能應用的現實。這份報告的結論是,人工智能——特別是機器學習,可能會徹底改變包括製造業、金融業和醫療保健行業在內的大型行業,到2025年可能會在美國經濟中總共占到1260億美元的規模。但是,報告有一個嚴重的警告:關鍵人才的短缺。

培養盡可能多的人使用人工智能當然是非常有幫助的。但是這需要時間,而且不是每個人都能成為人工智能大師的。對於任何一種技術來說,要想最大限度地發揮它的影響,就要讓它能夠盡可能方便地被使用。隻有當人工智能能夠滲透進入普通的辦公室和工作場所,才能實現這一點。DataRobot已經被用於一些這樣的場合了。

看看如何在了解之前就成為人工智能大師吧

一天下午,坐落於波士頓金融區的DataRobot辦公室空蕩蕩的,一大批工程師圍著一台大型顯示器亂轉。該公司的谘詢師Jonathan Dahlberg給我做了一個演示,該公司的解決方案真的是令人印象深刻。他加載了一個貸款申請和付款的公共數據集,然後他讓係統開發出一堆模型,看看關於為什麼人們會違約是否有什麼模式。

幾秒鍾後,屏幕上出現了數十種競爭算法;在頂部是一種被稱為XGBoost的、相對無趣但被廣泛使用的梯度提升技術。很快,屏幕上就顯示申請人的收入特別重要,但他們想要貸款的原因也是如此。它發現,在申請中提及“創辦企業”的人是一個特別糟糕的群體。

Dahlberg表示,DataRobot可能會在專業知識和技能方麵,與一個非常好的數據科學家旗鼓相當,但它可以提供更廣泛的視角。一個人可能會太依賴某種技術,而DataRobot可以自動地找到一種從根本上更好的方法。用戶還可以使用Python或R編程語言手動修改底層算法。不經過仔細的檢查,很難知道該係統在自動化數據科學的一些棘手問題方麵到底做得如何,如數據清理和功能工程,但它似乎對付了一個驚人的數量。

該公司的首席執行官Jeremy Achin在觀看了《社交網絡》(《The Social Network》)之後備受激勵,萌生了想要創辦一家企業的想法,當我們在麻省理工學院附近的咖啡館會麵時,他承認當時還有點懦弱。但是,他在數據科學比賽中獲得了DataRobot的靈感,這些競賽是由眾包平台Kaggle舉辦的,該平台在今年早些時候被穀歌收購了。Kaggle為從大型數據集中進行特定預測時表現最佳的算法提供獎品。這一任務通常涉及開發一種機器學習算法,用於對數據進行處理。作為Kaggle最早的參賽選手之一,Achin意識到自己已經在每場比賽中自動化了很多步驟。 他表示,“我認為,如果我們收集了足夠多的數據集,足夠多的問題,並且運行了足夠多的實驗,我們就可以在機器學習上進行機器學習。這是就是最初的想法。”

這個想法顯然引發了投資者的共鳴。DataRobot自2012年創辦開始,已經籌集了超過1億美元,其中包括今年3月份籌集到的5400萬美元,與此同時,Kaggle被穀歌收購了。該公司表示目前已經擁有一百多個客戶。Achin表示,這個概念在很多數據科學家那裏並不是那麼受歡迎,他們要麼認為自己的技能無法被自動化,要麼則是擔心這些技能會被自動化。但是他相信,對絕大部分企業來說,如果想要使用人工智能,就沒有別的選擇。他表示,“我不在乎有多少人在LinkedIn上將他們的頭銜改為‘數據科學家’”。他表示,“你不會有很大改觀。”

自我學習係統

數據科學家的短缺激發了許多其他的人開始致力於自動化機器學習方麵的工作。越來越多的研究論文正在使用技術將越來越多人工智能方麵的工作自動化。

穀歌是全球最大的玩家之一,該公司也將注意力轉向了這個想法。穀歌已經大筆投入,開發了強大的人工智能算法並將其部署到其服務中。但該公司也熱衷於為其雲服務添加更多的人工智能。除了簡單的圖像或文本分類工具之外,還意味將更多機器學習模型訓練工作自動化。

負責領導穀歌人工智能工作的計算機工程師John Giannandrea表示:“目標是使這項技術更易於使用” 。他表示,“然後任何人都可以說‘為我建立一個預測模型’,然後它就會去做一個模型。”

看看如何在了解之前就成為人工智能大師吧

今年早些時候,該公司宣布了圍繞著這一目標的一些重大進展,展示了一種能自動化地調整深度學習神經網絡的實驗性的方式。 這些可能是最強大的機器學習算法,它們顯著提高了圖像和語音識別領域的最高技術水平。但它們也很難工程化。Giannandrea表示,這項工作正在產生一些非常有希望的結果,在某些情況下與手動開發的係統的性能不相上下。 而且他希望穀歌能夠在未來幾個月內發布更多的結果。

其他人甚至還做出了更宏大的設計。例如,卡內基梅隆大學教授Eric Xing正在開發相當於是由不同機器學習組件構建的操作係統。該操作係統使用虛擬化和機器學習來抽象設計和訓練人工智能工作中的大部分複雜性。它甚至配備了一個圖形用戶界麵,可用於訓練特定數據集上的機器學習模型。

Eric Xing在中國受過教育,並在加州大學伯克利分校(UC Berkeley)與Andrew Ng一起學習,他現在是世界知名人士的知名人物。他非常有禮貌,而且令人意外的是,他想要改變人們使用電腦的方式。Eric Xing設想他的人工智能操作係統會非常簡單易用,就像微軟的電子表格軟件——Excel一樣。他表示,“這是整個人工智能行業的核心問題”。他表示,“進入的門檻太高了。”

Eric Xing已經創辦了一家公司——Petuum,來開發這個操作係統,並且已經開發了一係列工具,旨在將機器學習引入醫學領域。他表示,“醫生需要一個界麵和醫療記錄、圖像——每一種圖像都需要不同的機器學習方法。” Petuum正在加緊準備發布平台。

Petuum的操作係統和其他一些人工智能自動化工具將麵臨一些獨特的挑戰。已經有關於機器學習算法無意中吸收了訓練數據的偏差的擔心出現,而有些模型太不透明,無法進行仔細檢查(參見《人工智能核心中的黑暗秘密》“The Dark Secret at the Heart of AI”)。如果人工智能變得更加容易使用,這些問題可能會變得更加廣泛和更加根深蒂固。

微軟高級研究員Rich Caruana表示:“要想把機器學習做得很好,你需要博士學位和大約五年的經驗。”他表示,“有很多陷阱。您的算法是否在六個月後過期,它是否可以解釋?”

數據科學家為防範這些問題而必須采取一些步驟,Caruana相信這些步驟中的一部分應該是有可能自動化的——這類似於飛行員在飛行前的檢查清單。但是他對於過分地信任承諾自動化一切的係統心存警惕。他表示,“我知道這一點是因為一路走來,我一直磕磕絆絆。”


原文發布時間為:2017年10月20日

本文作者:孫博

本文來自雲棲社區合作夥伴至頂網,了解相關信息可以關注至頂網。

最後更新:2017-11-14 15:04:43

  上一篇:go  人工智能將會改變IT服務管理的三種方式
  下一篇:go  這個雙十一,阿裏視頻雲帶你去狂歡