閱讀715 返回首頁    go 微軟


科學效法自然:微軟研究人員測試AI控製的滑翔機

近日,微軟研究團隊的兩名成員Jim Piavis和Rick Rogahn在內華達州霍桑的小型機場內進行了一項“無限滑翔機”的飛行試驗,他們希望能夠創建一個係統,借助人工智能,讓滑翔機像鳥類一樣,自主發現和捕捉自然產生的熱氣流,在無須馬達的情況下停留在空中

微軟首席研究員Ashish Kapoor表示:“鳥類之所以能夠在空中實現飛行和停留的無縫銜接,最重要的就是借助自然的力量。他們僅憑花生米那麼小的大腦就做到了這一點。”

鳥類能夠本能地做到在空中停留,但對於一台機器而言,則需要一套複雜的AI算法,以識別氣溫、風向和禁飛區域等要素。同時,係統必須使用其他AI手段來分析這些信息,並實時預測下一個可以利用的熱氣流。總而言之,這比人們目前所使用的照片人臉識別和語句單詞識別等大多數麵向單一任務的AI係統要複雜得多,它可能是少數在現實世界中運行的不僅要進行預測而且還要根據預測結果采取行動的AI係統之一。

目前,無限滑翔機仍在開發當中,但最終它可以用於執行各種實用任務,例如監測農村地區的農作物生長,或者在條件艱苦地區提供移動互聯網服務等。Kapoor說:“有朝一日,它可能成為你的移動通信信號塔,你不再需要任何地麵基礎設施。”滑翔機最終甚至可以使用太陽能或風力發電獲得能源,理論上可以無限期地在空中停留。

現實世界中的AI:零錯容忍

自主滑翔機本身就已經大有用武之地,但負責項目研究及工程開發工作的微軟研究員Andrey Kolobov表示,他們希望這項研究還可以應用於大量其它依賴人工智能且日益複雜的係統,並將能夠在真實而不可預測的環境中運行。“對於我們而言,這架滑翔機是一個技術測試平台,用於測試未來十年內任何智能係統的核心技術。”

對於那些依靠AI來幫助駕駛汽車、保護住宅安全或管理繁忙日程的人而言,這些係統必須根據交通流量、噪音、天氣等變量,甚至包括人類情感等其它條件,能夠當場做出可靠的複雜決策。更重要的是,它們決不能犯那些會引發重大損失和潛在危險的錯誤。在研究領域中,這種能力被稱為在不確定性條件下進行序貫決策。

Kolobov說:“現實世界中的AI不允許有犯錯誤的餘地——就像我們的滑翔機一樣。真正的問題在於‘你如何提前幾步規劃未來?’從計算科學的角度上看,這是一個非常困難的問題。”

理論付諸行動:有效模型+有效手段

本次實驗中測試的滑翔機依靠電池來運行機載計算設備和方向舵以及與地麵聯絡的無線電台等控製係統。它還備有一台馬達,以便飛手可以在必要時接管,進行手動操作。但是在設計上,一旦升空後,它就應該自主運行,發現和利用熱氣流飛行,不需要馬達或人工幫助。Kolobov說:“我們要做的是確保滑翔機完全自主運行,而且足夠聰明,能夠改變飛行方向。”

為了設計這套係統,研究團隊從一個框架入手,來解決一個被稱為“部分可見馬爾可夫決策過程”的問題。Kolobov曾與他人共同撰寫了一本關於馬爾可夫決策過程的書,他說,這是一個旨在無法了解所有信息的情況下做出規劃決策的模型。通過滑翔機實驗,團隊將這個模型與另一種AI手段(貝葉斯強化學習)相結合,開創了一種新方法,能夠讓係統盡快掌握其所處環境所需的信息,以便做出正確的決策。團隊還使用了“蒙特卡羅樹型搜索”的方法來尋求最優方案。

從左至右:Debadeepta Dey、Andrey Kolobov、Rick Rogahn、Ashish Kapoor、Jim Piavis

滑翔機的AI係統可分為兩部分:高級規劃器和低級規劃器。高級規劃器將所有的環境因素納入考慮,並嚐試製定一項策略,以便讓滑翔機知道應該去哪裏尋找熱氣流。隨著時間推移,飛行器將能夠根據每次升空所收集的信息,做出更好的預測。Kolobov說:“對於高級規劃器而言,經驗十分重要。係統今天的表現會比昨天更好,因為它(在決策中)納入了既往飛行的信息。”

低級規劃器部分可以說是“在實幹中學習”,它使用貝葉斯強化學習方法,根據滑翔機傳感器發回的數據實時偵測和鎖定熱氣流。

實測:與模擬截然不同的全新體驗

團隊在微軟位於華盛頓州雷德蒙的園區辦公室內花了好幾個月時間創建這些AI算法。隨著天氣轉暖、熱氣流狀況越來越好,該團隊在公司總部附近的農場進行了受限飛行測試。然而,直至8月中旬他們來到內華達州霍桑的那座小型機場,才真正有機會見證他們的各項理論在現實世界中的表現如何。

在滑翔機飛行過程中,研究員們開著一輛敞篷吉普和一輛加長SUV在地麵實時跟蹤。坐在吉普車上的同事們用肉眼觀察滑翔機的位置。而研究實習生Iain Guilliard和Sangwoo Moon(兩人都參與編寫了驅動係統的核心算法)則在SUV裏使用四台筆記本電腦跟蹤滑翔機動向,並監測它如何利用包括熱氣流在內的各項條件,每隔幾秒鍾,Guilliard就會大聲報出滑翔機的飛行參數。而編寫了滑翔機熱氣流預測模塊的微軟研究員Debadeepta Dey,和Kolobov輪流駕駛著這輛SUV,作為移動辦公室,緊跟在吉普車和滑翔機之後。

從左至右:Kolobov、Iain Guilliard 、Sangwoo Moon

除了捕捉熱氣流之外,係統還需要規劃自身飛行路線,以躲避某些障礙,例如附近的山脈、大型湖泊以及美國陸軍在試飛地點附近地區的數十個彈藥存放點。現實世界環境的複雜,以及在辦公室裏無法預測的各種障礙,為這個係統提供了完美的測試場所。

事實上,他們遭遇的許多問題與AI並沒有任何關係。例如,接受測試的最大的一台滑翔機就遇到了通信係統故障,研究團隊懷疑是因為道路灰塵中的磁性顆粒導致了電子部件損壞。在一次測試中,滑翔機馬達出現了故障,他們試圖用彈力繩將滑翔機拴在汽車上進行發射時,彈力繩又斷了。

每遇到一次挫折,團隊都會耐心地設法找到解決方案:修理馬達、連結彈力繩、尋找新電池組、當一架滑翔機無法繼續服役時就拉出另外一架……Kolobov說,正是現實世界中的這些問題才吸引了如此眾多的人來參與這個項目。這也是為什麼他們不會因為遇到每一個意想不到的挫折而氣餒的原因。

“現實與模擬不同,”Kolobov說:“這是我們到這裏來的原因。我們來到這裏學習,盡管現在學到的並不一定符合我們最初的期望,但仍然非常值得。”

“算法比我還厲害

8月11日,團隊在霍桑機場進行了最後一次匯報。在大約一小時前的最後一次試飛中,剛開始,算法完全按照預期方式完成了預定任務,將滑翔機送上了藍天,但隨後電池組意外失效,滑翔機以驚人的速度俯衝向地麵。作為人類飛手的Rogahn在最後時刻重新獲得滑翔機的操控,在飛行器距離地麵隻有幾英寸的時候避免了墜毀。

“在室內戴牛仔帽並不禮貌,但剛才的經曆讓我覺得自己已經馴服了幾頭公牛,”Rogahn在作匯報時說道。盡管如此,他還是摘下帽子,認真地表示:“今年夏天,我們還是達到了這樣一個境界——AI算法已經比作為滑翔機飛手的我更厲害了。”

你也許還想看:

999,990曆史最高分!看微軟AI如何把“吃豆小姐”玩通關

Project Emma:讓帕金森病患者重拾書寫、繪畫能力

微軟開源的這個係統能讓無人機等裝置安全地自主航行

如果您覺得,自己在微軟某項技術上實踐的特別好,不講可惜;

如果您覺得,自己工作中的某些場景使用了多種微軟技術,是行業裏麵最棒的解決方案,不講可惜;

如果您覺得,自己對微軟的某項黑科技特別有心得,不講可惜!

微軟小冰進駐微軟研究院微信啦!快去主頁和她聊聊天吧。

最後更新:2017-08-25 00:17:07

  上一篇:go 1995年8月24日:微軟正式發行Windows 95作業係統
  下一篇:go 微軟MR頭盔HoloLens或失敗停產 進入中國僅三個月