閱讀553 返回首頁    go 阿裏雲 go 技術社區[雲棲]


DeepTraffic: 如何讓MIT的遊戲利用深度學習來減少交通阻塞

cover

大家都對交通阻塞深惡痛絕。除了讓人頭疼和錯過約會之外,交通擁堵讓美國的司機每年多花3000億美元

研究人員建議大家使用自動駕駛汽車,即使數量占比並不大,但也能大大改善交通擁堵情況。 Lex Fridman和他的MIT團隊開發了一款模擬遊戲來加速實現這個未來。

DeepTraffic模擬的是典型的公路環境,玩家使用深度學習技術來控製自己的汽車。這款模擬遊戲讓初學者也能接觸並使用複雜的技術概念,同時也推動專家們去開發全新的技術。

采用神經網絡的交通遊戲

假設你在洛杉磯一條擁擠的高速公路上開車。你必須確定好你與前車之間的距離、何時變道,以及如何避免撞到其他車輛。這就是所謂的路徑規劃。有了DeepTraffic,任何人都可以設計和訓練一個深度神經網絡來實現上麵這些功能。

上個月在矽穀舉行的GPU技術大會(GTC)上,Fridman講述了這款建立在強化學習之上的遊戲的設計原理。它通過對神經網絡完成指定動作進行獎勵來實現AI。通過反反複複的訓練和獎勵,神經網絡最終學會如何運行。

在這個遊戲中,神經網絡控製一輛紅色的汽車在一條擁擠的高速公路上行駛,它的目標是盡可能快地通過公路。初學者可以在瀏覽器中使用JavaScript來控製參數並改變汽車的行駛。而高級玩家可以使用OpenAI Gym訪問DeepTraffic,並可通過OpenAI Gym提供的任意Python接口對網絡進行訓練。

1
極速賽車手:DeepTraffic玩家使用深度學習來快速行駛。

DeepTraffic最初是Fridman在MIT為了給學生上課而開發的。當課程內容和這款遊戲向公眾開放時,受到了大家的熱烈歡迎,迄今為止已經有12000人次提交了他們的模型。在遊戲排行榜上記錄了車速最快,同時也是神經網絡速度最快的選手的名單。

遊戲的樂趣來自於玩家之間的競爭,而現實世界的獎金要高得多。自動駕駛車輛必須要為到達目的地規劃一條安全的路徑,這個過程相當的複雜,必須要用到AI。而像DeepTraffic這樣的教育工具既有助於培養AI開發人員,也能讓改變汽車生態係統的解決方案湧現出來。

你可以在這裏找到Fridman在GTC上的完整的演講(包括PDFMP4)。通過這個演講,你還能了解到路徑規劃的層次結構、強化學習的優缺點,以及有關DeepTraffic網絡訓練的技術細節。

相關鏈接

作者:Danny Shapiro

Danny Shapiro是NVIDIA汽車高級總監,專注於設計汽車解決方案,擁有普林斯頓大學的電氣工程和計算機科學學士學位,以及加州大學伯克利分校哈斯商學院的工商管理碩士學位。

本文由北郵@愛可可-愛生活 老師推薦,阿裏雲雲棲社區組織翻譯。

文章原標題《DeepTraffic: How an MIT Simulation Game Uses Deep Learning to Reduce Gridlock》,作者:Danny Shapiro,譯者:夏天,審校:我是主題曲哥哥。

文章為簡譯,更為詳細的內容,請查看原文

最後更新:2017-07-12 22:12:11

  上一篇:go  Centos下YUM安裝PHP的兩種方式
  下一篇:go  阿裏雲推薦碼2017年7月再次從新激活使用!