DeepTraffic: 如何讓MIT的遊戲利用深度學習來減少交通阻塞
大家都對交通阻塞深惡痛絕。除了讓人頭疼和錯過約會之外,交通擁堵讓美國的司機每年多花3000億美元。
研究人員建議大家使用自動駕駛汽車,即使數量占比並不大,但也能大大改善交通擁堵情況。 Lex Fridman和他的MIT團隊開發了一款模擬遊戲來加速實現這個未來。
DeepTraffic模擬的是典型的公路環境,玩家使用深度學習技術來控製自己的汽車。這款模擬遊戲讓初學者也能接觸並使用複雜的技術概念,同時也推動專家們去開發全新的技術。
采用神經網絡的交通遊戲
假設你在洛杉磯一條擁擠的高速公路上開車。你必須確定好你與前車之間的距離、何時變道,以及如何避免撞到其他車輛。這就是所謂的路徑規劃。有了DeepTraffic,任何人都可以設計和訓練一個深度神經網絡來實現上麵這些功能。
上個月在矽穀舉行的GPU技術大會(GTC)上,Fridman講述了這款建立在強化學習之上的遊戲的設計原理。它通過對神經網絡完成指定動作進行獎勵來實現AI。通過反反複複的訓練和獎勵,神經網絡最終學會如何運行。
在這個遊戲中,神經網絡控製一輛紅色的汽車在一條擁擠的高速公路上行駛,它的目標是盡可能快地通過公路。初學者可以在瀏覽器中使用JavaScript來控製參數並改變汽車的行駛。而高級玩家可以使用OpenAI Gym訪問DeepTraffic,並可通過OpenAI Gym提供的任意Python接口對網絡進行訓練。
極速賽車手:DeepTraffic玩家使用深度學習來快速行駛。
DeepTraffic最初是Fridman在MIT為了給學生上課而開發的。當課程內容和這款遊戲向公眾開放時,受到了大家的熱烈歡迎,迄今為止已經有12000人次提交了他們的模型。在遊戲排行榜上記錄了車速最快,同時也是神經網絡速度最快的選手的名單。
遊戲的樂趣來自於玩家之間的競爭,而現實世界的獎金要高得多。自動駕駛車輛必須要為到達目的地規劃一條安全的路徑,這個過程相當的複雜,必須要用到AI。而像DeepTraffic這樣的教育工具既有助於培養AI開發人員,也能讓改變汽車生態係統的解決方案湧現出來。
你可以在這裏找到Fridman在GTC上的完整的演講(包括PDF和MP4)。通過這個演講,你還能了解到路徑規劃的層次結構、強化學習的優缺點,以及有關DeepTraffic網絡訓練的技術細節。
相關鏈接
- MIT用於自主駕駛車輛的深度學習課程
- DeepTraffic遊戲
- Fridman在GTC上演講的PDF和MP4
- GTC上有關車輛的會議資料
作者:Danny Shapiro
Danny Shapiro是NVIDIA汽車高級總監,專注於設計汽車解決方案,擁有普林斯頓大學的電氣工程和計算機科學學士學位,以及加州大學伯克利分校哈斯商學院的工商管理碩士學位。
本文由北郵@愛可可-愛生活 老師推薦,阿裏雲雲棲社區組織翻譯。
文章原標題《DeepTraffic: How an MIT Simulation Game Uses Deep Learning to Reduce Gridlock》,作者:Danny Shapiro,譯者:夏天,審校:我是主題曲哥哥。
文章為簡譯,更為詳細的內容,請查看原文
最後更新:2017-07-12 22:12:11