閱讀654 返回首頁    go 微軟 go windows


城市大腦入選國家新一代人工智能開放創新平台,阿裏iDST副院長華先勝技術解讀

11月15日,科技部召開新一代人工智能發展規劃暨重大科技項目啟動會,公布了首批國家新一代人工智能開放創新平台名單,阿裏雲城市大腦與百度自動駕駛、騰訊醫療影像和訊飛智能語音入選。

阿裏雲城市大腦項目始於2016年,旨在以攝像頭為核心進行數據采集與計算,對整個城市進行全局實時分析,自動調配公共資源,修正城市運行中的Bug,提升城市運行的效率和質量。現在,城市大腦已經成功落地杭州、蘇州等地,解決了很多實際難題,並在2017杭州雲棲大會上交出了一份漂亮答卷:經過一年測試,城市大腦成功接管了杭州128個信號燈路口,試點區域通行時間減少15.3%,高架道路出行時間節省4.6分鍾。此外,在主城區城市大腦對交通事件進行智能報警,日均事件報警數達500次以上,準確率達92%,大大提高了執法指向性,在蕭山區,120救護車到達現場時間縮短一半。

在新智元AI World 2017世界人工智能大會上,阿裏巴巴Distinguished Engineer/VP、阿裏iDST研究院副院長華先勝博士以《城市大腦 - 超級人工智能應用和創新平台》為題,結合應用實例,從整個城市的數據,到數據的感知認知,再到決策、優化、搜索、挖掘、預測和幹預,一條鏈路下來,係統展示了城市大腦的定位、目標以及價值體現。

華先勝說,城市大腦是一個人工智能、雲計算、大數據等方麵的綜合項目。不僅如此,今天看來城市大腦是一個項目,下一步就成為可以批量複製的產品,再將來可能成為平台。城市大腦初期,雖然經常被質疑,但從未被否定,而且一直在進展,下麵就是阿裏城市大腦過去一半年的工作比較全麵的展現。

1cb2ee405df1a823427b34732d5fc1d92536bcd4

華先勝:大家好,很高興有機會來和大家一起分享“城市大腦”。城市大腦是一個人工智能、雲計算、大數據等方麵的綜合項目。今天它是一個項目,下一步很快就會一個可以批量複製的產品,再將來可能就是一個平台。

城市大腦這件事情是從2016年3、4月份的時候由阿裏巴巴技術委員會主席王堅博士首次提出來的,那時候很多人覺得這件事很不靠譜。但是,經過一年多的時間,我們已經把一個看起來不靠譜的事情做到靠譜,讓大家看到了它的價值的體現。

項目背景:深度學習×計算力×數據,萌生給城市安裝大腦的想法

首先一分鍾時間來回顧一下我們在什麼背景下做了這個項目。大家知道人工智能有三個黃金階段,前兩次最後發現隻是一個夢想,今天是第三次,但這次有什麼不同?會不會和前兩次一樣,仍然會是個夢想。這次黃金階段其實有四個不同點,第一是有深度學習技術,尤其是在視覺領域,深度學習基本上打敗了過去所有的方法;第二是今天有非常強大的計算能力,第三是易於獲取的各種各樣的數據。

第四點,在上麵三點的基礎上,我們在很多領域都看到了很多AI的成功應用,包括搜索引擎,以及我們做過的拍立淘、人臉識別、商品推薦等等——今天的AI推薦係統甚至比你自己都更了解你想要什麼。

cdf675ca248c97b5c487914a519ae12c35c49939

些技術發展到今天,讓我們開始想,是不是可以去為城市的數據安裝一個大腦,把城市數據的價值挖掘出來。這件事情反過來會給AI的發展帶來什麼,我們到最後再來探討。

從宏觀來講,在一萬尺的高空看,城市大腦到底是什麼樣的?城市是一個大量異構數據的聚合體,每天都在不斷地積累大量的數據。其中一類很重要的數據是視覺數據,中國的城市裏有大量的攝像頭,成千上萬的攝像頭24小時都在看著這個城市,這些數據的價值到底在哪裏?難道僅僅是交通處罰和記錄車牌?

現在有了強大的計算能力,有了今天的AI技術,是不是可以重新思考這個問題,把城市數據的價值充分地挖掘出來,讓這些數據產生不可替代的價值,改變我們管理城市的方式,改變我們的生活方式,從而改變這個世界。

城市大腦:經常被質疑,從未被否定,一直在進展

2854e19b098f5277dd9df64885c5bcf6bb24a254

我們當時開始這個項目的時候其實有很多的挑戰,不外乎三個關鍵詞:Cost, Value和Difference:第一是它的代價,處理這個城市的視頻數據的代價是否能夠承受, 我們能不能夠做出來?因為我們需要處理整個城市的視頻,處理大量的計算,今天的AI技術、視覺計算的技術,是不是可以把整個城市的信息充分地感知,充分地分析和決策,這些方麵還有很多的挑戰;第二是能夠產生的價值是否值得這個付出;第三點,過去做智慧城市、視頻監控,以及近期在講的“邊緣計算”,跟我們今天做的有什麼不一樣?最開始我們跟杭州政府合作,杭州市希望我們把它叫“智慧城市”,我們不同意。希望我今天講完之後,大家能夠明白這裏麵有什麼不一樣。

我前段時間跟高層匯報時把城市大腦項目的狀態總結成三句話,叫做“經常被質疑,從未被否定,一直在進展”。我們一起看看,我們到底有什麼樣的進展。

7efac60cbca77db6878e3559ce21cbc95d08c1ad

我們稍微靠近點看,從100尺的距離看,城市大腦是什麼東西?首先,有大量的數據,不隻是視覺的數據,當然今天我們以視覺的數據為主來講它。這些數據來了以後,我們首先要理解這些數據,尤其是視覺的數據。其他的數據,比如GPS數據,拿來做點降噪等處理就能用了,但視覺的數據拿到的是像素,所以第一步要先認知,有了比較全麵的認知以後,第二步才是基於這些數據去做決策。

先看第一步認知,比如我們要知道路上有什麼車,有多少人,車和人的行為是什麼樣,交通狀況是什麼樣,有沒有交通事故發生等等。第二步進行決策,有些直接基於視覺感知的結果就可以進行決策的,比如有交通事故的發生,有擁堵發生,馬上就可以進行對應的處理。另一些更深層的決策是基於曆史和現在的大數據,比如紅綠燈的優化,交通的管控,交通流量的改善等等。再下一步,第三步搜索和挖掘,我們把視覺信息和其他信息放到一個索引裏,就像過去做商品的圖像搜索一樣,我們可以進行搜索、挖掘,比如針對嫌疑車輛,找出它前幾天在哪裏,現在在哪裏,活動軌跡是什麼樣的。

有了這些,我們就可以進行第四步的預測。舉個例子,很多GPS給你規劃路徑是沒有預測的,所以看上去這條路線最優,但是走著走著係統會推薦別的路線,這其實是沒有預測導致的。如果我們能知道十分鍾、二十分鍾、三十分鍾以後每個路口的交通狀況,就可以得出更好的路徑規劃,甚至對交通進行改善、疏導,這就是預測。

預測也可以是更長時間候的預測,例如,如果某個城市明天將會下大雨,還有幾個地方又大型的活動,那我們是可以估計出來明天這個城市在哪些路段會擁堵,哪些路段交通事故的頻率會大幅度增加。知道這些,我們可以提前分配人力、警力和醫療資源,從而能更高效應對將要出現的狀況。

第五步是幹預,幹預是建立在預測的基礎上的。可能大家看過一部電影,叫《少數派報告》,這個電影本身是有點反預知。而今天,如果我們能知道明天這個城市在什麼時間段、什麼地方可能有不好的事情發生,我們就可以提前做一些事情去預防這件事情發生,比如明天哪裏擁堵超過一個小時以上,哪個路段事故的概率增加三倍,我們就可以對交通出行進行指導,通過交通燈控製車流等,從而避免不好的事情的發生。

整個一條線下來,在交通和安全領域,我們可以把它看做城市真正有了一個大腦,大家可以看到為什麼我們把它叫“城市大腦”而不是“智慧城市”,因為我們有新的方式,新的功能,城市真的像有大腦一樣,運行變得更加智能。當然,整個城市大腦還有其他的內容,我們今天主要以交通和安全兩個角度來展開討論。

城市認知演進:希望做到三件事——全麵、全量和實時

14036b6ae7a0c5bbc67e8050f1cae32be79689c5

城市的認知有其發展的過程。最早城市是沒有認知的,如果發生了什麼事情,需要走訪,去問問大爺、大媽有沒有看到什麼人或什麼事情。後來開始有安防,安裝攝像頭了,但最初安防行業也不是一個高科技的領域,基本上就是裝攝像頭設備。後來有很多公司在攝像頭端做了一些智能的算法,這時候就開始有智能在裏麵了。

2016年,我們開始做城市大腦,我們希望做的事情有三個特點,我總結為全麵、全量和實時。

9fce2114c0f79bd810f053fb703886aa30a744c3

第一,全麵(Comprehensive)。因為AI技術的發展,我們可以對整個城市的感知、認知做得更加完善。比如對車輛的跟蹤、檢測、識別,車到哪裏去,車是什麼類型,要了如指掌。上麵這張圖展示了高點攝像頭圖像,雖然這種角度看不清車的細節,但是能大概知道城市裏車輛的數目,比如劃一個區域,就知道這個區域過了多少輛車,區域裏有沒有人經過,我們對整個城市人和車的移動就有了宏觀的把握。

31e13561802de1c96258c8a4ae917c6d6686f5f8

這個是通用的人、車、騎行人的檢測識別。我們希望能夠識別盡量多的不同尺度、不同光照條件、不同的視頻質量,就像上排最右邊這個視頻,即便是晃動的,我們一樣能夠做到非常精準的檢測和識別。

d7bb0d1e6841f9fb1b51a6276000bfd17dbebb33

還有城市裏的異常事件,比如交通擁堵或交通事故,我們都能及時了解,及時報告。很多交通擁堵是事故造成的,如果不及時處理會引發很多的問題。今天發現交通事故是靠人去報,不嚴重的吵吵十幾分鍾,嚴重的交通事故需要有人看見或者在攝像頭裏看見才行,而那麼多攝像頭,隻有很少的人在看。有了城市大腦,我們就能非常及時地發現這些交通事故,嚴重的交通事故我們可能因為能早發現而救人一命,一般的交通事故可以及時緩解因之引起的交通擁堵。

對於全量(Global)實時(Real-Time),更多是係統方麵的工作,也涉及到算法的效率。因時間關係,這裏就不細講了,大家隻要知道一點就可以了:我們的城市大腦是基於阿裏雲的計算平台來構建的。因為有阿裏雲大規模的計算平台,不管是實時的計算還是離線計算,有了這個計算平台,我們建立大規模視頻實時處理的平台就不是十分困難。決策和優化:以杭州交通係統為例

第二,有了這些信息以後,我們能做什麼?其中兩件事情,一是決策,一是優化。

e49fc751b6336c01f8791cce5768f838d02e25a8

杭州正在運行的係統,對城市的事件事故進行自動檢測和報警

我們看幾個例子,這是在杭州正在運行的係統,對城市的事故自動檢測和報警。每天都在產生實時報告,報告的結果會下放到各個交通大隊,各個交通大隊的人都在看,並根據不同情況采取不同的後續措施。

這幾個圖給了更多的例子,包括碰撞的事故,包括非機動車進入高架路,以及非法停車等等。現在都可以通過普通的攝像頭就可以進行實時的獲取,這些信息當然就會及時地送給警察,進行後續的處理。

a329c1a6dca3cb4a3be05340609b4fc957701069

普通攝像頭實時獲取城市交通數據,包括碰撞事故,非機動車進入高架道路、非法停車等

如果我們不僅僅知道單個的事件,還知道很多事件在同時發生,或者在同一個地點經常發生,比如說下麵這張圖顯示的兩個例子,實際上是兩個路口,這兩處都經常發生交通的擁堵事故和違章事件,這就反映出需要解決的問題。當時這個係統運行一段時間以後,就在杭州自動發現了六個點,交警處理之後情況得到了很大的改善。

b4ea6ac5360e6227ca7d0ec77ca615c0671c44c7

當然,有了全局的信息以後,我們就可以做紅綠燈的優化。以前紅綠燈的配置優化是通過地感線圈的信息去做的,很多細節不知道,而且線圈埋在地下容易壞。今天我們用攝像頭看,過了多少輛車,車的類型,車的走向……看得很清楚,還知道行人的信息,比如行人有多少,過紅綠燈要多少時間,等待了多長時間,而地感線圈、GPS是無法獲取這些信息。新的通過視覺收集到的信息可以放在交通優化模型裏,從而得到更準確的紅綠燈優化配置方案。

還有很多城市有禁止左轉的方法來改善交通,過去哪裏要禁左,要做很多人工調查,對周圍各種情況進行人為走訪,之後才決定哪裏該禁左,哪裏不該禁。今天通過攝像頭的數據,可以看到很長時間以來的交通狀況,到底左轉應該禁,還是應該延長,今天有了這些信息,我們就可以做到更優的狀態。

搜索和挖掘:索引城市數據,建立城市智能搜索引擎

450da25c7e6d8922a06dfd9b4af560fb75d75fda

我們還可以把整個城市的信息放在一個索引裏。這裏麵有兩個核心的問題:第一是數據量。假設一個城市裏10萬個攝像頭,跑10個小時就是100萬個小時的視頻,而城市一年365天都在跑,大家可以想象這個數據量有多大。

構建一個搜索係統,我們需要一個大規模的圖像分析處理的流程,然後把圖像的特征放到索引裏去。我們一般有好幾組服務器來host索引,一組通常也有很多機器,每組機器合起來是一個完整的索引。在搜索過程當中,用戶提交一個Query 的請求,這個請求會送到其中一組索引的每一台機器裏麵,每一台機器返回的結果,經過一層一層的匯聚以後,最後才會把結果反饋給用戶。這裏麵有算法的問題,比如在每台機器上能不能做到高效,也有很多台機器協作的問題。後麵這是一個係統的問題,兩者配合在一起才能解決效率的問題。

abe693a970645829d8c727263ef1de8ba3ca9eb4

第二個難點就是怎麼搜,這是算法的問題,其中最關鍵的就是怎麼去描述物體,描述移動目標、車、人等等。我們以前做拍立淘的時候搜索的是商品,也是要為這些商品建立一個描述方法,也就是特征。今天深度學習技術為我們帶來很大的便利,我們可以去學習一個特征。我們去設計合適的神經網絡,逼迫這些神經網絡收斂到我們想要的地方,比如像這裏講到有兩種方式,一種是通過識別的方法去逼迫網絡,輸出一組特征,實際上就是一個向量,這種向量能夠在本質上代表你所關注的物體。

還有一個方式叫重新識別損失,包括全局loss,部分loss,特征點loss,這些技術都是為了讓神經網絡收斂到一個地方,讓它能夠用一串數字代表這個物體本質的特征。城市搜索是比電商搜索更難的一個問題,在電商搜索中要找一個商品,假設一輛車,寶馬X5,張三的車和李四的車,實際上是同一件東西。而在城市的搜索中,我們需要找到張三這輛車,如果返回的是李四這輛車,哪怕顏色車型都是一樣的,這時候結果也是錯誤的,因為我們要找的就是張三這輛車。這些棘手的地方需要特征學習能夠自動發現物體細微的差別,把這些差別反映在特征裏。

我們正在烏鎮互聯網大會上線這個技術,希望屆時能夠讓大家看到這個技術的真實應用。

城市大腦:今天是項目,明天是產品,未來是平台

fa4324eb76f734aa9fb8c9aff6154b39d416ae40

從整個城市的數據,到數據的感知,尤其是視覺信息的感知、認知,再到決策、優化、搜索、挖掘、預測和幹預,這一條鏈路下來,我們稱之為城市大腦。當然今天更多是從交通和安防的角度講的,希望將來可以有更多方麵的智能,包括資源、電力、醫療等信息,更多的數據和智能也會在城市大腦裏展現。

我們稍微退回來講一下,城市大腦這件事情與其他的AI技術和應用到底有什麼不同之處?

第一點,它是用今天強大的計算力和AI技術,去發掘整個城市裏不斷積累的大量異構數據的價值。我經常舉的例子,過去的手機隻是用來打電話,今天大屏幾乎成為手機的一個標配,沒有大屏的話很少有人會買它。這是因為大屏成為了今天手機不可替代的部分,因為其有不可替代的價值。城市大腦也是這樣,是要把城市數據的不可替代的價值挖掘、體現出來。

第二點,城市大腦所做的事情超越了單點人工智能的技術,所以有時候我們會把它叫作機器智能。機器智能強調的不僅僅是單點的感知、認知的能力,而是要把數據匯聚起來,利用強大的計算能力,強大的融合能力,把數據的價值展現出來、挖掘出來。所以我們有時候講,城市大腦實現的是人的大腦不能達到的智能,比如像紅綠燈的優化是人不能達到的,交通事故的感知是不可能全麵鋪開的,一個人看幾個攝像頭可以,但看完整個城市的攝像頭是不可能,包括上層的預測和幹預等,都是沒有辦法通過人力完成的。

第三點,數據成為一種資源,我們希望城市大腦將來會成為一個城市的基礎設施,就像水、電一樣。

b0dbd6ed8d65aeb045ea1638ae5df0cf232dd3f5

因為深度學習的技術、AI的技術、計算的能力,當然還有設備、網絡、帶寬等等讓AI有了非常大的飛躍,這讓我們想為城市建立一個大腦,挖掘這些數據的價值。我一開始就講過,今天它看起來像一個項目,我們在杭州、蘇州、烏鎮、衢州等不同的城市逐漸開展,下一步很快它就會成為一個產品,再下一步它會成為一個平台。這個平台必將會推動AI,或者機器智能的進一步發展、壯大和落實。

因為計算的量、數據的量、需求的量,以及它所帶來的影響力和價值都使得城市大腦會成為一個超級的人工智能研發和應用的平台,會需要很多家公司、單位共同來構建。在這個平台上,有非常廣泛的空間提供給大家,讓很多人能夠在這個平台上一起創新,一起挖掘數據的價值,一起來為整個城市帶來驚喜,謝謝大家。


原文發布時間為:2017-11-18

本文作者:AI WORLD 2017

本文來自雲棲社區合作夥伴新智元,了解相關信息可以關注“AI_era”微信公眾號

原文鏈接:城市大腦入選國家新一代人工智能開放創新平台,阿裏iDST副院長華先勝技術解讀

最後更新:2017-11-22 00:04:15

  上一篇:go  MySQL的JOIN操作
  下一篇:go  tcmalloc淺析