吳伯凡對話吳軍、塗子沛:大數據是智能的母體

智能能給普通人帶來什麼?語音識別什麼時候才能真正實現?
◆ ◆ ◆
摘要
2016年11月13日,第二屆萬物互聯創新大會「創業下一潮水:大數據與智能時代」在杭州召開。“鏗鏘三人行”環節請到了矽穀風險投資人、《智能時代》的作者吳軍博士,觀數科技聯合創始人、前阿裏巴巴集團副總裁塗子沛先生,以及伯凡時間創始人吳伯凡先生,並針對大數據和人工智能相關話題進行了探討。
大數據文摘記者帶來現場第一手報道,以下為對話原文,在不改變原意的前提下有部分刪改:
◆ ◆ ◆
大數據和人工智能的關係
吳伯凡:今年三場黑天鵝,AlphaGo取勝,英國脫歐,以及川普當選美國總統,這裏都有一個很重要的問題,就是智能預測。第一個問題,大數據和人工智能到底有什麼樣的關聯,區別顯而易見,關聯是什麼?
吳軍:這一次川普和希拉裏競選,希拉裏是一個什麼樣的勢態,傳統營銷能夠想到的辦法,砸錢、鋪廣告位,找意見領袖、代言人,就是好萊塢的,傳統方法全用上了,但是不產生結果。為什麼呢,很多程度上過去這種傳播方式,一個單點到多點的傳播出來以後,什麼結果不知道,接下來該怎麼調整,不知道。
今天大眾每一個人都是製造思想想法的這麼一些人。通過移動互聯網,大家互相抱團,一個個小社區。有這麼一些人,他們的思想很相近,這些意見在過去淹沒在汪洋大海之中沒有人知道。支持川普很多人就是這樣的,在今天看來這是一群很奇怪的動物,千奇百怪的想法,在過去媒體時代根本體現不出來。
今天,到了大選前幾天,在facebook上,這些大數據的體現,好像facebook已經能夠感覺到味道不大對了,雖然傳統媒體都清一色說希拉裏能夠當選。在社交媒體上好像反映出要變天了,從這個角度來看也不完全是“黑天鵝”。就像在座各位參與到了大數據時代,智能時代之中了。這是我的看法。
塗子沛:伯凡的問題是大數據和智能有什麼關係,我們簡單的說,直接回答就是大數據是智能的基礎,大數據是智能的母體。我用了一句比較性感的話來說,大數據是智能的土壤。也可以簡單的這麼說,沒有數據就根本不會有智能,所有的智能都是建立在數據的基礎之上。
我要來看,過了互聯網時代之後是大數據時代,智能時代其實還是大數據時代的一個組成部分,一個巔峰。剛剛談到今年美國大選,我們在關注大洋彼岸的選舉,大家有沒有關注浙江發生的事情,5月份阿裏淘寶上就看到了和希拉裏,川普的各種宣傳旗幟出貨量,川普是希拉裏的5倍。
義烏人民說川普的貨不要定金都敢做,而希拉裏不行,所以數據是什麼。剛才我們說數據是目前預測未來最有效,最有力的工具,因為數據表述的是過去,記錄是過去的事情,但是表達的是未來,它告訴我們未來,因為整個世界是有因果關係的。黑天鵝是怎麼來的,美國是怎麼解釋,我覺得可以看義烏。
吳伯凡:塗總是數據的代言人,吳軍老師是智能時代的代言人,你認為塗總說的數據是大腦,智能隻不過是一個延伸,你同意這個觀點嗎?
吳軍:我同意,機器獲取智能的方式和人不一樣,它很大程度上靠數據。關鍵的是,機器獲得智能在哲學層麵和人還是有很大差別,人是強調邏輯推理,很嚴格導出知識。而機器某種程度上來說是一步到位,因為有這個數據一步到位,通過相關性直接找出知識,它對我們的認知是挑戰。過去我們說要知其然,知其所以然,在計算機不是這樣的,它知其然,不知所以然。你對這個結論用還是不用,信還是不用。舉個例子,比如阿裏的好多商品,包括亞馬遜很多商品,它之間的關聯,你根本說不出是什麼原因的。但是你把這兩個商品房在一起去賣,結果就是好,實際上這對過去人的認知也是一個蠻大的挑戰,所以數據可以講是機器智能的一個基礎。
◆ ◆ ◆
大數據的相關性與因果關係
吳伯凡:知其然,不知其所以然,萬物都是有因果關係的,基本關於大數據的嚐試,大數據是相關關係,不是因果關係,這個怎麼解釋?
塗子沛:吳軍早上說到一個案例,沃森看病,沃森看疑難雜症比普通病還準確,為什麼?我覺得這個問題在某個階段可以去回答伯凡先生的問題,為什麼這麼講呢,我其實還是相信因果性。相關性是沒有因果的相關性,我們一定要驗證這種相關性之後,才證明它是科學的。
比如伯凡說很多東西擺在一起,它們就是會賣得更好,它們有原因嗎。啤酒和尿布是最經典的認知,開始沃爾瑪也搞不清楚原因,啤酒和尿布擺在一起,雙雙銷量都上升呢。它是有真實原因的,每一個最後有價值的相關性,它是有因果性的。如果沒有價值的相關性,它背後這個因果性是不成立的。
◆ ◆ ◆
吳伯凡:有時候我們做決策時沒有必要追溯因果,來不及。
塗子沛:對,我一定程度上同意,從數據上看相關性,我們一分析,杭州啤酒銷量和矽穀犯罪率是相關的。這在數據上完全可以出現的,那我們怎麼去解釋。
吳伯凡:這個問題很深刻,過去說的雄雞一唱天下白。大公雞每天一叫,天就亮了,人們就認為天亮是被它叫亮了,實際上沒有因果關係。我們聽見雞叫了,一會天亮了,這個我們可以用。這個問題思辨,大數據與思辨。
塗子沛:我認為這個東西已經上升到哲學層麵,因和果,我們永遠說不清楚。說了果,前麵有因。因又是另外一個事情的果,整個事件是錯綜複雜,上升到哲學層麵。最終解決這個問題,一定程度上是數據解決了這個問題。
吳伯凡:最近大數據不像前幾年那麼火,最近談人工智能比較多。但是大數據,大家已經往深處在挖掘。比如最近我看到好幾篇文章在談林彪與大數據的關係,說林彪是一個數據分析的高手。
塗子沛:我相信這個例子來自於我的書,我是中國最早講這件事的人。其實延伸過去,軍事戰爭對數據的應用是非常密集的。為什麼?因為數據就是情報的載體,就是信息的載體,所以他要收集數據。
這個故事說什麼呢,說林彪他有一個很好的習慣,什麼習慣?他時刻兜裏帶一個小本子,他見到什麼東西,有人報告什麼東西,他就記下來。記下來幹什麼,他把所見所得變成數據,一到決策的時候他什麼情況就知道了。
我們今天要看,剛剛說了無數據無智能,事實上還有一個東西,在管理學上來說無數據無決策。我們所有的決策事實上建立在情報收集基礎上,今天的情報是什麼,今天的情報就是數據,不是其它的東西。
◆ ◆ ◆
智能能給普通人帶來什麼
吳伯凡:數據如果是一個情報的話,為我們提供了做決策的依據。但智能好像關心的還是數據,普通消費者關注的就是智能,智能無非讓每個人都當上官,有秘書,有司機,吳老師怎麼看待這個問題?
吳軍:發展機器智能還要有醫生,任何科技最終目的就是為了你的生活變得更好一點,這是終極目標。延年益壽,醫療,剛才很多人都講到醫療,還有出行各方麵要方便,要有人替你管理這些事。最好這個計算機足夠聰明,把你的時間省下來,自己幹一些喜歡的事,安排你日常活動的這些事,讓他去幹了。
以前最早是像林彪似的用一個小本子,用一個手冊。然後就變成了你的日曆,計算機上了。以後像日曆,它可以管理得很好,塗老師、吳老師給我打一個電話,什麼時候在這裏搞活動,等等安排,我跟工作人員的郵件來往、微信來往,完完全全記下,嚴格來講用科大訊飛理解語言的部分都記下來了。
久而久之,哪些活動,這麼多活動,吳老師的活動,他做的內容和我寫的有相似性,我可能會接受。或者塗老師剛才講到數據和智能是相關的,所以他邀請的活動,我可能參加。另外有一個什麼八竿子打不著的,根據以前習慣就拒絕了。它每天在整理決策優先級的時候,事先排好序了等等,就是很小的例子。
這些東西也是從數據到智能,這是我們生活的便利性。它知道我每天工作安排時,以後也不用我天天打電話給滴滴,或者易到用車,今天6點50在哪兒等我,這個時間是自動安排好了。到了6點50我該出門時,車已經準備好了,當然有無人駕駛。未來我們想象一個生活場景有極大的方便性,我們到時候能夠騰出非常多的時間去思考問題,來發動人腦的特征。
◆ ◆ ◆
語義識別什麼時候能實現
吳伯凡:還有一個聽話聽音,察言觀色。就像現在說的例子,野蠻女友和男朋友打電話,你要是到晚了,沒有到,你就等著。我要是到了,你沒有到,你就等著;我要是到了,你不等我,你就等著!這個智能可能就無法理解,吳老師你覺得什麼時候能夠實現?
吳軍:剛才我看訊飛的,基本上沒有挑出什麼錯誤,這個還可以。理解,這裏有兩個難點。第一,本身繞口令,計算機比較容易解決這個問題。一個是它理解上下文這個意思,同樣說一句話,我就表達一般的陳述,可能是個反意。那我得看前麵是個什麼場景,這是一個常識或者人生活的知識,這是計算機現在,我還看不到一個前景。我今天說十年,我說錯了,十年後你也不會找我。大概在這麼短的時間內,我覺得這個事還不能最好的解決。
最典型是在北京公共汽車上,你踩了一個北京40多歲的女同胞。踩了她一下腳,她會跟你說這麼一句話,沒硌著你的腳吧,她其實是怪你踩著他的腳了。第二,剛才講的善解人意這件事,數據疊加之後會改進得非常快,包括航班今天晚了,發現哪兒有車禍,堵車了,讓你今天早走半小時。甚至鬧鍾提前鬧醒半小時,這個事做起來會是比較快。一般生活上的善解人意,這件事能夠比較快,可能有個三到五年,生活助手應該能解決。
◆ ◆ ◆
便利VS隱私
塗子沛:我補充兩個案例,今天人工智能到底在做什麼,今天人工智能在做一些重複性的工作,幫助人類從這些工作當中解脫出來。
我原來在美國的時候都用Gmail郵箱,有一次我的朋友在家裏給我寫了一封信,從中國來到美國,什麼時候抵達。到了那個時刻我就準備開車出去接人,這時候我收到了Googleplay發出的信息,說這班航班晚點了,我當時就驚訝。Google在讀這些郵件,讀這些郵件之後給你提供個性化的服務,可能會牽涉到另外一個問題,伯凡會感興趣,就是隱私。
如果你說要做到察言觀色,就必須讀懂你的每一句話,這就是問題。當時我接到這條短信的時候非常驚訝,但我認為這條短信非常有用,為什麼?我正準備出門,你說有用沒有用,那當然有用。我們的一個結論,我們今天享受這種人工智能的便利,事實上是讓度了我的一份權力。
這是我們說的第一個案例,第二個案例就說到AlphaGo。AlphaGo確實是計算機打贏了人類,但是我很快看到網上有段子,有什麼段子呢,他說那是下圍棋,你打打麻將試試看,我抓一下頭發,揪一下耳朵,那就有配合了,我們會察言觀色,計算機不會。
◆ ◆ ◆
技術的可能性和商業的可能性
吳軍:觸一下耳朵打麻將,也不是說做不到,因為你把視覺這些都加進去也能夠做到,是成本的問題。之所以不做,商業上很多事不做是因為沒利可圖。像剛才塗老師講的,提供一個航班晚點的信息,這個事以後你會更加相信我給你的推薦,它有一個商業邏輯在後麵,這是比較好的。包括AlphaGo下棋這件事,是非常好的宣傳。
如果哪天說打麻將,給你監測場景,你們大家如果覺得有用,它就會去做,你們大家要覺得沒用就不會做。包括無人駕駛汽車也是,我們過去說眼觀六路,耳聽八方,過去好多事情發生了計算機監測不到。實際上它現在每秒鍾各種傳感器,幾十種數據傳進來,這個察言觀色,像無人駕駛汽車出錯率比人類還好一些。很大程度上做到做不到,看你砸多少錢了。
吳伯凡:這就是一個問題,技術的可能性和商業的可能性,成本的問題有沒有人買單,廠商有沒有利益的問題,很多技術實際上早就已經有了,但是它沒有辦法找到一個市場,所以就擱置了。剛才我看到前麵一個演講,一個詞叫“部分輔助性智能”,可能我們下一步看到的無人駕駛汽車,就是那種老人車,貨場和機場裏固定場景,固定道路的,這種無人駕駛車率先會進入市場。那種高智能走盤山公路的車,可能到很晚才會出現。
吳軍:無人駕駛要分六個階段,第一是特斯拉,輔助駕駛,但還是人駕駛。第二個階段,它駕駛,人監控。接下來有些分場景的,就是從小區到地鐵站,每天隻走這一條路,這個比較容易。再往後一個階段,比如說你可以全市走,但最好晚上10點鍾之後再上路。最後一個階段,Google現在做的,沒有條件限製,所以每個公司切入點不一樣。特斯拉是切入第一個點,幾個主要汽車廠,奔馳、寶馬是切入第二個點。吳老師基本上切入三四個點,比如園區裏、商場裏,小區和地鐵站之間的,各家目標也不太一樣。
塗子沛:這是一個緯度,從技術本身來講有這些發展階段。但是我認為今年事實上是一個點,技術怎麼去發展,怎麼去提高,它最終市場結果就是大眾接不接受,這是一個點。
今年AlphaGo戰勝人類的圍棋冠軍就是一個轉折點,這意味著越來越多的人接受智能。比如說吳軍博士上午講的例子,我認為也是很有借鑒意義的。他提了兩個,第一,推薦。今天網站上很多東西,亞馬遜上40%的銷量是由於推薦,你不買這個東西,你沒有說要買這個東西,我向你推薦最後成交了,40%的東西都是這麼賣的,推薦。
他又講了一個,沃森。我們要問的一個問題,計算機推薦一件衣服給你,你就買了,這不是問題。如果計算機推薦一個藥給你,你就吃了,我認為這是一個問題。他上午說了三個數據,你的症狀,你的曆史,還有化驗結果,有這三個數據提交給計算機,如果未來在手機上提交。手機告訴你該吃什麼藥物,你敢吃嗎。如果你敢吃,我認為就是人工智能又一大躍升。
◆ ◆ ◆
吳伯凡:秘書、司機、醫生,醫生是最難的。
吳軍:還有第四個,可以給你推薦老婆。以色列做了婚配的工具,猶太人做的,他的推薦準確率特別高。不光是猶太人去用這個,美國很多白人也去用這個。他說人類找老婆有一個特大的誤區,女的找男的也有一個特大的誤區。比如他是一個60分的男性,他想象女神是95分的。95分女神都不會看他一眼,他最高目標就是70分的,能找著這個就不錯了,當然他對20分的也不會看一眼。
他做了什麼事呢?把每個人重新做了畫像,他不讓你看到所有人。比如你是一個60分的,他讓你看到最好的就是70分。這個60分,70分不是說長相,是各方麵綜合評估。這個成功率非常高,而且回訪以後,他們的日常生活滿意程度還很高。因為他找一些內在價值,不是外在的。60分一定要找95分的,最後你有錢也能辦到,但最終差異是很難彌補的。當最後說找老婆這個事也不是你自己篩選,不是你自己的意願,是機器在給你做,這個很有意思。
◆ ◆ ◆
機器會撒謊嗎?
吳軍:人有一些善意的撒謊,這個機器現在很難做到。
塗子沛:人類會撒謊,機器不會撒謊。圖靈測試中存在這樣的悖論,人會撒謊,到底能不能騙過他,這個圖靈測試,吳老師你怎麼看?
吳軍:機器撒謊是很容易的,隻是說你有什麼顧慮,機器沒有顧慮。AlphaGo贏李世石很容易,讓它故意輸棋不容易,故意設兩個BUG,讓它輸棋是容易的。如果為了什麼利益,為了賭博,中國的足球,要掙錢,要賭博,那就可以設計輸棋了。但是善意的撒謊,這個是揣摩聖意,隨便撒一個謊,今天天晴天陰,這個事很容易撒謊。
塗子沛:察言觀色,人類有這種厲害之處,相比於機器。察言觀色正是撒謊的基礎,因為機器不會察言觀色,它就不會撒謊。察言觀色意味著你要去迎合,扭曲事實,機器不會。從這個角度上講,我覺得未來人工智能世界還更靠譜一些。比人類管這個世界海更靠譜一些,因為機器不撒謊。
吳伯凡:人工智能的科幻電影裏,一個丈夫車禍死了,可以根據他過往所有數據,用軟件合成成一個真實的人,而且把這個女的對丈夫不好的評價知道以後,比如說他的脾氣原來不太好。
塗子沛:這也是圖靈測試,這個妻子最後能不能判斷這個丈夫。
吳伯凡:越聊越多,人工智能,大數據,吳軍老師說的第四點婚配,司機、秘書、醫生,如果我們不當官,不有錢有勢也能夠擁有這三個,那對我們未來的的確確是一個福音,由此看來也的確是一個大產業,人人都擁有私人醫生,擁有司機、秘書的時代。
◆ ◆ ◆
寄語
吳軍:這是一個非常有希望的時代,這是一個最好的時代,也是一個最壞的時代。因為好壞是看你站在哪個角度,你是否參與了,你參與進來,對你來說就是一個最好的時代。你如果拒絕這件事情,可能對你來講未來是一個很壞的時代。
塗子沛:我們要更多適應和機器共存共生,越來越多的依賴於機器。但是這並不是代表我們去否認藝術,其實吳軍開始演講的PPT,我記得很清楚,一開始彈鋼琴很好的人最後成為了人工智能的專家,我認為還是要在這當中找到一個平衡。大數據會給你很多建議,告訴你怎麼找到自己的另外一半,什麼樣的人才適合你。但是如果沒有你自己的體驗,沒有每一次約會的心跳,沒有那種察言觀色所帶來的愉悅感,或者說惡作劇感,小小的使壞,我相信這個世界的吸引力也會大大的下降。人之所以為人,還是要善用數據,善用智能,它歸根到底還是工具。本質上,我認為這個世界上最可愛的東西還是人,還是人性,不是機器,隻是我們要適應它。
原文發布時間為:2016-11-20
本文來自雲棲社區合作夥伴“大數據文摘”,了解相關信息可以關注“BigDataDigest”微信公眾號
最後更新:2017-05-31 11:32:12