953
機器人
科大訊飛徐景明:萬物互聯來了,人工智能會怎樣?
新媒體管家
這是我有嘉賓發布的第555篇文章
2993字 | 閱讀5分鍾
與眾多傑出創始人共同深度訪學、反思互撕,請掃描圖中二維碼,直接報名嘉賓派。
也許你並不認同人工智能威脅論,但是不可否認的是,機器人的行為越來越智能,圖靈測試已經擋不住它們了。點擊視頻,看嘉賓派幫主徐景明的分享,感受過去20年人工智能的突飛勐進。

摘自徐景明在嘉賓派的分享,有刪減
我們今天看到了人機交互的很多展示,其實整個大的背景,也就是現在所說的IT產業發展五次浪潮六次浪潮,人機交互在其中起到了非常重要的引領作用。
人工智能還處在認知智能的初級階段
我們現在還在不斷演進。從2014年我們就啟動了訊飛超腦計劃,從能聽會說到能理解會思考,從感知智能走向認知智能。
人工智能的三個階段,運算智能、感知智能和認知智能。
運算智能很容易理解,機器的能存會算。
感知智能就是使機器具備能聽會說,能看會認的能力,而機器的感知智能其實是一定會超過人類的。因為機器可以聽到超聲波、次聲波,人是肯定聽不到的;機器可以看到紅外、紫外,人是肯定看不到的。
而且就在人類的交流語言裏,機器也會遠遠超過人類。人類能力再強,一般可能學會三種五種語言,但是機器可以學會十種二十種語言,以後甚至更多小語種,我們也都可以讓它學會,隻是時間問題,而且它可以聽到更細微的聲音,可以講出更複雜的語種。
第三是認知智能。
阿爾法狗下圍棋下贏李世石,跟當年的1997年IBM計算機深藍下贏國際象棋大師卡斯帕羅夫,是完全不同的挑戰。下贏卡斯帕羅夫屬於計算智能的勝利,但是阿爾法狗是屬於認知智能的勝利。因為圍棋是不能窮盡的,它的做法是,像人一樣學習了人類有史以來的上百萬棋譜,學過之後它可以進行自我訓練,自我的邏輯推理和自主決策,非常像人的認知能力的發展,所以這是一個非常大的挑戰。
現在我們在人工智能的發展階段處在感知智能的高級階段和認知智能的初級階段,所以我們不要去誇大,但是也不要去貶低。
人工智能的發展有兩個主線,一個是以DNN為代表的深度神經網絡算法的進步。現在隨著算法的進步,它已經在逐步深入到各個行業,比如醫療、教育、司法、智慧城市等等領域都有非常多的應用。
另一塊就是腦科學和類腦科學的進展,它研究的是人神經元傳遞信息的機理。這個東西實際上確實有很大的挑戰,我們跟相關機構成立了實驗室在進行合作。但是,即便我們在腦科學和類腦科學方麵沒有大的突破的情況下,現在的算法進步已經可以深入地改變我們各個行業了。
嘉賓派幫主、訊飛產投董事長徐景明在分享
認知智能在常識推理方麵的挑戰
人類的智慧是怎麼產生的?赫拉利的《人類簡史》裏麵做了分析,在200萬年以前,就有各種各樣大腦容量相同的直立行走的人類了,但直到7萬年以前,智人才開始統治全球。
為什麼?因為智人在語言上取得了突破,語言上的突破使得人類不僅可以反饋周邊的環境信息,更重要的是,它可以傳遞虛構的概念,可以形成更大的組織,去做更複雜的協同性工作。
所以人自從語言上有了突破之後,我們就從生物進化,進化到了文化進化的層次,這是非常大的突破。
這就是為什麼訊飛會從語音交互走到人工智能領域。訊飛超腦計劃就是以語音和語言為入口的認知革命。
嘉賓傳媒創始人吳婷在科大訊飛訪學
科技部啟動的首個人工智能重大項目,就是類人答題機器人,訊飛作為組長單位牽頭,全國大概30多家研究機構共同參與,就是要讓機器具備語言的理解、知識表示、聯想推理和自主學習能力,目標就是讓機器人能夠考上大學。
我們在這方麵也有蠻多的進展。以前人工智能的測試是圖靈測試,圖靈測試就是把人和機器都放在一個布的後麵,然後讓這個機器跟你對話,如果你能夠區別出它是個機器還是個人,那它就沒有通過圖靈測試;如果你區別不出來,把機器當成人了,就說明它通過了圖靈測試。
但是隨著算法的進步,隨著數據的不斷積累,這種測試已經越來越容易被通過了,已經不具有代表性了。現在Winograd測試是大家比較公認的新一代測試。
裏麵有一些問題,對人類來說非常簡單,六歲的小孩就可以回答出來這個問題,但是對於機器來說就是非常難的問題。
這裏麵有一個六齡童智商的事兒。對於人類來說,六歲以前的學習,隻要在一個正常的成長環境,他的認知推理能力會自然而然的形成,不需要特別去教。他真正的挑戰是六歲以後上學了,開始無比痛苦地接受知識的灌輸過程。
對於機器來說,它的挑戰是達到六齡童的智商和能力。它如果達到了六齡童的能力,後麵的事情對它來說是非常簡單的,它隻要把知識給灌進去就行了,所以認知智能在常識推理方麵是非常大的挑戰。
還有就是在自然語言理解和知識推理方麵新的突破。知識圖譜構建怎麼理解?比如一個句子裏麵的很多名詞,它可以很清楚地抓到它背後的指代關係,這是知識圖譜。它的構建過程是非常複雜的,而且非常有價值。
所以我們經常會說機器很傻,但你跟它講一句話的時候,話裏麵其實有很多很複雜的關係,有很多的指代關係。它必須要把名詞後麵的這種關係,還有後麵再一層的關係,一層一層的抓取出來,才可能真正做到自然語言理解能力。
現在整個趨勢,人工智能確實比想象中來得更快。麥肯錫的報告認為45%的人類活動可以被當前的技術替代,對於在座的各位CEO可能是20%。我們都麵臨這樣的挑戰。
對於創業企業來說,一個優秀的算法完全不等同於技術,優秀的技術完全不等同於優秀的產品,優秀的產品完全不代表你能去賣出去。所以這裏麵都是非常大的跨越,在這些跨越裏麵,我覺得每一個都有非常多的挑戰。
嘉賓派幫主們在科大訊飛訪學
未來每個人都會有一個個性化的聲庫
從大型機到小型機到PC機整個的交互模式,從原來的紙帶打孔到鍵盤輸入,到視窗的操作係統,再到蘋果出的觸屏交互技術,它把觸摸技術真正做到了極致實用。接下來,大家公認一定會進入到萬物互聯時代。
萬物互聯時代,我們是一個什麼樣的交互方式?
移動互聯網時代是一個以觸屏為主,其它交互方式為輔的時代,但是到萬物互聯時代,我們的眼鏡,我們的手表,我們的身上各種各樣的終端設備,都可以具備交互能力。我們認為一定是語音為主,鍵盤觸摸為輔的人機交互時代,而且它正在來臨。
我們回到家裏麵,機器人一定是用語音,就像自然的交互一樣,它來迎接我,跟我去交互,而不是我跑到它身邊,在它身上指指點點,所以這是一個大趨勢。
語音技術包括合成、識別、自然語言理解。合成就是讓機器說話的技術。識別就是讓機器聽懂人說話的技術,不僅聽懂你說的是什麼,而且能聽懂你是誰,你說的是哪一種語言,甚至哪一種方言。自然語言理解,就是讓它進行語義的理解,並且給出適合的指令集,相當於給它賦予一個人工的大腦。
語音合成有很多的評價指標,可懂度、清晰度、自然度等等,最關鍵的指標是自然度的指標。
1995年當時不足三分的係統效果,很像卡通片機器人的說話聲音,當時單純采用單詞拚接,把不同的詞拚到一起,中間的能量、時長、音高等等一係列的複雜參數,要解決好,本身就是非常難的。
2001年的係統效果,技術有很明顯的進步,但是還是能聽出來是機器在說話,沒有真人發聲抑揚頓挫的感覺。
現在的中文合成效果,進步非常明顯,訊飛是業界第一個把中文的語音合成技術做到超過普通人說話水平的。除此以外,自90年代中期以來,科大訊飛在曆次的國內外語音合成評測中,各項關鍵指標均名列第一。第一次參賽的時候,整個語音學界非常震驚,外國人說,訊飛是一匹黑馬。我們的英文合成效果是有情感有語氣的,表達非常豐富。
這裏麵其實有非常大的應用空間。
我相信,你可以把你的聲音作為禮物送給戀人、父母、孩子,當你去上班的時候,你的孩子聽的朗讀故事可能有他爸爸媽媽的聲音特征;等我們老了,孩子出國了,孩子可能把他的聲音給我們,聽報刊聽新聞等等都是孩子在給我們在念書。
年輕人開車的時候,車載導航用的不是那種通用設備,當然林誌玲的聲音是我們做的,郭德綱的聲音也是我們做的,但是以後可能就是我的戀人發的聲音,給我語音導航和提示,這樣的應用是無所不在的。
還有機器翻譯,我非常相信,以後人機溝通的無障礙,一定是可以實現的。這應該隻是一個時間問題。
嘉賓派幫主們在科大訊飛訪學
* 版權聲明:本文係我有嘉賓原創,轉載請務必聯係我們獲得授權,並注明來源,違者舉報。
最後更新:2017-10-08 04:24:52