演講實錄丨王士進 人工智能開啟智慧教育新模式
人工智能開啟智慧教育新模式
王士進
科大訊飛研究院副院長,智學網副總經理
王士進:各位嘉賓上午好!我是訊飛研究院的王士進。非常高興能夠根據匯的嘉賓一起分享訊飛在人工智能以及人工智能和智慧教育結合的一些一些看法,那麼今天我的報告的話分為3個部分第一部分的話是簡單介紹一下人工智能技術以及訊飛在他們做了一些工作。然後第二個部分和第三部分的話分別介紹人工智能在我們智慧教育中在考試以及教學這一場景一些應用。
講到智能和人工智能,那麼這裏邊的話關於這個定義其實很多,但是最基本的一個概念的話我們認為如果工智能的話是希望機器能夠和人類一樣能夠去感知世界,能夠去認知世界和能夠去做一些決策。那麼這樣的一個卷積這樣一個係統,那麼今天正好我們也是AI人工智能這個6周年那麼在一九,五六年的達到茅斯會議上的話有幾著名的專家共同提出了人工智能這個概念,使得人工智能在這個60年,有一個非常快速的這樣一個發展。那麼在人工智能發展的這個路線上的話有3個階段。那麼第一個階段話其實大家很清楚,就是從計算機的出現使得計算機在這種運算智能上計算機的話他能存會算,而且現在已經比我們人類要好很多。
那麼第二部分的話是感知智能化我們剛提到我們智能的,其中有一部分是希望計算機,能夠像人一樣去感知外麵的世界,所以說的話計算機能不能夠做到能聽會說能不能夠做到?能看會記?其實現在,人工智能進展在這個感知,智能這個領域裏麵哈很多,技術已經做了,跟人類接近,甚至比原來更好。然後第三個部分的話是認知智能的話其實人工智能我們認為這個最高境界之一,那麼他是希望計算機能夠跟人類一樣真正去思考,那麼今天的話在這個第一部分的話,我分別會從感知智能和認識,能去介紹一下我們對人工智能的一些理解。
智能語音技術的話是感知智能一個非常重要的一個技術,那麼我們說智能語音技術的話,其實我們是希望計算機,計算機可以和人一樣去能聽會說,那麼這裏麵其實包含幾個主要的技術,第一個是語音合成技術,那麼合適的就實話,就是在於我們能夠把一段文本能夠變成一個語音。那麼第二的話是語音識別的技術語音識別技術的話,那麼它取決於就是我們把人說的話能夠變成一段文本。然後第三部分的話是語音評測的句子,語音評測技術的話就是說它能夠去判斷你說的好還是不好。好,下麵我分別來介紹一下,那麼,通用的語音合成技術這塊,其實大家應該比較清楚,訊飛做的其實還已經非常好了。但是這裏麵其實最難的就是怎麼去做了個性化的話,個性化的話就是說將來我們每一個人你去去錄簡單的也許10分鍾也許20分鍾的語音,那麼這個計算機就能按你一樣的這種聲音去發聲任何的。根據你輸入文本去發任何聲音。那麼這個地方我們舉一個例子,比如說我們有段評書的合成。
比如說原來比如說我晚上的時候我們小孩經常喜歡要讓我給她讀的故事,如果說你晚上要忙於工作話,那麼用這個計算機的個性化的合成的話,也許可以完成這樣一個非常不錯的這樣一個任務。然後除了中文以外的話,其實訊飛在英文上麵也做了非常好的一些合成的一些工作,那麼從Challenge2006年開始參加 這個語音合成比賽一直到2016年我們是蟬聯11屆的冠軍,那麼這個,大家可以看一下我們今年係統的一個效果。他是去讀一篇小說。所以大家可以看到這個小說裏麵其實有很多種感情因素的這種合成,跟我們聽到正常的那種,機器和人因會有一些不太一樣。
好,剛才講的是那個語音合成的技術,那麼其實在於語音在語音識別技術裏麵,我們說語音識別技術什麼最難?語音識別技術的話他在我們正常的這種安靜的靜講的場合裏麵其實比較容易,那麼在我們反而是在我們,比如說在一些噪聲比較大的場合,比如說我們在汽車車載的時候,大家可以知道在開車。這時候我們會有風噪,有胎噪,類似這種各種各樣噪聲,那麼怎麼在這裏麵能夠把語音識別能夠做到更使用合同?因為我們這個時候大家知道這個3樓這會正在開智能駕駛,這個,這個會議那麼其實這種類型的技術的話,在這種跟智能駕駛輔助的話會起到一個非常好的作用,那麼訊飛在,跟寶馬奔馳還有通用3家公司最近1到2年組織這種國際比賽裏麵的話都拿下了第一名。也就說我們的技術的話將來會在大家各位開的如果您買這種類型的車的話,那麼在上麵都會看到訊飛的技術。好語音評測的話,訊飛從最開始做語音評測到現在,包括我們的普通話水平的等級。你考試包括我們的這個英語口語評測的這種技術,包括我們唱歌這種音樂評測技術的話,都已經在,各個地方都已經取得了一些使用效果。
比如說我們在某省高考的時候跟人工專家相比的話,大家可以看,無論是從這個相關度也好,還是從這個分差控製也好,其實做的都還非常不錯。好,剛才我們講的是跟語音相關的這種技術,那麼後麵我會講一講我們對認知智能的。那麼我們說,認知智能是希望計算機能夠像人一樣去思考那麼這個的話,其實剛才很多專家也提到,包括這個不僅僅是我們中國,或者我們訊飛意識到這個技術,那麼在其實上在全球,無論是政府還是企業,都起動了這種類型的這種競爭,那麼美國的話推動美國奧巴馬政府的話,推動這種大腦圖譜的這樣一個計劃,然後歐盟的話也推動了這個人類大腦項目,然後中國的話也在積極醞釀中國腦計劃。那麼怎麼衡量一個機器的智能?其實有很多種方法,那麼其中有一種方式也看到比如說在美國,在華盛頓的圖靈中心的話,那麼他們正在做一個美國的考試機器人,希望機器人能夠通過美國的高中考試,然後在日本的話,那麼他們從這個前幾年啟動的一個叫Todai高考機器人,那麼他們希望這個機器人能夠去跟學生去pk,然後能夠讓機器人能夠考入東京大學那麼其實中國也進行了一些類似重科研工作。在一四年的時候的話,訊飛正式啟動訊飛超腦計劃,希望計算機從我們最早做的能聽會說來實現我們能理解會思考,並且牽頭中國這個類人答題機器人的這樣一項工作。
從一四年到現在,其實已經過了比較長的一段時間了,那麼我們也做了很多一些工作。那麼其中我來介紹幾個其中的一些成果那麼第一項的話我們,我們叫它叫aiui, aiui的話我因為我們知道隨著現在萬物互聯,包括智能驅智能機器人類似這樣的,那麼我們人和機器之間的交互的話會變得越來越多,而且場景,你越來越複雜。那麼在這種類型的場景裏麵怎麼能夠實現更自然和更智能的這種交互其實我們通過這個四五,大的技術來定義,第一個的話遠場降噪,因為我們知道我們很多時候跟機器人交流,或者說跟你家裏的智能交流時候,你不可能是用嘴去對著,這種,機器人去講。所以說怎麼能夠在原廠能夠把這個語音識別能夠做得跟你近場一樣好。這裏麵有很多技術,然後第二個的話是方言識別其實大家也很清楚,那麼因為我們並不是每個人普通話都能講這麼好,那麼機器要除了有方言的普通話,還希望能夠在你方言味比較重的時候也一樣能夠理解你的語言。
那麼第三個是全雙工,因為大家可能看到很多市麵上這種交互的這種包括語音交互的這樣一些軟件那麼狠,多都是單工的單工的話,比如說有一些時候的話你一定要等他講完以後才能去打斷或者執行新的指令,那麼這個話其實在交互過程中有很多一些不便捷的地方。第三個的話因為大家可能知道,因為我們其實目前識別率其實還蠻準,但是可能在識別過程中的話會有一些小的錯誤。那麼這一塊的話怎麼能夠用語義給一個人夠去破解我們語音識別的最後障礙,能夠使得我們這種交互會有更高的準確率?好,這是第四個,然後最後一個的話是因為我們知道在交互的過程中的話很多交互並不是一一輪對話能夠完成的,所以說怎麼能夠在多輪的對話裏麵能夠智能的理解你的意圖?現在也是我們這個AIUI所研究的這樣一些功能。
第二部分的話是我們在機器翻譯方麵做口語翻譯方麵做的一些工作,那麼我們從2011年起動機器翻譯,但是到在人工智能這個領域裏麵一個比較傳統的話題,那麼他能夠把一個語言能夠翻譯成另外一個語言。那麼訊飛的話那麼坐了大概幾年時間以後,我們在一四年和一五年的兩個非常大的國際比賽裏麵的話都能拿到第一名,並且在我,我們靈犀在書法的這個軟件裏麵的話都已經取得了應用。大家如果可以去下載我們這個靈犀或者輸入法去試一試。我們剛才提到關於機器的智能裏麵其中有兩個重要的功能,那麼一個是篇章理解,一個是深度的推理那麼在篇章理解的話,訊飛也做了一些非常好的一些工作那麼我們是在業界首度提出了,一個全新的,怎麼從篇章裏麵能夠讀懂篇章的語義,然後來回答你的問題。這一塊的話其實大家可以想象在人工智能激競爭非常激烈,今天包括在這裏任務尚包括固定賣的,那麼他也是發明阿爾法狗的,這個機構包括facebook,包括這樣一些機構都在這個數據集上一直在刷新這個結果。那麼我們也是有幸能夠取得比,別人會更高一點這種成果。然後還有一個的話怎麼去把。常識進行更深度的這種推理,那麼推理的話我們一直認為原來是人類的強項但其實現在基金,已做得也還不錯。那麼這個地方的話有一個最近有一個非常有名的比賽叫為了不落的全臨泉那麼他什麼意思?
我舉個例子比如說我們說這邊有個例子,比如說父親沒法舉起他的兒子,是因為它很重。那麼我想問你這個地方,他隻是父親還是兒子?那麼如果換一句話,如果說父親沒法舉起他兒子是因為他很虛弱,那麼這個地方它到底是他父親還是他兒子那麼其實這麵的話,其實我們人其實非常好理解的因為你,我們在判斷這個問題的時候,我們大腦裏麵或者說在我們學習過程中有很多這種常識,但原來即使這麼簡單的問題機器也很難去做到。那麼最近的話,我們通過一些這種深度的實際上就是通過這種人工智能的一些模型,然後再結合我們這種大的語料,使得我們在麵的話其實可以做到一些比較優秀的工作,包括也被mit這個聽你口音也有所報道。好,除了我剛才講到類似這樣的話,其實現在人工智能在我們的智慧教育,智慧醫療,還有智慧城市、智慧客服等很多領域都會。就是大家如果說你平時去關注新聞的話,那麼會大家會發現越來越多的行業和越來越多的領域會被人工智能的技術去進入。
好,第二部分的話我主要介紹人工智能技術在考試中的應用,那麼剛才其實胡院長也提到中國教育的話,其實講到有一個詞就是競爭的話,其實也意味著考試,那麼考試的話我們錯作為從學生過來的話其實我最關心的就是老師能不能夠評得準,能不能夠給我更多的反饋意見?那麼這一塊的話,其實訊飛在上麵的話就是,結合我們的這個手寫識別,還有自然語言理解,還有我們的智能評測技術實現了這樣一個基於,執筆作文的包括紙筆考試的,包括作文,包括翻譯題,包括填空選擇題,這樣的一個自動化的這樣一個評判係統。那麼這樣一個評判係統的話,那麼它有幾個好處,第一個的話他會大幅降低紙筆考試的這樣一個人工閱卷量,這個大概是比較好想象。第二的話在於統一貧富的標準。那比如說我們以最近前段時間比較熱門的這個阿爾法狗為例把阿爾法狗為什麼能夠戰勝人類的這個圍棋選手?那麼就在於他能夠固化在之前發生的很多的人類的知識,並且通過這個知識去演化形成新的知識,從而去戰勝現在人類,那麼其實我們也是一樣,大家知道在評分的過程中的話,比如說我們在中高考,或者說在大學的時候集中等你考試裏麵那麼,評分的任務其實是一個非常繁重的,那麼在繁榮的過程中的話同時,由於不同老師水平層次不齊,而且他在這麼長時間,要去評這麼多作文的話,所以說其實不可能每個老師的狀態會這麼好。然後我們以前還有一些實驗驗證的話,即使老師是在一個非常認真的這樣一個場合裏麵,你可能今天憑一個比如說作文或者翻譯題和你明天翻譯題其實會不太一樣。那麼這地方的話我們機器的價值在於我們能夠固化老師在狀態好的時候的這樣一些知識,並且把這些知識能夠複製到你所有題目的這樣一個品牌裏麵,就類似於我們相信實際上相當是一個平分的阿爾法狗來取自動的去運轉。那麼好我們介紹一下我們剛剛講的紙筆考試閱卷的一些技術。
那麼其實涉及到這個閱卷的話有幾個技術,第一個的話我們怎麼能夠在這種複雜的考不同類型的考試了。版麵裏麵能夠做到更複雜,這種把人分析,比如說比如說我們在。一個沒有畫橫線的這樣一個作文裏麵,怎麼能夠把這個作文切成一行同時能夠識別,學生有沒有做塗膜,有沒有做起有沒有做換行類似這樣的,那麼這個地方的話,大家可以看到我們程序會自動做一些標注在塗抹,在插入這個地方的話都會有些標記。這樣的話其實對我大家可以想象對我們後麵的評分和診斷都會有一些積極的意義。第二個的話我們會認出非常多的異常,作答包括非規範的比如說,這有個圖,還有一些嚴重塗抹的,還有一些亂寫的類似這樣的話那麼機器都能夠,那麼在一次考試驗證我們在65萬份試卷上剪出大概有1萬份左右這樣類型的試卷經過人工驗證以後非常正確率機應該是全部正確。所以這塊的話其實現在大規模考試裏麵的話,卉,非常實用。第二個的話我們把版麵切出來,以後的話怎麼能夠把圖變成文字這一塊的話訊飛?放心地提出了那麼基於人工智能和深度學習,這樣一個網絡能夠在這種學生任意的手寫裏麵能夠達到96%以上幾率那麼,這是我們之前的結果那麼現在我們新的上線的係統會比這個其實要好很多。大家可以看上麵是學生寫的,包括有塗抹,有類似這樣的東西都有,下麵是電腦從自動做是一出來這個文字,然後基於這個文字以及我們這個理解技術的話,我們可以完成填空作文題和翻譯題的評分。
那麼對於填空題的話,不止是一個簡單的比對,我們還能通過一些常見的一些錯誤去自動分析和挖掘出來,然後能夠找到學生在這裏麵的錯誤所在。然後對於總體也是我們能夠綜合於此匯聚適合內容以及篇章等各個方麵的信息,能夠給出這種作文的自動評分。並且我們已經在比如說四六級考試在很多中考高考會考以及在很多研究生入學考試裏麵一般,已經都得到驗證。那麼其智力的話比人工專家跟完全相當於一個比較好的一個什麼專家。同時已經在我們智學網的進超過百所的學校裏麵,進行這種常態化的使用效果也都非常好。那麼然後除了可以評分以外的話,我們還擁有大量的這種範文庫,同時能夠檢索出我們學生在寫作文的時候有沒有去抄襲?因為很多老師比如說你初看一下文章非常好給予非常高的分數但其實他可能是抄襲的一篇,因為我們老師腦子裏麵,不可能你有能夠裝下幾百萬幾千萬的作文,而我們電腦可以幫你做到。
好然後結合我們作文評分的技術,以及我們原來在這個機器翻譯上麵做了很多一些工作,我們能夠實現對翻譯,已作出一個非常好的這樣一個評分效果。好,剛才講了平分那麼其實的話,我們除了可以給出分數以外的話,還可以從各個維度給出我們學生作文的種類型的反饋,那比如說這是我們一個中考的這樣一個平標準,我們可以從語言水平內容質量,文章結構等各個層麵給出學生分析的結果,並且能夠給出他分數評語以及逐句地點評的結果。除了英文作文,我們還可以對中文作文進行類似的這種評閱。然後從這是我們這個高考作文的這種評分標準。我們也是從這個內容表達,和發展等級等各個層麵對作文評分,並且給出它的診斷的意見。那麼大家可以看到在中文這方麵我們在高考比較常見的一個議論文裏麵其實還做了很多一些其他的一些工作,因為我們知道要寫一,議論文的話其實有,它是有一些套路的,所以說我們除了要指出學生字詞句的一些問題以外,我們還要告訴他,篇章怎麼去行文?所以這塊的話我們,在你告訴他之前,首先你得識別出哪些是它的比如說以論據哪些是主旨句哪些是此論點去哪些是事論點句去通過這一些對這些都你的分析和大量優秀範文的這樣一些分析。能夠實現對她作文的這樣一個精確的一個點評?好,剛才講的是我們在考試中對考試一些結合人工智能技術和我們一些考試中,一些應用的一些痛點去做的一些工作。
那麼下麵的話我簡單介紹一下我們在教學方麵做的一些工作。那麼其實剛才很多專家都已經提到了,那麼現在教育有很多問題,那麼這些問題的話會吸,然後這些問題,導致了我們需要進行這種個性化的和針對化的學習,那麼這個地方我來講一下。那麼首先從整個國家和教育部對趨勢大家可以看到,在十三五的這種教育規劃裏麵就已經明確提到,要使用雲計算和大數據來推動優化這樣一個教學模式。好同時我們新高考的改革也更加促使我們要去做這種類型的變革原來我們是要大大班教學,現在是要分成走班,所以原來我們這種大眾化的教學就使得你必須要去走這種個性化的教學,那麼個性化的教學,那麼就有人問是不是根據我們學生的分數去,進行一些分層?比如說或者是給一些分層作業的一些報告,那麼從嚐試裏麵大家判斷可能是不太對的那麼這地方話我們也有一些例子,有一個例子來說明那這個地方我們聚了一次,在一五年級115年的一個一次考試為例,那麼同樣一個學校在同一個班級裏麵兩個分數一樣的學生,大家可以看到他們在這個知識點類型的這種掌握裏麵有非常大的不同,所以說的話其實我們如果說的要精準的,教學的話,一定要基於每個學生去做精確這種推薦。那麼如果說要完成這樣一個非常好的這種精準推薦,那麼它理論上需要一個什麼樣的一些東西才能夠做?我們認為這裏麵有4點,第一點的話剛才其實很多老師提到就是怎麼對形成性的數據和過程性的數據能夠做到綜合采集、大數據的采集第二點的話怎麼基於學生的這個知識點的分析以後怎麼能夠去做到精準的推薦?然後第三點的話你要去推薦的話,那麼你必須要有一個大量的經過,認真標注的這樣一個題庫存在?然後最後一點的話你擁有了這些技術和這些數據,你必須能夠把它教育學形成一個碧,並不是說我今天在你這練一下,明天就在那練一下,最後就可以形成了所以說我下麵的報告主要是圍繞這4點來講。
那麼其實我們教育現狀的話,其實剛才很多老師也提到了我們覺有很多大數據可是這些大數據其實並沒有真正,我們能夠把它采集下來,並沒有真正的把它形成數字化大家可以看到,無論從這個學校的維度從家長為主,學生維度都是這樣。也就是說,我們在教學過程中,其實大數據是有缺失的。所以說我們提出的方案的話就是結合學生平時的作業隨堂檢測,加包括假期作業考試和去年考能夠形成這樣一個完整的功能最全的覆蓋麵,最廣的這樣一個數據產業體係。那麼這個采集的話其實我們有一些理念,那麼理念的話就是說,采集數據首先對後麵的東西有幫助,這個大家都可以理解,但是最關鍵的是在采集過程中我們采用的是一種伴隨式采集辦事產業,就是說使得老師和學生對這個的抗,基本上沒有什麼抗拒心理。。然後第二點的話就是我剛剛講題庫的話目前我們知學網已經擁有國內唯一大規模的基於真實考試,精細化標注數據那麼我們現在題庫總量有600萬套同時我們每個月會更新,6000套左右的試卷,8萬到左右的試題。同時我們跟很多內容廠商還有一線的教師去去進行很多的合作,能夠使得我們這種內容進行深度內容進行,源源不斷去更新。
好,剛講的第二點提雇員我們講第三點是我們這個自身學習引擎,那麼資金去領錢,我們剛提到那麼引起行,他一定有一個輸入和輸出,那麼她抒的話我們這種過程化的學術巨。然後數據過了以後的話,通過我們原來對知識點,還有類似於這樣的一些建模能夠找到學生,的問題所在,同時規劃出它的這種各有個性化的這種學習路徑,然後基於對這些類型的判斷的話,我會輸出包括。對,他是用的試題,對他是用的視頻講解,類似這對他是用的個性化的學習方案,類似這樣的一些工作。好,那現在我們是怎麼做的大家可以看,那麼首先,我們通過線下和線上的最慘係和分析會對老師形成一個知識點的狀態跟蹤表,然後根據這個錯誤以及知識點的這種狀態的話,會形成這種個性化的這種作業,那麼通過我們這種自適應推進的係統形成個性化作業,然後這種文化的作業又給了學生去做完以後的話經過負責更新以後,我們知識點這個表會形成這種迭代,然後通過這種類型這種閉環的形式使得我們學生所不足的知識點,或者是可能會遺忘的知識點,會通過這類的隱形會變得會更好。這其實也跟我們這人這個記憶曲線也很有關係。因為我們知道人類這個g曲線的原理,那麼它就是它,現在學習到這個知識,其實它隨著時間會很快的遺忘,所以說其實我們在整個過程中的話,我們會在不同的時間點,把他可能遺忘的知識去,或者是有問題隻會推出來使得我們這個學生的曲線,它會g曲線會有一點下降以後,馬上上升,有一點下降以後馬上上升。通過這樣的一條路徑的話使得我們在整個學習全過程的話可以實現一個非常好的一個自主的這樣一個自洽的這樣一個學習。
好,我們來看一看我們的一些試點的結果那麼,比如說我們在合肥,我們在其實在很多學校都做了很多,試點效果都非常好,比如說我們在合肥一中的話,那麼使用了我們這套自適應學習的,那麼比如說,3個班的話,那麼請大家可以看到每個班經過大概17周左右的學習的話那麼明,因此提升都會非常好,那麼這個是對學生同時的話,老師使用這套係統去講課的話,那麼老師的效率也得到非常提高,因為以前我們老師講課的時候起時,我並不知道學生的薄弱點什麼地方?那麼上課我隻能泛泛而搶那麼使用這套係統的話老師無論是備課時間還是講課裏都得到了非常大的一個提升,所以說大家可以看到我們智學的這個理念就是基於我們這樣一個知識點的資源以及服務的體係能夠去完成,第一個步驟是完成我們這樣一個動態大數據的采集,然後對采集數據進行大數據的分析然後,結合我們人工智能技術進行,包括進行各類智能這開發各類智能應用,使得我們整個學習可以形成一個比較好這樣一個閉環。好,我今天報告就到這裏,謝謝大家。
最後更新:2017-05-24 17:01:45