863
騰訊雲
騰訊雲智能+視頻能力全麵升級 滿足行業智能化需求
11月8日,騰訊雲在2017騰訊全球合作夥伴大會雲計算分論壇上正式宣布智能+視頻能力全麵升級,在視頻雲的基礎上,為廣大各行各業用戶提供基於人臉識別、圖像識別、OCR識別、視頻鑒黃、音頻鑒黃、智能客服等人工智能技術與服務,結合直播、點播、實時音視頻、短視頻、IM等視頻雲通信平台基礎產品並創造出更具行業特征的產品特性。
騰訊雲視頻業務總經理李鬱韜
“智能+視頻”,1+1=N種智能行業應用場景
隨著視頻雲朝著行業垂直化、智能化的不斷滲透和發展,與人工智能相結合業已成行業趨勢。目前,在人工智能上占有一席之地的關於語音和圖像的AI技術種類就有很多,比如語音轉文字、文本轉語音、聲紋識別、證件識別、人臉識別等相關技術,這對於絕大多數的業內企業來說,巨大技術門檻是一道不可逾越的鴻溝,隻能望“智”興歎。不僅如此,要啃下如此繁多且複雜的技術,勢必會投入與之對應的巨大人力和物力,同時也會是一場技術馬拉鬆,這對於普通企業來說都是不太利於可持續發展的。企業應當在其自身核心業務中不斷發展並建立業內領先優勢,現在大多數企業正不斷將其自身業務上雲,結合雲的優勢來實現業務的增長和突破已是行業共識。
作為視頻雲行業的領先者,騰訊雲在基於早兩年推出並在業內建立領先地位的視頻雲PaaS產品,結合時下騰訊尖端人工智能技術,麵向企業用戶提供一整套“智能+視頻”的全新視頻以及通信平台能力,旨在為企業客戶創造更多的智能化應用場景。
在此次的解決方案中,騰訊雲將語音和圖像方麵的AI能力和視頻雲基礎產品做了深度的融合和創新,不僅在原有的PaaS層服務結合AI技術有了重大升級之外,還提供了豐富的AI元素組件,幫助客戶更好地理解具體的技術能力場景,並加快集成各個產品和服務的所需的開發周期,應對瞬息萬變的市場,給企業提供更有力的行業競爭力。
三大能力升級,音視頻識別準確率99%
騰訊“智能+視頻”能力本次升級發布主要分為語音+AI、聲紋+AI、視頻+AI三個方麵。
首先在語音+AI方麵,騰訊雲可提供語音文字互轉(語音轉文字、文字轉語音、語義識別)、廣告過濾、違禁檢測、涉政檢測等能力,可以有效過濾國家法律限製的物品信息、涉政敏感信息等,幫助用戶進行敏感詞隔離和輿情監控。
其次在聲紋+AI方麵,騰訊雲在去年推出鑒黃V1.0版後,再一次對升級了鑒黃能力,此次升級是通過音頻內容、聲紋識別技術,提供識別準確率超過99%、檢索時間小於150ms的音頻鑒黃V2.0版,通過音頻鑒黃能力能夠廣泛用於版權保護、敏感過濾及遊戲角色標注等情況,進一步擴大鑒黃相關業務範圍。
在視頻+AI方麵,騰訊雲可在直播、點播等場景中可實現實時字幕和視頻內容自動翻譯。根據相關數據顯示,在環境噪聲50db左右、沒有回音消除的背景下用騰訊雲的互動直播音視頻會話時,自動字幕識別準確率高達96%以上,識別的文本均在1S內返回並顯示。
基於傳統圖像特征識別與深度學習,騰訊雲的手勢識別能力還可應用於直播和短視頻上,動態手勢識別率接近99%,而移動客戶端CPU僅增長2%。
此外,騰訊雲基於綁卡驗證、OCT技術、人臉識別、活體檢驗、騰訊輔助身份信息大數據的多維度綜合模型,進一步升級了直播平台主播的身份實名認證能力,識別通過率已高達95%,誤判率僅為0.01%,為互聯網網絡淨化又增加一大利器。
實際運用已有成功案例,滿足行業智能化需求
目前,騰訊雲的“智能+視頻”能力已經在網絡庭審、小微客服機器人、微信小程序保險定損、視頻檢索等實際運用中有了成功案例。例如解決約80%小型案件的網絡庭審,騰訊雲可智能識別語音所屬對象(法官、原告、被告、書記員等),語音文字識別準確率95%以上,達到實時筆錄效果,釋放近90%書記員人力。
在微信小程序保險定損之中,騰訊雲可幫助保險企業快速進行OCR證件識別、視頻定損等,實現音視頻、小程序、AI的融會貫通。此外,騰訊雲還讓媒體音像資料的視頻檢索成為可能,囊括市場主流視頻文件格式。
騰訊雲視頻業務總經理李鬱韜表示,此次升級發布的“智能+視頻”能力,將騰訊雲長久以來的音視頻技術經驗和AI能力充分結合起來,將幫助通信、視頻、社交、遊戲、廣電等行業用戶更加智能化的開展業務。業內分析認為,騰訊“智能+視頻”能力的升級發布,也將有助於泛娛樂、在線教育、互聯網金融、線上法院、智能客服等新生業態的快速發展。
最後更新:2017-11-09 20:37:25