閱讀820 返回首頁    go 阿裏雲 go 技術社區[雲棲]


阿裏雲雙11訪談之視頻雲

以下內容根據訪談視頻整理而成

今天視頻已經成為最具互動性的網絡內容。相比文字和圖片,視頻可以承載的內容更加豐富也更加生動,人們也已經習慣通過視頻這種內容形態來表達自己的想法,傳遞自己的思想,進行社交以及了解我們的世界。視頻成為一種主流的內容表達方式,站在視頻服務和開發者角度,我們更多關注如何支撐業務的需求,以及需求背後的技術的形成。

在視頻的生產環節有哪些重要的指標和信息是需要開發者去特別關注的?

第一個開發者關注的點是用戶體驗視頻清晰度的高低、流暢度的好壞給用戶帶來的觀感和體驗是完全不一樣的;第二個關注點功能的完善程度。市麵上很多典型的直播產品可以提供美顏,濾鏡,貼紙,人臉識別,年齡識別等娛樂性功能,我們也可以在視頻生產過程中加入水印、智能鑒黃、視頻的剪輯等功能;第三點是視頻的起播速度。怎樣才能保證視頻起播時間控製在1S內,在最短的時間高效的對視頻進行處理也是開發者非常關注的;第四點就是視頻平台是否能做到海量視頻分析並實現低成本的運維。因為視頻是非常耗費資源的。這四點都是開發者特別關注的,而每一個關注點背後都有阿裏雲非常強大的技術能力的支撐。

在視頻的生產環節,阿裏雲可以為開發者貢獻出哪些能力?

從以下三個角度講,一個是整個阿裏雲視頻會提供完整的全鏈路的能力。阿裏雲點播服務產品提供從視頻的導入到短視頻的拍攝、錄製、圖片處理、在線編輯、視頻審核等全鏈路服務。同時也提供給開發者相關統計數據,讓開發者可以依托數據分析,做策略性的判斷。同時我們的產品可以進行組合高效高效的將視頻點播從繁瑣的視頻生產環節中解放。依托點播產品組合客戶的內容鏈條,讓開發者更多的關注業務內容的生產環節,不必糾結於技術的底層細節。同時阿裏雲也提供高性價比轉碼服務方案。

除了自身的高品質或獨特的內容之外,視頻轉碼是每個視頻網站和內容生產企業最核心的技術能力。窄帶高清2.0是阿裏雲視頻在雲棲大會發布的新產品。這個產品就是針對轉碼服務的,非常歡迎大家去試用窄帶高清2.0這個技術產品。轉碼中一個非常重要的功能是倍數轉碼,對於比較關注內容生產的實效性比如新聞、事件直播類產品的生產者來說,從內容生產、轉碼再到分發,有一個時效性要求。普通的轉碼可能需要排隊,有很長的延遲,而倍數轉碼能很快對內容轉碼,減少端到端(指的是從內容的供給到消費的端到端)的時間消耗,保證了內容的實效性。

在短視頻產品裏,我們對外提供短視頻SDK,這裏非常重要的一點是人臉識別是對外免費的。已經有大量的客戶都在使用短視頻SDK,包含梨視頻、鹹魚,甚至滴滴都在使用短視頻SDK。我們還提供兩個內容生產工具,這些生產工具是對線下既有工具的雲化,就是把線下產品放在雲端提供給大家服務。一個是雲剪輯。雲剪輯是在雲端對素材進行在線編輯、拚接、圖文疊加甚至遮標,同時支持異地的協同編輯;第二個是雲導播,這是一個很重量級的直播內容生產工具。除了導播台的墊流、墊片常用性功能外,還提供了更豐富的功能。如語音識別。語音識別的應用除了在雲棲大會上分享的ET實時語音字幕功能外,還提供更加豐富的功能組合。大家不僅可以使用雲導播台業務,也可以用阿裏雲的APR開發自己的導播台。以上這些就是阿裏雲給大家提供的技術的解決方案。

視頻點播業務場景下,阿裏雲如何和人工智能結合使視頻更高效的生產和展示?

說到 AI不得不說我們是非常幸運的,因為我們在經曆、參與著一場非常偉大的AI技術商業化的變革,這也是一個勢不可擋的大趨勢。由於數據量非常龐大,計算成本非常高,AI技術對雲平台是非常依賴的。而阿裏雲擁有強大的技術後盾和海量資源支撐。阿裏雲IDS器前不久在ACM MM2017今年的LSVC(Large-scale video classification)上取得了非常好的成績,獲得了全球的冠軍。作為ACM下屬的專業組織,ACM MM是國際多媒體領域的頂級盛會。

阿裏雲融合國際權威的冠軍的技術實現以視頻為入口的視頻智能審核、音視頻內容理解、視頻指紋、視頻智能編輯等。其中視頻智能審核的功能在十九大期間也服務很多客戶。在視頻生產環節,這些AI能力都與視頻處理工作流緊密結合。開發者可以對視頻處理的工作流進行定義,對多種觸發方法進行靈活組合和配置,以實現在不需要任何人工參與的情況下滿足大量視頻處理的需求。一個非常典型的工作流就是視頻的鑒黃、鑒暴、鑒恐,在視頻轉碼之前我們會對視頻鑒別處理,發現有問題就停止這個工作流,不進入轉碼的流程。同時係統也會發出報警,將視頻提供給審核人員處理。

視頻直播場景裏如何與人工智能相結合?

在視頻直播場景中主要有以下幾點探索:

一是視頻的內容解析,我們可以對視頻直播中出現的商品以及場景進行解析,將視頻、電商以及廣告結合,為直播點播等多種視頻形式提供更好的視頻商業化變現手段。這個技術已經落地到天貓魔盒第一版的“邊看邊掏”項目中了,它可以打通觀看視頻的用戶和視頻本身的內容、淘寶上的商品三者之間的關係,在最合適的視頻片段裏投放給用戶最感興趣的商品。

二是人臉識別。通過使用人臉識別技術可以有效的識別網紅主播,並通過對用戶喜好數據的收集和分析,幫助APP實現對用戶的個性化推薦。也可以通過對主播的人臉手勢以及動作的識別來添加動態道具,增加直播互動過程中的趣味性。人臉識別在點播場景中得到了非常具體的應用。比如利用強大的人臉識別算法以及實時更新人臉庫,在存量點播視頻中將視頻做識別,網絡上刪除出現特定人物的內容。

三是語音識別。基於阿裏雲現有的語音識別技術,可以使直播過程中的社交更加簡單。比如實現用語音輸入彈幕,使用口令發紅包、送禮物等。在十月份剛剛舉辦完的杭州雲棲大會上,實時語音轉文字也得到了應用。

四是視頻大數據分析。通過對播放日誌,用戶行為日誌進行分析,為客戶優化運營提供數據分析上的支撐。也可以結合用戶行為,對用戶進行個性化的推薦,從而提高用戶的粘性和活躍度。後麵也會詳細介紹人工智能在視頻的消費環節的應用。

在視頻的分發環節,開發者真正的需求到底是什麼?阿裏雲又能提供什麼幫助?

對於開發者,更多關注的一點是地域覆蓋度。比如在中國某個區域,某個工作室或某個視頻公司產生視頻後,分發的對象或觀看的受眾不僅在全國,也輸送到海外。從地域覆蓋度角度,阿裏雲CDN有超過全球1200個結點,覆蓋全球六大洲。直播點播產品能阿裏雲CDN做無縫拚接,實現無論何時何地,視頻的觀看者都有非常流暢的播放體驗,使播放視頻的流暢率達到98%,這在行業內是領先水平的。

視頻流量大與CDN成本花費少是一個矛盾點,阿裏雲如何幫助客戶解決這個矛盾?

阿裏雲現在對外除了提供通用的CDN服務外,也提供了PCDN (P2P CDN的簡稱,價格是CDN的1/4)的加速服務。PCDN利用P2P技術,部署了超過百萬級別的PN節點,是CDN現有產品的一個非常好的補充。依托於PCDN技術不僅可以提升整體加速體驗、提升播放流暢率,也可以極大的降低分發成本。在直播業務場景裏,除了通常的通訊需求外,還要提供端到端,或端到用戶的流暢播放,這裏涉及全球傳播的問題。這個問題指當內容生產在海外需要分發到國內,或國內視頻輸送出國外都需要內容生產鏈路打通。在中國的一路直播信號輸送到國外的成本是比較高的,國外的直播信號傳輸到國內成本也是很高的。為了解決這個問題,阿裏雲最近發布了一款直播全球加速產品。這款產品利用阿裏雲優質的基礎設施,建立了從視頻采集到目的站間的全球高速通道。全球高速通道的可靠性和安全性都有極高的保障

視頻內容分發出去後,在內容消費的環節中,阿裏雲又能為開發者提供什麼樣的服務?

這裏可以從四個角度來回答這些問題:

從應用角度來看,阿裏雲在點播、直播、轉碼和短視頻的各個業務場景都有相應的功能產品提供,產品之間也會做相互的打通。客戶通常在直播的內容產生的同時,錄製成點播資源。比如短視頻拍完後,內容經過沉澱直接分發到點播視頻平台。阿裏雲也支持點播轉直播服務,比如點播台、節目的編排轉直播,直播CDN也支持直播回看或視頻直播。

除了應用角度,我們還非常注重在端上的能力。阿裏雲播放器SDK,提供全平台播放的解決方案,覆蓋了從flash,H5,iOS、安卓多平台的播放器SDK,適用於點播和直播的場景。同時SDK提供非常好的擴展性,用戶可以依托於SDK封裝自己的業務。點播服務已經建立了從上傳、轉碼、視頻分發到播放的全鏈路監控係統。通過這些係統可以查看客戶端的覆蓋率,比如網絡的情況、用戶的清晰度的占比、1080*780的播放占比、播放成功率,這樣可以有助於客戶定製策略,幫助開發者優化體驗。

從安全性角度來看,阿裏雲也提供了相應的解決方案。一個是依托於阿裏雲密鑰管理的視頻加密服務,支持全平台加密播放,有效防止視頻內容的泄密。同時阿裏視頻正在進行借助商業的第二產品相關開發工作。不久之後,客戶可以在阿裏雲商業平台上使用阿裏雲視頻加密服務。加密服務可用對在線教育、財經金融、行業培訓或視頻行業的獨播劇做內容的保護,有效防止第三方下載和對內容做二次分發,對內容進行全方位的保護。二是全方位防盜鏈機製。阿裏雲提供了從雲端到SDK的完整的加密方案。

從用戶體驗的角度來看,用戶體驗在直播場景裏要求是很高的。除了要求低延時之外,還需支持首屏秒開,保證播放的整體體驗的完整性。阿裏雲提供指標可度量。對一些關鍵的指標,如使用速度、卡頓率、播放錯碼做實時的跟蹤,客戶或平台方可以即時調取視頻的相關數據,根據視頻的數據對整個播放做策略性的調整。添加方可以根據分設備、分區域的用戶體驗報告,有針對性的進行調整業務。

在視頻消費環節,人工智能和視頻會擦出怎樣的火花?

人工智能在視頻消費應用上分為四個大方麵:

第一是視頻的內容分析。前麵說的視頻內容分析的部分是和電商、廣告的結合,現在分析的是在用戶消費這個環節上,主要用於提升搜索推薦的效果。阿裏大文娛和淘係強大的視頻生態環境為我們提供了非常豐富的資源和完備的鏈目體係。阿裏雲視頻服務場景可以涵蓋電商、娛樂、短視頻、長視頻等各類領域。目前,視頻內容理解服務已經廣泛應用在優酷、土豆、UC、鹹魚和手淘視頻內容上。經過集團內部應用的長期的驗證後,阿裏雲對外推出的服務是非常穩定和成熟的。

第二是視頻封麵選圖。通過對視頻內容的理解,結合畫麵的美學,選出最具有代表性的關鍵幀或者關鍵片段作為視頻的封麵圖,讓用戶一眼就能知道視頻的核心內容。同時阿裏雲也支持根據用戶信息的實時反饋和行為日誌實現個性化的首圖投放,提升用戶體驗的同時也能提高視頻的點擊率。這點在視頻雲的客戶、淘係、阿裏大文娛等相關產品中都得到了應用。

第三是視頻指紋。視頻指紋技術的優勢在於能多場景適配包括格式、分辨率。對不同分辨率的同源視頻具備非常好的識別能力。視頻指紋的精確度也非常高。

第四是視頻內容審核。阿裏雲基於深度學習技術和海量數據,智能的識別色情、暴恐、廣告、涉政等敏感的視頻或圖片,極大節省客戶人工審核的成本,降低違規的風險。除此之外,語音識別、人物識別、物體識別、場景識別這些視頻內容分析的技術也廣泛的應用在雲相冊和優酷土豆的視頻打標上。

以上所有人工智能技術在視頻AI領域的應用都是為了能夠提高工作效率,減少人工的成本和計算成本。

人工智能在視頻領域的應用日趨成熟,在未來阿裏視頻雲會朝哪些方向發展?

現在視頻AI的概念是非常火的,我們不是把人工智能技術落到口號上二是希望把這樣的功能產品化,落實到整個內容生產和內容消費的環節,幫助開發者提升效率、減少人力投入。阿裏雲視頻將會從兩個方麵入手。

第一個是生產智能。生產智能包含了兩個部分的內容。一是在內容生產環節幫助內容生產者做生產智能。例如自動截圖,自動拆條、自動生成字幕。目前,這些在視頻生產過程中大部分工作是由編輯或內容生產者人工完成的。現在短視頻非常流行,我們發現很多短視頻內容是從影視劇或長片裏截取的片段。人工智能是否能幫助大家做拆條的工作。比如說視頻網站的內容的審核。現在其實大部分審核,尤其對某些內容,大部分是通過人工的方式來審核的。有沒有可能通過AI技術做到內容智能審核。

對於內容信息的自動生成。現在視頻網站通用的做法是一個新的內容產生後,做一個分類。比如影片是屬於電視劇還是電影,是恐怖還是戰爭的題材,甚至對於導演演員都有詳細的劃分。這些目前都是通過人工打標或人工輸入方式去完成的。也就是說我們在生產智能的一部分能不能幫助客戶開發者、內容生產者自動生成內容、自動生成內容信息信息。這個講的是生產智能。

第二個是在消費層是否可以幫助開發者和內容的合作夥伴做消費智能。很多產品,像短視頻產品、直播網站、資訊APP都有自動推薦技術。這些技術目前是封鎖在各個APP技術人員手上。阿裏雲後期會開放一些標準能力,讓沒有具備這些開發能力的人能依托於雲計算技術服務,快速使用類似自動推薦服務。同時阿裏雲視頻在消費這一側希望能更多的幫助開發者和內容生產者做到商業打通。比如是否能在消費這一側將內容和商業平麵廣告等做靈活的打通,靈活的根據商業需求做內容的插入等。同時我們在手淘,天貓魔盒已經提供了“邊看邊買”應用,這是我們在消費智能的重要的早起產品而且也已經產品化了。我們希望在消費側形成一個穩定的、可落地的產品形態,幫助大家有更多的應用場景。不管是商業化變現還是內容的引領組合都聚焦在兩個點,就是做生產的智能和消費的智能。

視頻智能化發展是大趨勢。在不久的將來,技術可以更加實實在在、真正切切的走近我們每個人的生活中,滲透到每個生活的角落。在視頻領域,阿裏視頻雲會源源不斷的輸出更好的產品體驗、更完善的功能、更智能化的服務,把最合適的視頻推薦給最需要的人,給大家一個更廣闊、清晰、靈動的世界。

關於雙11,阿裏雲視頻有推出了哪些優惠活動?

想更多的了解阿裏視頻雲產品視頻能力,可以登錄阿裏雲官網中視頻點播、視頻直播、媒體轉碼的詳情頁。雙11期間,阿裏雲視頻也推出了很多的優惠,比如直播點播的流量包、短視頻SDK的折扣和滿減以及視頻直播鑒黃的零元體驗包,這些都非常歡迎大家去試用和使用,大家可以按需選取合適自己的服務和套餐。

最後更新:2017-10-31 23:04:37

  上一篇:go  自己工作常用的linux命令:tail 命令
  下一篇:go  針對項目中用到可播放rtmp格式的jwplayer視頻播放器