視音頻編解碼基本術語及解釋
整理了一些基本視音頻術語,用於入門和查詢使用。
H264:
H264是視頻的標準,是MPEG4-10,基於內容的高效編碼方式.
H.264/MPEG-4第10部分,或稱AVC(AdvancedVideo Coding,高級視頻編碼),是一種視頻壓縮標準,一種被廣泛使用的高精度視頻的錄製、壓縮和發布格式。第一版標準的最終草案於2003年5月完成。
H.264/MPEG-4 AVC是一種麵向塊的基於運動補償的編解碼器標準。由ITU-T視頻編碼專家組與ISO/IEC聯合工作組——即動態圖像專家組(MPEG)——聯合組成的聯合視頻組(JVT,Joint Video Team)開發。因ITU-T H.264標準和 ISO/IEC MPEG-4 AVC標準(正式名稱是ISO/IEC 14496-10 — MPEG-4第十部分,高級視頻編碼)有相同的技術內容,故被共同管理。
H.264因其是藍光盤的一種編解碼標準而著名,所有藍光盤播放器都必須能解碼H.264。它也被廣泛用於網絡流媒體數據如Vimeo、YouTube、以及iTunes Store,網絡軟件如Adobe Flash Player和Microsoft Silverlight,以及各種高清晰度電視陸地廣播(ATSC,ISDB-T,DVB-T或DVB-T2),線纜(DVB-C)以及衛星(DVB-S和DVB-S2)。
============================================================================================
Gop:
Group of picture.
這是視頻的一個概念,簡稱圖片組.視頻序列由多個圖片組組成.
============================================================================================
I/P/B-frame:
I幀,一個編碼後的圖像,I幀的圖像編碼不依賴於前向和後向編碼.
P幀,是這一幀跟之前的一個關鍵幀(或P幀)的差別,解碼時需要用之前緩存的畫麵疊加上本幀定義的差別,生成最終畫麵。
B幀,是雙向差別幀,也就是B幀記錄的是本幀與前後幀的差別(具體比較複雜,有4種情況),換言之,要解碼B幀,不僅要取得之前的緩存畫麵,還要解碼之後的畫麵,通過前後畫麵的與本幀數據的疊加取得最終的畫麵。B幀壓縮率高,但是解碼時CPU會比較累。
============================================================================================
Fps:
Frame Per Second,每秒鍾幀率
============================================================================================
ES/PS/TS/PES:
ES: elementary stream, 用於某些硬盤播或編輯係統,如m2v.
ES--Elementary Streams (原始流)是直接從編碼器出來的數據流,可以是編碼過的視頻數據流(H.264,MJPEG等),音頻數據流(AAC),或其他編碼數據流的統稱。ES流經過PES打包器之後,被轉換成PES包。
ES是隻包含一種內容的數據流,如隻含視頻或隻含音頻等,打包之後的PES也是隻含一種性質的ES,如隻含視頻ES的PES,隻含音頻ES的PES等。每個ES都由若幹個存取單元(AU)組成,每個視頻AU或音頻AU都是由頭部和編碼數據兩部分組成,1個AU相當於編碼的1幅視頻圖像或1個音頻幀,也可以說,每個AU實際上是編碼數據流的顯示單元,即相當於解碼的1幅視頻圖像或1個音頻幀的取樣。
m2v:
是Mpg2文件的一種後綴, DVD的視頻格式,不包含音頻文件. MPEG-2 Video擴展名為.m2v的文件是一個視頻文件。Video only (without audio) encoded using MPEG-2 compression
PS: program stream, 用於播放或編輯係統,如m2p (MPEG-2 Program Stream File).
PS--Program Stream(節目流)PS流由PS包組成,而一個PS包又由若幹個PES包組成(到這裏,ES經過了兩層的封裝)。PS包的包頭中包含了同步信息與時鍾恢複信息。一個PS包最多可包含具有同一時鍾基準的16個視頻PES包和32個音頻PES包。
m2p:
為支持MPEG-2音頻和視頻壓縮的視頻容器格式,類似於MPEG-1文件,而且還支持隔行掃描視頻和更多的音頻通道,通常用於數字視頻流。
Video containerformat that supports MPEG-2 audio and video compression; similar to an MPEG-1file, but also supports interlaced video and more audio channels; commonly usedfor streaming digital video.
M2P files aregenerally used for streaming media; standard MPEG-2 video files typically havean .MPG extension, while standard MPEG-2 audio files usually have an .MP2extension.
TS: transition stream, 主要用於數據傳輸,如HDV(High-definition video)機器內部記錄的m2t.
TS--Transport Stream(傳輸流)由定長的TS包組成(188字節),而TS包是對PES包的一個重新封裝(到這裏,ES也經過了兩層的封裝)。PES包的包頭信息依然存在於TS包中。
m2t:
HDV Video File擴展名為.m2t的文件是一個視頻文件。
被許多高清攝像機采用的高清視頻錄製格式,通常被稱為HDV,采用MPEG-2壓縮存儲在DV或MiniDV的錄像帶高清視頻數據,支持720p的分辨率和1080i.
High-definitionvideo recording format used by many HD camcorders; commonly referred to as HDV;uses MPEG-2 compression to store HD video data on DV or MiniDV tapes; supportsresolutions of 720p and 1080i.
PES:
PES--Packetized Elementary Streams (分組的ES),ES形成的分組稱為PES分組,是用來傳遞ES的一種數據結構。PES流是ES流經過PES打包器處理後形成的數據流,在這個過程中完成了將ES流分組、打包、加入包頭信息等操作(對ES流的第一次打包)。PES流的基本單位是PES包。PES包由包頭和payload組成。
TS流與PS流的區別:
在於TS流的包結構是固定長度的,而PS流的包結構是可變長度的。PS包由於長度是變化的,一旦丟失某一PS包的同步信息,接收機就會進入失步狀態,從而導致嚴重的信息丟失事件。而TS碼流由於采用了固定長度的包結構,當傳輸誤碼破壞了某一TS包的同步信息時,接收機可在固定的位置檢測它後麵包中的同步信息,從而恢複同步,避免了信息丟失。因此在信道環境較為惡劣、傳輸誤碼較高時一般采用TS碼流,而在信環境較好、傳輸誤碼較低時一般采用PS碼流。
在數字電視係統中,模擬視音頻信號按照MPEG-2的標準,經過抽樣、量化及壓縮編碼形成基本碼流ES,基本碼流ES是不分段的連續碼流。
把基本碼流分割成段,並加上相應的頭文件打包形成的打包基本碼流PES,PES包和包之間可以是不連續的。
在傳輸時將PES包再分段打成有固定長度188B 的傳送碼流TS或可變長度的節目流包(PS包)。
PES隻是PS轉換為TS或TS轉換為PS的中間步驟或橋梁時,MPEG-2數據流互換的邏輯結構。
TS 和PS這兩種碼流分別適應於不同的場合應用,節目流PS適合在相對出錯較少的環境下使用,其長度是變化的,而傳送流TS能夠把多個節目在基於一個或多個時間標識的基礎上構成一個流,傳送流適合於出錯較多的場合下使用。
用數據包傳輸的優點是:網絡中信息可占用不同的連接線路和簡單暫存。通過數據包交織把多個數據流複用成一個新的數據流,便於解碼器按照相應順序對數據包進行靈活的整理,從而,為數據流同步和複用奠定了基礎。MPEG-2的結構可分為壓縮層和係統層,其中ES屬於壓縮層,PES和TS/PS屬於係統層。 在PES層,主要是在PES包頭信息中加入PTS(顯示時間標簽)和DTS(解碼時間標簽)用於視頻、音頻同步。
而在TS流中,TS包頭加入了PCR(節目時鍾參考),用於解碼器的係統時鍾恢複。
在節目流PS包頭中加入SCR,它的作用與PCR域相似。
例子:
MPEG-2對視頻的壓縮產生I幀、P幀、B幀。
把幀順序I1幀-P4幀-B2幀-B3幀-P7幀-B5幀-B6幀的編碼ES,通過打包並在每個幀中插入PTS/DTS標誌,變成PES。在插入PTS/DTS標誌時,由於在B幀PTS和DTS是相等的,所以無須在B幀多插入DTS。
而對於I幀和P幀,由於經過複用後數據包的順序會發生變化,顯示前一定要存儲於視頻解碼器的從新排序緩存器中,經過從新排序後再顯示,所以一定要同時插入 PTS和DTS作為從新排序的依據。
例如,解碼器輸入的圖像幀順序為I1-P4-B2-B3-P7-B5-B6,但顯示時P4一定要在B2、B3之後,在 PST和DTS的指引下,經過緩存器從新排序,以從建視頻幀順序為:I1-B2-B3-P4-P7-B5-B6。
在沒有B幀的情況下,I幀和P幀在編碼和解碼端的順序是一致的。
將PES包再打成更小的具固定長度的TS包時在其包頭位置加入了PCR和PID(包標識)。PID的值是由用戶確定的,解碼器根據PID把TS(多節目傳輸流)上不同節目的TS包區分出來,以重建原來的ES。另外,TS的包頭包含一個4bit的連續計數器,連續計數器可對PID包傳送順序計數,據計數器讀數,接收端可判斷是否有包丟失及包傳送順序錯誤。所以TS的包頭具有同步、識別、檢錯等功能。
TS單一碼流、混合碼流:
單一性:TS流的基本組成單位是長度為188字節的TS包。
混合性:TS流由多種數據組合而成,一個TS包中的數據可以是視頻數據,音頻數據,填充數據,PSI/SI表格數據等(唯一的PID對應)。
TS流由TS包組成,TS包為固定大小。
MPEG2編碼端流程:
PS/TS組成:
PS/TS及標準關係:
為什麼奇藝要把 iPad 客戶端上的 MP4 流改為 TS 流呢?TS 相對於 MP4 有什麼優勢呢?
眾說風雲
MPEG2 Program Stream結構簡單介紹:
MPEG2 Program Stream,即MPEG2-PS,與MPEG2-TS對應。MPEG2-PS是一種多路複用數字音頻、視頻等的封裝容器。其分為MPEG-1和MPEG-2兩部分。Program Stream將一個或多個分組但有共同的時間基準的基本數據流 (PES)合並成一個整體流。它是為可靠穩定的儲存媒介如光盤而設計的。據傳輸媒體的質量不同,MPEG-2中定義了兩種複合信息流:傳送流(TS:TransportStream)和節目流(PS:ProgramStream)。TS流與PS流的區別在於TS流的包結構是固定長度的,而PS流的包結構是可變長度的。
PS流格式介紹:
概念:
將具有共同時間基準的一個或多個PES組合(複合)而成的單一的數據流稱為節目流(Program Stream)。
ES是直接從編碼器出來的數據流,可以是編碼過的視頻數據流,音頻數據流,或其他編碼數據流的統稱。ES流經過PES打包器之後,被轉換成PES包。
……
============================================================================================
dts/cts/pts/scr/stc
pts: present time stamp
dts:decoding time stamp
cts: Composition Time Stamp
pts/dts是ES流轉化成為PES流時,加入PES流頭部的信息。主要是為了解決編碼和呈現時的數據順序不同所導致的問題,這個可以見ES/PS/TS章節中的例子部分。
cts:
I think I have understood the CTS. it isonly for B-frames. Because B-frames may depends fowarding frames to decode, sothe CTS means when this B-frame can be decoded, usually that means all thedepended frames are received.
從上麵這段注釋看,cts隻用於B幀,用於告訴解碼端所有B幀倚賴的I,P幀都已收到。
scr:system clockreference
stc:system time clock
Mpeg-2的同步及時間恢複--STC,PCR,DTS,PTS:
|---------------------------------------------------------------|
| TS/PS: Transport stream
| Packetized Stream
| |-------------------------------------------------------
| | PES: Packetized Elementary Stream
| | |-----------------------------------------------
| | | ES:Elementary stream
| | | |------------------------------------
| | | | | | | |
| | | | GOP:Group of pictures
| | | |------------------------------------
| | | | | |
| | |------------------------------------------------
| | | |
| |--------------------------------------------------------
| |
|----------------------------------------------------------------|
============================================================================================
Resolution:
解析度,指空間采樣率。
============================================================================================
AAC:
Advanced Audio Coding
出現於1997年,基於MPEG-2的音頻編碼技術。由Fraunhofer IIS、杜比實驗室、AT&T、Sony等公司共同開發,目的是取代MP3格式。2000年,MPEG-4標準出現後,AAC重新集成了其特性,加入了SBR技術和PS技術,為了區別於傳統的MPEG-2 AAC又稱為MPEG-4 AAC。
AAC編碼的主要擴展名有三種:
.AAC- 使用MPEG-2 Audio Transport Stream(ADTS,參見MPEG-2)容器,區別於使用MPEG-4容器的MP4/M4A格式,屬於傳統的AAC編碼(FAAC默認的封裝,但FAAC亦可輸出MPEG-4封裝的AAC)
.MP4 - 使用了MPEG-4 Part 14(第14部分)的簡化版即3GPP Media Release 6 Basic(3gp6,參見3GP)進行封裝的AAC編碼(Nero AAC編碼器僅能輸出MPEG-4封裝的AAC);
.M4A - 為了區別純音頻MP4文件和包含視頻的MP4文件而由蘋果(Apple)公司使用的擴展名,Apple iTunes對純音頻MP4文件采用了".M4A"命名。M4A的本質和音頻MP4相同,故音頻MP4文件亦可直接更改擴展名為M4A。
作為一種高壓縮比的音頻壓縮算法,AAC壓縮比通常為18:1,也有數據說為20:1,遠勝mp3;在音質方麵,由於采用多聲道,和使用低複雜性的描述方式,使其比幾乎所有的傳統編碼方式在同規格的情況下更勝一籌。不過直到2006年,使用這一格式存儲音樂的並不多,可以播放該格式的mp3播放器更是少之又少,目前所知僅有蘋果iPod、Sony Walkman(NWZ-A、NWZ-S、NWZ-E、NWZ-X係列)、任天堂NDSi和魅族M8(微軟最新推出的Windows 7附帶的Windows media player12也支持aac)。此外計算機上很多音樂播放軟件都支持AAC(前提是安裝過AAC解碼器),如蘋果iTunes。但在移動電話領域,AAC的支持度已很普遍,Nokia、Sony Ericsson、Motorola等品牌均在其中高端產品中支持AAC(一開始主要是LC-AAC,隨著移動電話性能的發展,HE-AAC的支持也已廣泛)。
AAC可以支持多達48個音軌,15個低頻(LFE)音軌,5.1多聲道支持,更高的采樣率(最高可達96kHz,音頻CD為44.1kHz)和更高的采樣精度(支持8bit、16bit、24bit、32bit,音頻CD為16bit)以及有多種語言的兼容能力,更高的解碼效率,一般來說,AAC可以在對比MP3文件縮小30%的前提下提供更好的音質。
============================================================================================
Audiosample rate:
音頻采樣率
============================================================================================
Audio channels:
看起來對音頻的采集在幾個點同時進行,然後分別形成音軌。
按擺設理解為;
7.1聲道:
1)前左主音箱。
2)前左環繞音箱。
3)前右主音箱。
4)前右環繞音箱。
5)後左環繞音箱。
6)後右環繞音箱。
7)中置音箱。
加上一個重低音音箱。
5.1聲道:
1)前左主音箱。
2)前右主音箱。
3)後左環繞音箱。
4)後右環繞音箱。
5)中置音箱。
加上一個重低音音箱。
主要區別是還原三維空間聲音的效果7.1好於5.1
============================================================================================
Audio bit per sample:
采樣位深度
============================================================================================
5.1channels:
見Audio sample rate
============================================================================================
ABR/CBR/VBR
ABR: Average Bit Rate
CBR: Constant Bit Rate
VBR: Variable bit rate
============================================================================================
Bitrate:
比特率
在通信和計算機領域,比特率(Bit rate,變量Rbit)是單位時間內傳輸或處理的比特的數量。比特率經常在通信領域用作連接速度、傳輸速度、信道容量、最大吞吐量和數字帶寬容量的同義詞。
============================================================================================
音頻幀
============================================================================================
Ffmpeg/X264/GPAC:
Ffmpeg為開源庫,集合了各種音頻,視頻編解碼協議。在FFmpeg中沒有實現264解碼,調用了X264解碼。
X264是對H264編碼標準的一種具體實現,是一個優秀的h264視頻文件格式的編碼器。
GPAC: 多媒體框架GPAC(graphics, animation and interactivity),是一個為科研和學術領域開發的多媒體的框架,支持 MPEG-4, VRML, X3D, SVG, LASeR 等 GPAC 包括一個多媒體播放器 Osmo4 以及多媒體打包工具 MP4Box。
============================================================================================
MP4:
MP4,全稱MPEG-4 Part 14,是一種使用MPEG-4的多媒體電腦文件格式,擴展名為.mp4,以存儲數字音頻及數字視頻為主。 MP4至2013年仍是各大影音分享網站所使用主流,即使他們是在網站上多加一層Flash的影音撥放接口。因為MP4可以在每分鍾約4MB的壓縮縮率下提供接近DVD質量的影音效果。
============================================================================================
Deinterlace:
去交錯亦稱“反交錯”(deinterlacing)是將交錯式(即隔行掃描)(interlace)影像訊號轉換為漸進式(逐行掃描)(progressive)影像訊號的一種方法。
============================================================================================
RTMP:
RTMP協議是被Flash用於對象,視頻,音頻的傳輸.該協議建立在TCP協議或者輪詢HTTP協議之上.
RTMP協議就像一個用來裝數據包的容器,這些數據可以是AMF格式的數據,也可以是FLV中的視/音頻數據.
一個單一的連接可以通過不同的通道傳輸多路網絡流.這些通道中的包都是按照固定大小的包傳輸的.
FMS3(Flash Media Server)中RTMP有5種類型
RTMP,標準類型,非加密實時消息協議。默認端口1935,如果端口沒有設定,FMS將嚐試用以下端口連接:443,80(RTMP),80(RTMPT)
RTMPT,借用HTTP通道的RTMP。RTMP數據通過HTTP封裝,默認端口80
RTMPS,在SSL之上的RTMP。FMS支持基於SSL的RTMP數據輸入和輸出,默認端口443
RTMPE,加密版本RTMP。RTMPE比RTMPS更快,但是不需要認證管理,隻需要在Adaptor.xml中打開。打開後,RTMPE通過以下端口嚐試通訊:935,443,80(RTMPE),80(RTMPTE)
RTMPTE,基於HTTP通道傳輸加密的RTMPE
<Flash Media Server 4.5 的安裝和使用>
============================================================================================
RTSP:
即時串流協定(Real Time Streaming Protocol,RTSP)是用來控製聲音或影像的多媒體串流協議,並允許同時多個串流需求控製,傳輸時所用的網絡通訊協定並不在其定義的範圍內,服務器端可以自行選擇使用TCP或UDP來傳送串流內容,它的語法和運作跟HTTP 1.1類似,但並不特別強調時間同步,所以比較能容忍網絡延遲。而前麵提到的允許同時多個串流需求控製(Multicast),除了可以降低服務器端的網絡用量,更進而支持多方視訊會議(Video Conference)。
因為與HTTP1.1的運作方式相似,所以代理服務器《Proxy》的緩衝功能《Cache》也同樣適用於RTSP,並因RTSP具有重新導向功能,可視實際負載情況來轉換提供服務的服務器,以避免過大的負載集中於同一服務器而造成延遲。
============================================================================================
MMS:
MMS是(Multimedia Messaging Service)的縮寫,中文意為多媒體短信服務,它最大的特色就是支持多媒體功能。多媒體信息使具有功能全麵的內容和信息得以傳遞,這些信息包括圖像、音頻信息、視頻信息、數據以及文本等多媒體信息,可以支持語音、因特網瀏覽、電子郵件、會議電視等多種高速數據業務,在GPRS網絡的支持下,以WAP無線應用協議為載體傳送視頻片段、圖片、聲音和文字。多媒體信息業務可實現即時的手機端到端、手機終端到互聯網或互聯網到手機終端的多媒體信息傳送。
===========================================================================================
XML:
可擴展標記語言(英語:eXtensible Markup Language,簡稱: XML),是一種標記語言。標記指計算機所能理解的信息符號,通過此種標記,計算機之間可以處理包含各種信息的文章等。如何定義這些標記,既可以選擇國際通用的標記語言,比如HTML,也可以使用像XML這樣由相關人士自由決定的標記語言,這就是語言的可擴展性。XML是從標準通用標記語言(SGML)中簡化修改出來的。它主要用到的有可擴展標記語言、可擴展樣式語言(XSL)、XBRL和XPath等。
TinyXml
============================================================================================
HTTP:
超文本傳輸協議(英文:HyperText Transfer Protocol,縮寫:HTTP)是互聯網上應用最為廣泛的一種網絡協議。設計HTTP最初的目的是為了提供一種發布和接收HTML頁麵的方法。通過HTTP或者HTTPS協議請求的資源由統一資源標識符(Uniform Resource Identifiers,URI)來標識。
HTTP的發展是萬維網協會(World WideWeb Consortium)和Internet工作小組(Internet Engineering Task Force)合作的結果,(他們)最終發布了一係列的RFC,其中最著名的RFC2616,定義了HTTP協議中現今廣泛使用的一個版本—HTTP 1.1。
============================================================================================
HLS:
HTTPLive Streaming(縮寫是 HLS)是一個由蘋果公司提出的基於HTTP的流媒體網絡傳輸協議。是蘋果公司QuickTime X和iPhone軟件係統的一部分。它的工作原理是把整個流分成一個個小的基於HTTP的文件來下載,每次隻下載一些。當媒體流正在播放時,客戶端可以選擇從許多不同的備用源中以不同的速率下載同樣的資源,允許流媒體會話適應不同的數據速率。在開始一個流媒體會話時,客戶端會下載一個包含元數據的extended M3U (m3u8) playlist文件,用於尋找可用的媒體流。
HLS隻請求基本的HTTP報文,與實時傳輸協議(RTP)不同,HLS可以穿過任何允許HTTP數據通過的防火牆或者代理服務器。它也很容易使用內容分發網絡來傳輸媒體流。
蘋果公司把HLS協議作為一個互聯網草案(逐步提交),在第一階段中已作為一個非正式的標準提交到IETF。但是,即使蘋果偶爾地提交一些小的更新,IETF卻沒有關於製定此標準的有關進一步的動作。
============================================================================================
MSS:
Microsoft Smooth Stream.
基於IIS Live Smooth Streaming技術流媒體直播係統
============================================================================================
JPG/PNG:
JPG:JPEG(發音為jay-peg,IPA:[ˈdʒeɪpɛg])是一種針對相片圖像而廣泛使用的一種有損壓縮標準方法。這個名稱代表Joint Photographic Experts Group(聯合圖像專家小組)。此團隊創立於西元1986年,1992年發布了JPEG的標準而在1994年獲得了ISO10918-1的認定。JPEG與視頻音頻壓縮標準的MPEG(Moving Picture Experts Group)很容易混淆,但兩者是不同的組織及標準。
PNG:便攜式網絡圖形(PortableNetwork Graphics,PNG)是一種無損壓縮的位圖圖形格式,支持索引、灰度、RGB[A]三種顏色方案以及Alpha通道等特性。PNG的開發目標是改善並取代GIF作為適合網絡傳輸的格式而不需專利許可,所以被廣泛應用於互聯網及其他方麵上。
PNG另一個非正式的名稱來源為遞歸縮寫:“PNGis Not GIF”
============================================================================================
H263/Mpeg4/Vp8:
H263:
H.263是由ITU-T製定的視頻會議用的低碼率視頻編碼標準,屬於視頻編解碼器。H.263最初設計為基於H.324的係統進行傳輸(即基於公共交換電話網和其它基於電路交換的網絡進行視頻會議和視頻電話)。後來發現H.263也可以成功的應用與H.323(基於RTP/IP網絡的視頻會議係統),H.320(基於綜合業務數字網的視頻會議係統),RTSP(流式媒體傳輸係統)和SIP(基於因特網的視頻會議)。
基於之前的視頻編碼國際標準(H.261,MPEG-1和H.262/MPEG-2),H.263的性能有了革命性的提高。它的第一版於1995年完成,在所有碼率下都優於之前的H.261。之後還有在1998年增加了新的功能的第二版H.263+,或者叫H.263v2,以及在2000年完成的第三版H.263++,即H.263v3。早期的H.263 新增以下的附加(annexes):
Annex A - Inverse transform accuracyspecification
Annex B - Hypothetical Reference Decoder
Annex C - Considerations for Multipoint
Annex D - Unrestricted Motion Vector mode
Annex E - Syntax-based Arithmetic Codingmode
Annex F - Advanced Prediction mode
Annex G - PB-frames mode
Annex H - Forward Error Correction forcoded video signal
在H.263之後,ITU-T(在與MPEG的合作下)的下一代視頻編解碼器是H.264,或者叫AVC以及MPEG-4第10部分。由於H.264在性能上超越了H.263很多,現在通常認為H.263是一個過時的標準(雖然它的開發完成並不是很久以前的事情)。大多數新的視頻會議產品都已經支持了H.264視頻編解碼器,就像以前支持H.263和H.261一樣。
MPEG-4:
MPEG-4是一套用於音頻、視頻信息的壓縮編碼標準,由國際標準化組織(ISO)和國際電工委員會(IEC)下屬的“動態圖像專家組”(Moving Picture Experts Group,即MPEG)製定,第一版在1998年10月通過,第二版在1999年12月通過。MPEG-4格式的主要用途在於網上流、光盤、語音傳送(視頻電話),以及電視廣播。
MPEG-4包含了MPEG-1及MPEG-2的絕大部份功能及其他格式的長處,並加入及擴充對虛擬現實模型語言(VRML,Virtual Reality Modeling Language)的支持,麵向對象的合成文件(包括音效,視頻及VRML對象),以及數字版權管理(DRM)及其他交互功能。而MPEG-4比MPEG-2更先進的其中一個特點,就是不再使用宏區塊做圖像分析,而是以圖像上個體為變化記錄,因此盡管圖像變化速度很快、碼率不足時,也不會出現方塊畫麵。
由於MPEG-4是一個公開的平台,各公司、機構均可以根據MPEG-4標準開發不同的製式,因此市場上出現了很多基於MPEG-4技術的視頻格式,例如WMV 9、Quick Time、DivX、Xvid等。MPEG-4大部份功能都留待開發者決定采用是否。這意味著整個格式的功能不一定被某個程序所完全函括。因此,這個格式有所謂配置(profile)及級別(level),定義了MPEG-4應用於不同平台時的功能集合。
VP8:
VP8是一個開放的圖像壓縮格式,最早由On2Technologies開發,隨後由Google發布。同時Google也發布了VP8編碼的實做庫:libvpx,以BSD授權條款的方式發布,隨後也附加了專利使用權。而在經過一些爭論之後,最終VP8的授權確認為一個開放源代碼授權。
目前支持VP8的網頁瀏覽器有Opera、Firefox和Chrome。
和H.264的比較
H.264是目前使用最多的網絡圖像編碼格式,因此最常拿來和VP8做比較。
H.264的編碼技術包含專利(由MPEG-LA提供授權),而且在硬件上使用需要取得授權,VP8則不需要。即使有Google的背書,但VP8仍然很難避過所有的專利,其下場可能跟VC-1如出一轍。管理H.264專利池的MPEG LA聲稱有12家公司持有Google VP8的相關專利。[38]美國MPEG LA表示:“創建VP8專利池的相關準備正在進行”。[39][40] 2013年三月,Google與MPEG LA及11個專利持有者達成協議,讓Google取得VP8以及其之前的VPx等編碼所可能侵犯的專利授權,同時Google也可以無償再次授權相關專利給VP8的用戶,此協議同時適用於下一代VPx編碼。至此MPEG LA放棄成立VP8專利集中授權聯盟,VP8的用戶將可確定無償使用此編碼而無須擔心可能的專利侵權授權金的問題。[41]
根據MSU Graphics & Media Lab在2011年5月的測試,VP8需要約213%的數據量,才能達到和H.264相同的圖像質量 [42]。
x264的開發者之一:JasonGarrett-Glaser,給了一些針對VP8的評論,他認為VP8目前並沒有實現真正的比特流規範,而且在一些編碼的技術上有所欠缺[43][44]。
============================================================================================
PSNR/SNR:
PSNR :Peak Signal to Noise Ratio,峰值信噪比
SNR:Signal to Noise Ratio,信噪比
客觀視頻評估技術是一些與主觀質量評估結果相近的數學模型,但是它們通常由計算機按照一定的標準與指標自動完成。評價的方法大致是將原視頻(高品質、一般不被壓縮)與處理後的視頻進行分類對比。分類對比分為三種:全參考(FR)、部分參考(RR)、無參考(NR)。全參考比較處理前後的兩段視頻每個像素的差別,部分參考提取兩段視頻的一些特性,並依此給予它們評分。以上兩種方法通常在原視頻可用時使用,如在有限的帶寬下。無參考則試圖在沒有任何原視頻的參考下進行評估,通常在視頻編碼方法已知時使用。
當然,最傳統的方法是計算兩段視頻信噪比(SNR)與峰值信噪比(PSNR)的差異。 PSNR是使用最廣泛的客觀視頻質量的度量方法,但由於人類視覺係統的非線性,因此PSNR值與人眼感受到的視頻質量仍有較大出入。近來一些更複雜、更精確的一些指標被指定, 比如UQI、VQM、PEVQ、結構相似性(SSIM)、VQuad-HD與CZD。
============================================================================================
MP3/MP2:
MP3:
動態圖像專家組-1或動態圖像專家組-2 音頻層III(MPEG-1 orMPEG-2 Audio Layer III),經常稱為MP3,是當今相當流行的一種數字音頻編碼和有損壓縮格式,它被設計來大幅降低音頻數據量,而對於大多數用戶的聽覺感受來說,重放的音質與最初的不壓縮音頻相比沒有明顯的下降。它是在1991年,由位於德國埃爾朗根的研究組織Fraunhofer-Gesellschaft的一組工程師發明和標準化的。 MP3的普及,曾對音樂產業造成極大的衝擊與影響。
MP3是一個數據壓縮格式。它舍棄脈衝編碼調製(PCM)音頻數據中,對人類聽覺不重要的數據(類似於JPEG是一個有損圖像壓縮),從而達到了壓縮成小得多的文件大小。
在MP3中使用了許多技術,其中包括心理聲學,以確定音頻的哪一部分可以丟棄。MP3音頻可以按照不同的比特率進行壓縮,提供了權衡數據大小和音質之間的依據。
MP3格式使用了混合的轉換機製將時域信號轉換成頻域信號:
32波段多相積分濾波器(PQF)
36或者12 tap 改良離散餘弦濾波器(MDCT);每個子波段大小可以在0...1和2...31之間獨立選擇
混疊衰減後處理
根據MPEG規範的說法,盡管有許多創造和推廣其他格式的重要努力,MPEG-4標準中的AAC(Advanced Audio Coding)將是MP3格式的接棒者。然而,由於MP3的空前的流通,在目前來說,其他格式並未能威脅其地位。MP3不僅有廣泛的用戶端軟體支持,也有很多的硬件支持,比如便攜式數位音頻播放器(泛指MP3播放器)、DVD和CD播放器。
MP2:
MPEG-1 Audio Layer II(有時簡稱MP2)是ISO/IEC11172-3(MPEG-1音頻部份)中訂立之有損性音頻壓縮格式。此標準還製訂了MPEG-1 Audio Layer I(MP1)和MPEG-1 Audio Layer III(MP3)。個人電腦和互聯網音樂流行MP3,MP2則多用於廣播。
============================================================================================
M3U/M3U8
m3u:
M3U本質上說不是音頻文件,它是音頻文件的列表文件。你下載下來打開它,播放軟件並不是播放它,而是根據它的記錄找到 網絡地址進行在線播放。M3U文件的大小很小,也就是因為它裏麵沒有任何音頻數據。把M3U文件直接轉換為音頻文件是不可能的,除非你把它指向的音頻文件下載下來再作處理……
m3u格式的文件隻是一個目錄文件,提供了一個指向其他位置的音頻視頻文件的索引,你播放的還是那些被指向的文件,用 記事本打開m3u文件可以查看所指向文件的地址及文件的屬性,以選用合適播放器播放。
============================================================================================
FAAC/FAAD:
FAAC(FreewareAdvanced Audio Coder):FAAC is an MPEG-4 and MPEG-2 AAC encoder。
FAAD(Freeware Advanced Audio Decoder):an AAC audio decoder, superseded by new version: FAAD2
============================================================================================
GAPC:
YUV420/422:
============================================================================================
RGB565/888:
============================================================================================
RGBA:
RGBA是代表Red(紅色)Green(綠色)Blue(藍色)和Alpha的色彩空間。雖然它有的時候被描述為一個顏色空間,但是它其實僅僅是RGB模型的附加了額外的信息。采用的顏色是RGB,可以屬於任何一種RGB顏色空間,但是Catmull和Smith在1971至1972年間提出了這個不可或缺的alpha數值,使得alpha渲染和alpha合成變得可能。提出者以alpha來命名是源於經典的線性插值方程αA + (1-α)B所用的就是這個希臘字母。
alpha通道一般用作不透明度參數。如果一個像素的alpha通道數值為0%,那它就是完全透明的(也就是看不見的),而數值為100%則意味著一個完全不透明的像素(傳統的數字圖像)。在0%和100%之間的值則使得像素可以透過背景顯示出來,就像透過玻璃(半透明性),這種效果是簡單的二元透明性(透明或不透明)做不到的。它使數碼合成變得容易。alpha通道值可以用百分比、整數或者像RGB參數那樣用0到1的實數表示。
有時它也被寫成ARGB(像RGBA一樣,但是第一個數據是alpha),是Macromedia的產品使用的術語。比如,0x80FFFF00是50%透明的黃色,因為所有的參數都在0到255的範圍內表示。0x80是128,大約是255的一半。
PNG是一種使用RGBA的圖像格式。
============================================================================================
PCM:
脈衝編碼調製(英文:Pulse-code modulation,縮寫:PCM)是一種模擬信號的數碼化方法。PCM將信號的強度依照同樣的間距分成數段,然後用獨特的數碼記號(通常是二進製)來量化。PCM常被用於數碼電信係統上,也是電腦和紅皮書中的標準形式。在數碼視頻中它也是標準,例如使用 ITU-R BT.601。但是PCM並不流行於諸如DVD或DVR的消費性商品上,因為它需要相當大的比特率(DVD格式雖然支持PCM,不過很少使用);與之相較,壓縮過的音頻較符合效率。不過,許多藍光光盤使用PCM作音頻編碼。非常頻繁地,PCM編碼以一種串行通信的形式,使數碼傳訊由一點至下一點變得更容易——不論在已給定的係統內,或物理位置。
============================================================================================
Logo:
圖標
============================================================================================
Subtitle:
字幕
============================================================================================
Closed caption:
CC字幕者,隱藏式字幕。其實多數CC字幕和劇本是一樣的,裏麵除了對白之外,還有現時場景的聲音和配樂等信息,之所以做CC字幕,在國外主要是為了方便有聽力障礙的殘障人士。在普通的電視機上是無法看見CC字幕的,而在電腦上是可以看見的。
Closed Captions (CC)是把文字加入NTSC電視信號的一種標準化編碼方法.電視機的內置解碼器或獨立解碼器能顯示文字.1993年以後美國出售的大於13英寸的電視機都有 Closed Caption 解碼器. Closed Captions可以用在 DVD, 錄象帶, 廣播電視, 電纜電視,等等.
單詞 caption 和 subtitle 意思很接近, captions通常是指特別設計的屏幕文字,而 subtitles 通常是指對話翻譯. 通常Captions出現在說話人物的下方,包含聲音和音樂描述.除非使用者激活Closed captions,否則它們不會顯示出來. Open captions總是可見的,比如外國錄象帶上的字幕.
DVD上的Closed Captions由 MPEG-2 視頻流攜帶,並且自動傳送到電視機上.你無法使用DVD播放機來打開或關閉ClosedCaptions. Subtitles是 DVD上的子圖象, 也就是全屏幕疊蓋圖形 (參閱 3.4 的技術細節). 可以打開32個子圖象軌道中的一個,以便在視頻頂部顯示文字或圖形. 子圖象也可用來創建captions. 為了區分NTSC Closed Captions和subtitles,由子圖象建立的 captions通常被稱為 'captions for the hearing impaired.'
如果你依然覺得混淆, 隻要記住這個建議: 要看 ClosedCaptions, 使用電視遙控器上的 CC按鈕. 要看 subtitles或 captionsfor the hearing impaired, 使用DVD遙控器上的 subtitle按鈕,或使用盤片提供的屏幕菜單.不要同時打開它們.記住並非所有DVD盤片有 Closed Captions 或字幕.
============================================================================================
High/Main/Baseline profiles:
H264的概念
============================================================================================
WMV/WMA/FLV:
WMV:
WMV(WindowsMedia Video)是微軟公司開發的一組數字視頻編解碼格式的通稱,它是Windows Media架構下的一部分。
它最初是為低速率流媒體應用作為專有編解碼開發出來的,但是2003年微軟公司基於Windows Media Video第9版編解碼起草了視頻編解碼規範並且提交給SMPTE申請作為標準。這個標準在2006年3月作為SMPTE 421M被正式批準,這樣Windows Media Video 9編解碼就不再是一個專有的技術。早期的編解碼版本(7和8)仍然被認為是專有技術,因為它們不在SMPTE 421M標準的涵蓋範圍內。
WMV不是僅僅基於微軟公司的自有技術開發的。從第七版(WMV1)開始,微軟公司開始使用它自己非標準MPEG-4 Part 2。但是,由於WMV第九版已經是SMPTE的一個獨立標準(421M,也稱為VC-1),有理由相信WMV的發展已經不像MPEG-4那樣是一個它自己專有的編解碼技術。現在VC-1專利共享的企業有16家(2006年4月),微軟公司也是MPEG-4 AVC/H.264專利共享企業中的一家。
WMV可以使用如MPlayer或者WindowsMedia Player這樣的播放器播放,Windows Media Player隻能在微軟視窗和Macintosh係統上使用。有許多用於如Linux這樣不同平台上的使用FFmpeg實現WMV編解碼的第三方播放器。
視頻流通常與Windows Media Audio音頻流組合在一起並且使用擴展名為.wmv或者.asf的Advanced Streaming Format的文件進行封裝。WMV通常使用AdvancedStreaming Format(ASF)封裝,它也可以使用AVI或者Matroska格式封裝。如果是AVI封裝的文件結果文件可以是.avi,如果是ASF封裝的話則是.wmv或者.asf,如果是MKV封裝的話則是.mkv。
當使用VirtualDub編碼器編碼和WMV9 VCM編解碼實現的時候WMV可以存儲在AVI文件中。用於Mac的微軟公司媒體播放器不支持所有的WMV編碼的文件,因為它隻支持ASF文件封裝,Flip4Mac和QuickTime或者用於MacOSX的MPlayer可以播放更多的文件。
當使用ASF文件格式封裝的時候,WMV能夠支持用於保護知識產權的數字版權管理(DRM)工具。
WMA:
WMA(WindowsMedia Audio)是微軟公司開發的一種數字音頻壓縮格式。一些使用Windows Media Audio編碼格式編碼其所有內容的純音頻ASF文件也使用WMA作為擴展名。
WMA格式最初為微軟公司私有,但是隨著蘋果公司的iTunes對它的支持,這個格式正在成為MP3格式的競爭對手之一。它兼容MP3的ID3元數據標簽,同時支持額外的標簽。
另外,一般情況下相同音質的WMA和MP3音頻,前者文件體積較小;“Windows Media Audio Professional”可以存儲5.1甚至7.1聲道的音樂,而且音質可媲美DolbyDigital(杜比數字)。
WMA可以用於多種格式的編碼文件中。應用程序可以使用Windows Media Format SDK進行WMA格式的編碼和解碼。一些常見的支持WMA的應用程序包括Windows Media Player、Windows Media Encoder、RealPlayer、Winamp等等。其它一些平台,例如Linux和移動設備中的軟硬件也支持此格式。
FLV:
Flash Video(簡稱FLV),是一種流行的網絡視頻格式。隨著視頻網站的豐富,這個格式已經非常普及。
FLV流媒體格式是一種新的視頻格式,它的出現有效地解決了視頻文件導入Flash後,使導出的SWF文件體積龐大,不能在網絡上有效使用等缺點。
一般FLV文件包在SWF PLAYER 的殼裏,並且FLV可以很好的保護原始地址,不容易被下載到,從而起到保護版權的作用。但還是有些視頻格式轉換軟件將FLV轉成一般的視頻格式,如中國的軟件格式工廠。
目前YouTube、NICONICO動畫、Google Video、Yahoo! Video、MySpace,以及中國的優酷、酷6等大部分視頻分享網站均采用這個格式。
============================================================================================
AVI/ASF:
AVI:
AVI是英語AudioVideo Interleave(“音頻視頻交織”或譯為“音頻視頻交錯”)的首字母縮寫,由微軟在1992年11月推出的一種多媒體文件格式,用於對抗蘋果Quicktime的技術。現在所說的AVI多是指一種封裝格式。
盡管AVI已經屬於老舊的技術,但是由於Windows的通用性,和簡單易懂的開發API,還在被廣泛使用。
AVI的文件結構、分為“頭部”,“主體”和“索引”三部分。主體中圖像數據和聲音數據是交互存放的。從尾部的索引可以索引跳到自己想放的位置。
AVI將視頻和音頻封裝在一個文件裏,其順序是:若幹視頻幀(Video Frame)之後接著若幹音頻幀(Audio Frame),再然後是視頻幀、音頻幀,故名為“音頻視頻交織”,意即音頻和視頻按幀交錯排列,以此達到音頻同步於視頻播放的效果。和DVD視頻格式一樣,AVI文件支持多視頻流和音頻流,雖然這些功能很少使用。大多數AVI文件還支持由Matrox OpenDML集團於1996年2月開發的格式後綴。這些文件非正式的稱為“AVI 2.0”,並得到微軟的支持。
AVI本身隻是提供了這麼一個框架,內部的圖像數據和聲音順據格式可以是任意的編碼形式。但是由於索引放在了文件尾部,所以在播放internet流媒體時已屬力不從心。
ASF:
ASF是(AdvancedStreamingFormat高級串流格式)的縮寫,是微軟公司針對real公司開發的新一代網上流式數字音頻壓縮技術,是Microsoft為Windows98所開發的串流多媒體文件格式。ASF是微軟公司WindowsMedia的核心。這是一種包含音頻、視頻、圖像以及控製命令腳本的數據格式。可和WMA及WMV互換使用。ASF是一個可擴展的文件格式用來存儲多媒體數據同步。它支持的數據傳輸了各種各樣的網絡和協議同時還證明適合當地播放。在明確目標的ASF是提供一個基礎,全行業的多媒體互操作性。每個格式的文件是由一個或多個媒體流。該文件頭指定的內容整個文件,連同流的具體內容。多媒體數據,儲存後的文件頭,特別提到媒體流編號,以表明其類型和目的。提供和介紹的所有媒體流數據同步到一個共同的時間線。
ASF是一個開放標準,它能依靠多種協議在多種網絡環境下支持數據的傳送。同JPG、MPG文件一樣,ASF文件也是一種文件類型,但它是專為在IP網上傳送有同步關係的多媒體數據而設計的,所以ASF格式的信息特別適合在IP網上傳輸。ASF文件的內容既可以是熟悉的普通文件,也可以是一個由編碼設備實時生成的連續的數據流,所以ASF既可以傳送人們事先錄製好的節目,也可以傳送實時產生的節目。
ASF用於排列、組織、同步多媒體數據以利於通過網絡傳輸。ASF是一種數據格式,它也可用於指定實況演示。ASF最適於通過網絡發送多媒體流,也同樣適於在本地播放。任何壓縮/解壓縮運算法則(編解碼器)都可用來編碼ASF流。
WindowsMediaService的核心是ASF。ASF是一種數據格式,音頻、視頻、圖像以及控製命令腳本等多媒體信息通過這種格式,以網絡數據包的形式傳輸,實現流式多媒體內容發布。其中,在網絡上傳輸的內容就稱為ASFStream。ASF支持任意的壓縮/解壓縮編碼方式,並可以使用任何一種底層網絡傳輸協議,具有很大的靈活性。
MicrosoftMediaplayer是能播放幾乎所有多媒體文件的播放器,支持ASF在Internet網上的流文件格式,可以一邊下載一邊實時播放,無需下載完再聽。ASF文件本地或網絡回放;可擴充的媒體類型;部件下載、可伸縮的媒體類型;流的優先級化;多語言支持、環境獨立性;豐富的流間關係以及擴展性等。
======================================================================================
CDS網絡
CDN的全稱是Content Delivery Network,即內容分發網絡。其目的是通過在現有的Internet中增加一層新的網絡架構,將網站的內容發布到最接近用戶的網絡"邊緣",使用戶可以就近取得所需的內容,解決Internet網絡擁塞狀況,提高用戶訪問網站的響應速度。從技術上全麵解決由於網絡帶寬小、用戶訪問量大、網點分布不均等原因,解決用戶訪問網站的響應速度慢的根本原因。
狹義地講
最後更新:2017-04-03 12:55:10
上一篇:
關於android的animation的xml定義中的android:interpolator屬性的含義
下一篇:
無鎖並發框架Disruptor
Android 深入ViewPager補間動畫,實現類京東商城首頁廣告Banner切換效果
展中華人民共和國稅收征收管理法(主席令第四十九號) 2015年8月15日 - 會關於修改〈中華人民共和國文物保護法〉等十二部法律的決定》(主席令第...第八十九條 納稅人、扣繳義務人可以委托稅務代理人代為辦理稅務事宜。 第...開相關人物 大中華人民共和國
IE環境下判斷IE版本的語句...[if lte IE 6]……[endif][if lte IE 7]……[endif]
Design and Application Learning of the Distributed Call Tracing System
Java中的模板模式
重磅 | 阿裏推出多智能體雙向協調網絡BicNet,玩《星際爭霸》堪比人類
淘寶差評的愛與恨
重要的話
網絡子係統12_鄰居子係統垃圾回收
Java設計模式:裝飾者模式