H.264 / MP4 / MPEG-4 / AVC
📅 1/21/2026#Video
H.264,又稱為MPEG-4,進階視訊編碼(MPEG-4 Part 10, Advanced Video Coding,縮寫為MPEG-4 AVC)是一種面向塊,基於運動補償的視訊編碼標準 。
H.264/AVC專案的目的是為了建立一個更佳的視訊壓縮標準,在更低的位元率的情況下依然能夠提供良好視訊品質的標準(如,一半或者更少於MPEG-2,H.263,或者MPEG-4 Part2 )。同時,還要不會太大的增加設計的複雜性。
H.264/MPEG-4 AVC是一種面向塊的基於運動補償的編解碼器標準。由ITU-T視訊編碼專家組與ISO/IEC聯合工作群組——即動態圖像專家組(MPEG) 下一個加入標準的主要特性是多視圖編碼(Multiview Video Coding,MVC)。據H.264/AVC附件H,MVC使得碼流結構可以表達一個視訊場景的不止一個視圖。該功能的一個重要例子是3D立體視訊編碼。
MPEG-4分部
MPEG-4由一系列的子標準組成,被稱為_部(part)(有時也譯為_卷),包括以下的部分:
- 第一部分(ISO/IEC 14496-1):系統:描述視訊和音訊資料流的控制、同步以及混合方式(即混流Multiplexing,簡寫為MUX)。
- 第二部分(ISO/IEC 14496-2):視訊:定義一個對各種視覺資訊(包括自然視訊、靜止紋理、電腦合成圖形等等)的編解碼器。(例如XviD編碼就屬於MPEG-4 Part 2)
- 第三部分(ISO/IEC 14496-3):音訊:定義一個對各種音訊訊號進行編碼的編解碼器的集合。包括進階音訊編碼(Advanced Audio Coding,縮寫為AAC)的若干變形和其他一些音訊/語音編碼工具(如Audio Lossless Coding,縮寫為ALS)。
- 第四部分(ISO/IEC 14496-4):一致性:定義對本標準其他的部分進行一致性測試的程式。
- 第五部分(ISO/IEC 14496-5):參考軟體:提供用於演示功能和說明本標準其他部分功能的軟體。
- 第六部分(ISO/IEC 14496-6):多媒體傳輸整合框架(DMIF for Delivery Multimedia Integration Framework)
- 第七部分(ISO/IEC 14496-7):最佳化的參考軟體:提供對實現進行最佳化的例子(這裡的實現指的是第五部分)。
- 第八部分(ISO/IEC 14496-8):在IP網路上傳輸:定義在IP網路上傳輸MPEG-4內容的方式。
- 第九部分(ISO/IEC 14496-9):參考硬體:提供用於演示怎樣在硬體上實現本標準其他部分功能的硬體設計方案。
- 第十部分(ISO/IEC 14496-10):進階視訊編碼或稱進階視訊編碼(Advanced Video Coding,縮寫為AVC):定義一個視訊編解碼器(codec)。AVC和XviD都屬於MPEG-4編碼,但由於AVC屬於MPEG-4 Part 10,在技術特性上比屬於MPEG-4 Part2的XviD要先進。另外,它和ITU-T H.264標準是一致的,故又稱為H.264。
- 第十二部分(ISO/IEC 14496-12):基於ISO的媒體檔案格式:定義一個儲存媒體內容的檔案格式。
- 第十三部分(ISO/IEC 14496-13):智慧財產權管理和保護(IPMP for Intellectual Property Management and Protection)拓展。
- 第十四部分(ISO/IEC 14496-14):MPEG-4(即MP4)檔案格式:定義基於第十二部分的用於儲存MPEG-4內容的視訊檔案格式。
- 第十五部分(ISO/IEC 14496-15):AVC檔案格式:定義基於第十二部分的用於儲存第十部分的視訊內容的檔案格式。
- 第十六部分(ISO/IEC 14496-16):動畫框架擴充(AFX : Animation Framework eXtension)。
- 第十七部分(ISO/IEC 14496-17):同步文字字幕格式。
- 第十八部分(ISO/IEC 14496-18):字型壓縮和串流傳輸(針對開放字型格式Open Font Format)。
- 第十九部分(ISO/IEC 14496-19):合成材質流(Synthesized Texture Stream)。
- 第二十部分(ISO/IEC 14496-20):簡單場景表示(LASeR for Lightweight Scene Representation。
- 第二十一部分(ISO/IEC 14496-21):用於描繪(Rendering)的MPEG-J拓展。
- 第二十二部分(ISO/IEC 14496-22):開放字型格式(Open Font Format)。
- 第二十三部分(ISO/IEC 14496-23):符號化音樂表示(Symbolic Music Representation)。
- 第二十四部分(ISO/IEC 14496-24):音訊與系統互動作用(Audio and systems interaction)。
- 第二十五部分(ISO/IEC 14496-25):3D圖形壓縮模型(3D Graphics Compression Model)。
- 第二十六部分(ISO/IEC 14496-26):音訊一致性檢查:定義測試音訊資料與ISO/IEC 14496-3是否一致的方法(Audio conformance)。
- 第二十七部分(ISO/IEC 14496-27):3D圖形一致性檢查:定義測試3D圖形資料與ISO/IEC 14496-11:2005, ISO/IEC 14496-16:2006, ISO/IEC 14496-21:2006,和ISO/IEC 14496-25:2009是否一致的方法(3D Graphics conformance)。
Profiles是在每個部分內定義的,所以對某個部分的一個實現通常不是對該部分的完整實現。