Tải bản đầy đủ - 0 (trang)
Phần 1: Tìm hiểu về tiêu chuẩn nén video H264

Phần 1: Tìm hiểu về tiêu chuẩn nén video H264

Tải bản đầy đủ - 0trang

vậy phổ biến để tham khảo các tiêu chuẩn với các tên như H.264 / AVC, AVC / H.264, H.264 /

MPEG-4 AVC, hoặc MPEG-4 / H.264 AVC, để nhấn mạnh di sản chung. Thỉnh thoảng, nó còn

được gọi là "bộ giải mã JVT", tham chiếu đến tổ chức Joint Video Team (JVT) đã phát triển nó.

Ví dụ, tiêu chuẩn nén video được gọi là MPEG-2 cũng xuất phát từ sự hợp tác giữa MPEG và

ITU-T, trong đó video MPEG-2 được cộng đồng ITU-T biết đến là H .262. [4]) Một số chương

trình phần mềm (như trình phát media VLC) xác định nội bộ tiêu chuẩn này là AVC1.

III. Lịch sử

Vào tháng 12 năm 2001, VCEG và Nhóm chun gia hình ảnh chuyển động (MPEG - ISO / IEC

JTC 1 / SC 29 / WG 11) đã thành lập một Nhóm Video chung (JVT), với điều lệ để hoàn thành

tiêu chuẩn mã hóa video. Sự chấp thuận chính thức của đặc tả này được đưa ra vào tháng 3 năm

2003. JVT là (được) chủ trì bởi Gary Sullivan, Thomas Wiegand và Ajay Luthra (Motorola, Mỹ:

sau này là Arris, Hoa Kỳ). Vào tháng 6 năm 2004, dự án Fidelity range extensions (FRExt) đã

được hoàn thành. Từ tháng 1 năm 2005 đến tháng 11 năm 2007, JVT đã làm việc trên một phần

mở rộng của H.264 / AVC theo hướng mở rộng bởi một Phụ lục (G) được gọi là Mã hóa Video

có thể mở rộng (SVC). Nhóm quản lý JVT đã được mở rộng bởi Jens-Rainer Ohm (Đại học

Aachen, Đức). Từ tháng 7 năm 2006 đến tháng 11 năm 2009, JVT đã làm việc trên Mã hóa

Video Multiview (MVC), một phần mở rộng của H.264 / AVC đối với truyền hình xem và truyền

hình 3D miễn phí. Cơng việc đó bao gồm sự phát triển của hai cấu hình mới của tiêu chuẩn: Cấu

hình cao Multiview và Cấu hình cao âm thanh nổi.

Việc chuẩn hóa phiên bản đầu tiên của H.264 / AVC được hoàn thành vào tháng 5 năm 2003.

Trong dự án đầu tiên mở rộng tiêu chuẩn ban đầu, JVT sau đó đã phát triển cái được gọi là

Fidelity Range Extensions (FRExt). Các phần mở rộng này cho phép mã hóa video chất lượng

cao hơn bằng cách hỗ trợ độ chính xác độ sâu bit mẫu và thơng tin màu độ phân giải cao hơn,

bao gồm các cấu trúc lấy mẫu được gọi là Y'CbCr 4: 2: 2 (= YUV 4: 2: 2) và Y'CbCr 4: 4 :4. Một

số tính năng khác cũng được bao gồm trong dự án Fidelity Range Extensions, chẳng hạn như

chuyển đổi thích ứng giữa các biến đổi số nguyên 4 × 4 và 8 × 8, ma trận trọng số dựa trên tri

thức được mã hóa dựa trên cảm xúc, mã hóa lossless liên tiếp hiệu quả và hỗ trợ màu bổ sung

không gian. Công việc thiết kế trên Fidelity Range Extensions đã được hoàn thành vào tháng 7

năm 2004, và công việc soạn thảo chúng được hoàn thành vào tháng 9 năm 2004.



3



Dương Thái Chi – 1533659 – 59PM1



IV. Các ứng dụng

Định dạng video H.264 có phạm vi ứng dụng rất rộng bao gồm tất cả các dạng nén video kỹ

thuật số từ các ứng dụng phát trực tuyến tốc độ bit thấp tới HDTV và các ứng dụng Cinema

Digital với mã hóa gần như không bị mất. Với việc sử dụng H.264, tỷ lệ tiết kiệm bit từ 50% trở

lên so với MPEG-2 Phần 2 được báo cáo. Ví dụ, H.264 đã được báo cáo để cung cấp cho cùng

một chất lượng truyền hình vệ tinh kỹ thuật số như hiện tại MPEG-2 triển khai với ít hơn một

nửa tốc độ bit, với hiện tại MPEG-2 triển khai làm việc ở khoảng 3,5 Mbit / s và H.264 chỉ 1,5

Mbit / s. [23] Sony tuyên bố rằng chế độ ghi AVC 9 Mbit / s tương đương với chất lượng hình

ảnh của định dạng HDV, sử dụng khoảng 18-25 Mbit / s.



4



Dương Thái Chi – 1533659 – 59PM1



5



Dương Thái Chi – 1533659 – 59PM1



V. Tính năng của H264

H.264 / AVC / MPEG-4 Phần 10 chứa một số tính năng mới cho phép nó nén video hiệu quả hơn

nhiều so với các chuẩn cũ hơn và cung cấp sự linh hoạt hơn cho ứng dụng cho nhiều môi trường

mạng khác nhau. Đặc biệt, một số tính năng chính như vậy bao gồm:

- Dự đốn nhiều hình ảnh liên tiếp

- Dự đốn khơng gian từ các cạnh của các khối lân cận cho mã hóa "bên trong", chứ khơng phải

là dự đốn "DC" được tìm thấy trong MPEG-2 Phần 2 và dự đoán hệ số biến đổi được tìm thấy

trong H.263v2 và MPEG-4 Phần 2. Điều này bao gồm luma kích thước khối dự đốn là 16 × 16,

8 × 8 và 4 × 4 (trong đó chỉ có một loại có thể được sử dụng trong mỗi macroblock).

- Tính năng mã hóa macroblock lossless

- Tính năng mã hóa video qt xen kẽ linh hoạt

- Tính năng thiết kế biến đổi mới

- Thiết kế lượng tử hóa

- Bộ lọc gỡ lỗi trong vòng giúp ngăn chặn các hiện vật bị chặn phổ biến với các kỹ thuật nén

hình ảnh dựa trên DCT khác, dẫn đến hình ảnh trực quan và hiệu quả nén tốt hơn

- Thiết kế mã hóa entropy

- Tính năng phục hồi dữ liệu đã mất đi

- Một quy trình tự động đơn giản để ngăn chặn việc mô phỏng ngẫu nhiên các mã khởi đầu, là

các chuỗi đặc biệt của dữ liệu được mã hóa cho phép truy cập ngẫu nhiên vào bitstream và khôi

phục liên kết byte trong các hệ thống có thể mất đồng bộ hóa byte.

- Hình ảnh phụ trợ, có thể được sử dụng cho các mục đích như tổng hợp alpha.

- Hỗ trợ đơn sắc (4: 0: 0), 4: 2: 0, 4: 2: 2 và 4: 4: 4 lấy mẫu màu

- Hỗ trợ độ chính xác độ sâu bit mẫu từ 8 đến 14 bit cho mỗi mẫu



6



Dương Thái Chi – 1533659 – 59PM1



- Khả năng mã hóa các mặt phẳng màu riêng biệt thành hình ảnh riêng biệt với cấu trúc lát riêng,

chế độ macroblock, vectơ chuyển động, v.v., cho phép các bộ mã hóa được thiết kế với cấu trúc

song song đơn giản

- Số thứ tự hình ảnh, một tính năng nhằm giữ trật tự của hình ảnh và giá trị mẫu trong hình ảnh

đã giải mã được tách biệt với thông tin thời gian, cho phép thông tin định thời được điều khiển

và thay đổi riêng biệt bởi hệ thống mà không ảnh hưởng đến nội dung hình ảnh đã giải mã.

Những kỹ thuật này, cùng với nhiều kỹ thuật khác, giúp H.264 hoạt động tốt hơn đáng kể so với

bất kỳ tiêu chuẩn nào trước đây trong nhiều trường hợp khác nhau trong nhiều mơi trường ứng

dụng khác nhau. H.264 thường có thể thực hiện hoàn toàn tốt hơn so với video MPEG-2 —

thường có cùng chất lượng ở một nửa tốc độ bit hoặc ít hơn, đặc biệt là ở tốc độ bit cao và các

tình huống có độ phân giải cao.



7



Dương Thái Chi – 1533659 – 59PM1



Phần 2: Tìm hiểu về FFMPEG

I. Giới thiệu tổng quát

- FFmpeg là một dự án phần mềm tự do , sản phẩm trong đó là một bộ phần mềm rộng lớn gồm

các thư viện và chương trình để xử lý video, âm thanh và các tập tin đa phương tiện và luồng

khác.

- Chính cốt lõi của nó là chương trình FFmpeg, được thiết kế để xử lý các tệp video và âm thanh

dựa trên dòng lệnh , được sử dụng rộng rãi để chuyển mã định dạng , chỉnh sửa cơ bản (cắt

và nối ), chia tỷ lệ video , hiệu ứng hậu sản xuất video và tuân thủ các tiêu chuẩn

( SMPTE , ITU ).

- FFmpeg bao gồm libavcodec , codec âm thanh / videothư viện được sử dụng bởi nhiều sản

phẩm phần mềm thương mại và miễn phí, libavformat (Lavf), thư viện chứa dữ liệu âm thanh /

video và thư viện demux và chương trình dòng lệnh ffmpeg lõi để chuyển mã các tệp đa phương

tiện. FFmpeg được xuất bản theo Giấy phép Cơng cộng Ít hơn GNU 2.1+ hoặc Giấy phép Cơng

cộng GNU 2+ (tùy thuộc vào tùy chọn nào được bật).

II. Lịch sự hình thành và phát triển

- Dự án được bắt đầu bởi Fabrice Bellard (sử dụng bút danh "Gérard Lantau") vào năm 2000, và

được dẫn dắt bởi Michael Niedermayer từ năm 2004 đến năm 2015. Một số nhà phát triển

FFmpeg cũng là một phần của dự án MPlayer .

- Hai định dạng mã hóa video với các codec tương ứng và một định dạng container đã được tạo

trong dự án FFmpeg cho đến nay. Hai codec video là FFV1 không mất mát và codec Snow

lossless và mất dữ liệu. Sự phát triển của Snow đã bị đình trệ, trong khi định dạng luồng bit của

nó vẫn chưa được hồn thiện, làm cho nó thử nghiệm từ năm 2011. Định dạng container đa

phương tiện có tên NUT khơng còn được phát triển tích cực nữa, nhưng vẫn được duy trì.

- Vào tháng 10 năm 2013, một VP9 nguyên gốc và bộ giải mã OpenHEVC, bộ giải mã mã hóa

video hiệu quả cao (HEVC) mã nguồn mở , đã được thêm vào FFmpeg. Vào năm 2016, bộ mã

hóa AACgốc được coi là ổn định, loại bỏ hỗ trợ cho hai bộ mã hóa AAC bên ngồi



8



Dương Thái Chi – 1533659 – 59PM1



từ VisualOn và FAAC . FFmpeg 3.0 (biệt hiệu "Einstein"  ) vẫn giữ lại hỗ trợ xây dựng cho bộ

mã hóa Fraunhofer FDK AAC .

III. Các thành phần

 Cơng cụ dòng lệnh

- ffmpeg là một cơng cụ dòng lệnh chuyển đổi các định dạng âm thanh hoặc video. Nó cũng có

thể nắm bắt và mã hóa trong thời gian thực từ các nguồn phần cứng và phần mềm khác nhau như

thẻ chụp TV.

- ffplay là một trình chơi nhạc đơn giản sử dụng SDL và các thư viện FFmpeg.

- ffprobe là một cơng cụ dòng lệnh để hiển thị thơng tin phương tiện (văn

bản, CSV , XML , JSON ).



 Thư viện



- libswresample là một thư viện chứa các thói quen lấy lại âm thanh .

9



Dương Thái Chi – 1533659 – 59PM1



Tài liệu bạn tìm kiếm đã sẵn sàng tải về

Phần 1: Tìm hiểu về tiêu chuẩn nén video H264

Tải bản đầy đủ ngay(0 tr)

×