Tải bản đầy đủ - 0 (trang)
III. Các thuật toán thực hiện các kiểu SVC

III. Các thuật toán thực hiện các kiểu SVC

Tải bản đầy đủ - 0trang

Hình 3.8 Sơ đồ giải mã mở rộng thời gian [5]



Để trọn vẹn hình 3.9 chỉ ra các hướng dự đốn cho cấu trúc có phân tầng. Lớp cơ

sở gồm các slice I trong mỗi 12 slice và tập slice B đầu tiên, B6 v.v..Lớp 1 gồm tập slice

B thứ 2 (3,9,15..) được dự đoán từ lớp cơ sở. Lớp 2 gồm các slice B còn lại được dự đốn

từ lớp 0 và 1. Do đó, các tập con dưới đây có thể được giải mã độc lập:

Lớp 0, I0,B6,I12,...

Lớp 0 + lớp 1,I0,B3,B6,B9,...

Lớp 0+ lớp 1 + lớp 2, I0,B1,B2,B3,...

Vì các cơng cụ dự đốn cần thiết, như là ảnh P hoặc B được sử dụng cho tham

khảo, được hỗ trợ trong profile main và profile high của H264/AVC, mở rộng thời gian có

thể đạt được khơng cần bất cứ sự nào của chuẩn lõi H.264/AVC.



Hình 3.9 Cấu trúc dự đoán phân cấp [5]



3.2. Kỹ Thuật SVC theo chất lượng

Lớp cơ sở được mã hóa sử dụng bộ lượng tử tham số QP riêng biệt để tạo luồng bit

lớp 0 (hình 3.10). Với một khung video đơn A, tại bộ mã hóa, khung được mã hóa này

5



được giải mã từ lớp cơ sở và được xây dựng lại (khung A’0), khung A được mã hóa lại tại

một QP thấp hơn và do đó có chất lượng cao hơn, với khung được giải mã A’0 sẵn sàng

như một tham khảo dự đoán, để tạo ra luồng bit lớp cải tiến lớp 1. Lưu ý rằng A’0 sẽ

thường là một tham chiếu dự đốn hiệu quả khi nó giống với khung A trừ méo ban đầu

bởi nén. Các nguồn dự đoán, các khung được mã hóa trước trong bộ đệm ảnh giải mã đều

cũng sẵn sàng cho dự đoán của mỗi MB.

Một bộ giải mã lớp cơ sở đơn giản giải mã khung A0. Một bộ giải mã lớp cải tiến

yêu cầu khung A được giải mã, một tham khảo dự đoán để xây dựng lại khung A1 chất

lượng cao hơn.

Quá trình này có thể được lặp lại để tạo một tầng các lớp 0,1,2..., mỗi lớp sử dụng

khung xây dựng lại từ lớp bên dưới như là một tham khảo dự đoán và sử dụng một QP

thấp dần. SVC cung cấp cơng cụ có khả năng xây dựng lại các lớp cải tiến không cần giải

mã đầy đủ thông tin lớp cơ sở (dự đoán liên tầng bắt buộc).

H.264/SVC hỗ trợ mở rộng chất lượng hạt trung bình (MGS) và hạt thơ (CGS).

CGS có hiệu quả với trường hợp đặc biệt của mở rộng khơng gian trong đó, hệ số tăng lấy

mẫu và giảm lấy mẫu bằng 1. Có nghĩa là độ phân giải lớp cải tiến cũng giống độ phân

giải lớp tham khảo. Lớp cải tiến được mã hóa tại QP thấp hơn và do đó chất lượng cao

hơn lớp tham khảo thấp hơn. Tất cả công cụ mã hóa mở rộng khơng gian đã mơ tả có thể

sử dụng để dự đoán khung lớp cải tiến từ khung được xây dựng lại lớp tham khảo.

Một ứng dụng đặc trưng của mở rộng chất lượng là cung cấp các dạng chuỗi được

mã hóa tại tốc độ bit và mức chất lượng khác nhau, ví dụ các chuỗi con tốc độ bit thấp

hơn có thể được trích ra cho truyền dẫn qua các kênh với khả năng khác nhau. Với CGS,

số chuỗi con có tốc độ bit bị giới hạn bằng số lớp. Việc cung cấp số lớn tùy chọn tốc độ

bit sử dụng CGS yêu cầu một số lớn các lớp , điều này dẫn tới tăng sự phức tạp và khơng

hiệu quả để mã hóa.

Mở rộng chất lượng hạt trung bình (Medium grain quality scalability-MGS) giải

quyết giới hạn trên và nó có thể trích các luồng con tại một dải tốc độ bit rộng từ một

luồng bit mở rộng với một con số nhỏ các lớp chất lượng. Sử dụng MGS, bất cứ đơn vị

NAL trong một lớp cải tiến có thể bị loại bỏ khỏi luồng bit có thể giải mã đầy đủ. Điều

này làm cho nó có thể tạo ra tốc độ bit đầu ra biến đổi. Ví dụ, việc loại bỏ một số bất kỳ

đơn vị NAL lớp cải tiến làm nó có thể đáp ứng một tốc độ bit đích bất kỳ, với một độ dự

trữ lỗi xác định. Hình 3.10 chỉ ra một ví dụ luồng bit thích ứng hồn chỉnh gồm có

NALUs lớp cơ sở và NALUs lớp cải tiến.



6



Hình 3.10 Mở rộng chất lượng trung bình [5]



Hình 3.11 Kết hợp mở rộng chất lượng, không gian và thời gian [5]

Sử dụng MGS, các NALUs lớp nâng cao được lựa chọn có thể bị loại bỏ để cung

cấp các luồng con tại một tốc độ bit thấp hơn dần dần. Điểm chất lượng/ tốc độ bit thấp

nhất được cung cấp bởi luồng lớp cơ sở, chỉ bao gồm NALUs lớp cơ sở. SVC đặc tả các

thơng số dự đốn bù chuyển động phải không thay đổi giữa những sự biểu diễn của các

bức ảnh chính nhất định lớp cơ sở và lớp nâng cao. Nó cản trở sự lệch giữa sự xây dựng

7



lại bù chuyển động của các ảnh chủ chốt này tại bộ mã hóa và giải mã. Sự lệch do vậy bị

giới hạn tới khơng có các ảnh chủ chốt.

3.3 Kỹ Thuật SVC theo không gian (Spatial scalability):

Trong trường hợp mở rộng khơng gian (hình 3.11), lớp cơ sở có độ phân giải thấp

nhất và các lớp cải tiến liên tiếp có thể được giải mã để tạo ra độ phân giải cao hơn.

Khung video đầu vào A được hạ tần số lấy mẫu tại bộ mã hóa để tạo ra dạng A’ độ

phân giải thấp. Khung A’ được mã hóa tạo ra lớp cơ sở 0 và có thể được giải mã để gửi

đến đầu ra độ phân giải thấp khung A0. Bộ mã hóa xây dựng lại A0 và tăng tần số lấy

mẫu để tạo một khung tham khảo có độ phân giải như ban đầu (A). Khung tham khảo này

được sử dụng như một tham khảo dự đốn, cho phép bộ mã hóa tạo ra lớp cải tiến (lớp 1).

Tăng tần số lấy mẫu A0 sẽ là một tham khảo dự đoán tốt cho khung A bởi vì nó là cùng

một khung, với méo do hạ tần số lấy mẫu, mã hóa và tăng tần số lấy mẫu.

Một bộ giải mã lớp cải tiến tăng số mẫu A0 và sử dụng nó để xây dựng lại khung

cải tiến được giải mã A1. Với mở rộng không gian, q trình này có thể được lặp lại để

đưa ra một tầng của các lớp 0,1,2...Lớp có độ phân giải cao nhất có cùng độ phân giải với

chuỗi ban đầu; lớp thấp hơn được mã hóa tại những độ phân giải nhỏ dần.

Lớp cơ sở của luồng bit mở rộng khơng gian được mã hóa sử dụng cơng cụ

H.264/AVC. Mã hóa một MB trong một lớp cải tiến yêu cầu một số thay đổi phụ thuộc

vào kiểu dự đoán từ lớp thấp hơn. H264/SVC đi ra ngoài tiếp cận tăng tần số lấy mẫu lớp

thấp hơn và cung cấp vài chế độ dự đoán mới nhằm cải thiện hiệu suất mã hóa của kỹ

thuật nén mở rộng khơng gian.

Trong lớp cải tiến, bộ mã hóa trong hình 3.11, có một số tùy chọn cho việc dự

đoán MB hiện tại. Đầu tiên, tất cả các tùy chọn dự đốn thơng thường đều sẵn sàng. Các

mode Intra sử dụng các mẫu từ khung hiện thời tại độ phân giải lớp cải tiến, các mode

inter sử dụng các mẫu từ các khung được xây dựng lại và được mã hóa trước đấy tại độ

phân giải lớp cải tiến. Thứ 2, các tùy chọn xa hơn dưới đây cũng sẵn sàng, sử dụng lớp

thấp hơn được tăng tần số lấy mẫu, lớp cơ sở trong hình 3.12, hoặc lớp cải tiến độ phân

giải thấp hơn tiếp theo như là lớp tham chiếu. Lưu ý rằng, vị trí MB hiện tại tương ứng

với một khối nhỏ hơn trong lớp có độ phân giải thấp hơn. Giả sử một khối tương ứng 8x8

trong lớp tham khảo thấp hơn, vì vậy được gọi là tỉ lệ 2, hay 2x độ phân giải ngang và dọc

trong lớp cải tiến. Tuy vậy, các hệ số tỉ lệ giữa các lớp tùy ý được hỗ trợ bởi H264/SVC.

Các tùy chọn dự đoán:

1. Nâng cấp lớp tham khảo:

Với các khối Intra, co giãn lớp tham khảo tới cùng độ phân giải như lớp hiện tại (hình

10.8) và sử dụng lớp tham khảo như là tham khảo dự đoán phụ.

8



2. Chế độ cơ sở: sử dụng các lựa chọn dự đoán từ khối lớp tham khảo.



9



Tài liệu bạn tìm kiếm đã sẵn sàng tải về

III. Các thuật toán thực hiện các kiểu SVC

Tải bản đầy đủ ngay(0 tr)

×