15
Lời nói đầu Với sự phát triển của công nghệ thông tin, và cùng với đó là sự phát triển ngày càng mạnh mẽ của các ứng dụng truyền thông đa phương tiện , đòi hỏi con người không ngừng tìm tòi sáng tạo để đáp ứng kịp với xu thế phát triển ấy. Nhờ vào sự phát triển của các ứng dụng truyền thông đa phương tiện mà chúng ta có thể đưa âm thanh, hình ảnh, hay các đoạn video đi xa một cách nhanh chóng và thuận tiện. Song với việc truyền tải một đoạn video có dung lượng lớn đi xa gặp khá nhiều khó khăn bởi khả năng có hạn của kênh dẫn.Vì vậy các nhà sản xuất đã áp dụng một số kỹ thuật nén để giúp tối ưu hóa các đoạn video trên, làm giảm dung lượng phải truyền đi mà chất lượng hình ảnh tương đương với hình ảnh gốc. Một trong các kỹ thuật nén tiên tiến nhất được sử dụng rộng rãi đó là chun nén H265 hay còn gi là chun HEVC (High Efficiency Video Coding). Qua quá trình nghiên cứu các chuyên gia đã cho ra đời chun nén H265 với nhiều tính năng ưu việt và nó hứa hn sẽ nhanh chóng được ứng dụng rộng rãi trong hệ thống thông tin video nén.

tiểu luận kỹ thuật truyền hình

Embed Size (px)

Citation preview

Page 1: tiểu luận kỹ thuật truyền hình

Lời nói đầuVới sự phát triển của công nghệ thông tin, và cùng với đó là sự phát triển ngày

càng mạnh mẽ của các ứng dụng truyền thông đa phương tiện , đòi hỏi con người không ngừng tìm tòi sáng tạo để đáp ứng kịp với xu thế phát triển ấy. Nhờ vào sự phát triển của các ứng dụng truyền thông đa phương tiện mà chúng ta có thể đưa âm thanh, hình ảnh, hay các đoạn video đi xa một cách nhanh chóng và thuận tiện. Song với việc truyền tải một đoạn video có dung lượng lớn đi xa gặp khá nhiều khó khăn bởi khả năng có hạn của kênh dẫn.Vì vậy các nhà sản xuất đã áp dụng một số kỹ thuật nén để giúp tối ưu hóa các đoạn video trên, làm giảm dung lượng phải truyền đi mà chất lượng hình ảnh tương đương với hình ảnh gốc. Một trong các kỹ thuật nén tiên tiến nhất được sử dụng rộng rãi đó là chuân nén H265 hay còn goi là chuân HEVC (High Efficiency Video Coding). Qua quá trình nghiên cứu các chuyên gia đã cho ra đời chuân nén H265 với nhiều tính năng ưu việt và nó hứa hen sẽ nhanh chóng được ứng dụng rộng rãi trong hệ thống thông tin video nén.

Page 2: tiểu luận kỹ thuật truyền hình

1. HEVC là gì?H.265/HEVC (High Efficiency Video Coding) là một định dạng nén video kế

thừa H.264/MPEG-4 AVC (Advanced Video Coding) được phát triển bởi ISO/IEC Moving Picture Experts Group (MPEG) và ITU-T Video Coding Experts Group (VCEG). MPEG và VCEG đã thành lập một nhóm cộng tác viên về mã hóa video để phát triển chuân HEVC.

HEVC có tỷ lệ nén dữ liệu gấp đôi so với H.264/MPEG-4 AVC ở cùng một mức độ chất lượng video. Nói cách khác nó có thể được sử dụng để cung cấp chất lượng hình ảnh được cải thiện đáng kể tại cùng một tốc độ bit . Hỗ trợ 8K UHD (Ultra high definition television) và độ phân giải lên đến 8192x4320 (4320P).

H.265/HEVC cũng mang lại những cải tiến về tiếng ồn, không gian màu sắc và quan trong nhất để giám sát một phạm vi hoạt động nâng cao. Một chuỗi các khung hình từ video nguồn sẽ được mã hoá hoặc nén lại bởi bộ mã hoá HEVC, kết quả là tạo ra một bitstream video đã được nén. Bitstream đã nén này có thể được lưu trữ hoặc truyền đi. Sau đó một bộ giải mã video sẽ giải nén bitstream này thành một chuỗi các khung hình để có thể trình chiếu video.

Hình 1: ưu thế của HVEC so với H.264HEVC cơ bản có cấu trúc tương tự như các tiêu chuân trước đó như MPEG-2 và

H.264/AVC. Tuy nhiên, HEVC có nhiều cải tiến mới như:- Phân vùng (Partition) linh hoạt hơn, với kích cỡ từ lớn đến nhỏ.- Linh hoạt hơn trong các chế độ dự báo (prediction modes) và chuyển đổi kích

thước khối (transform block).- Bộ loc nội suy và bộ loc khử khối (interpolation and deblocking) tinh vi hơn.

Page 3: tiểu luận kỹ thuật truyền hình

- Các chế độ dò tìm/dự báo và phát tín hiệu (prediction and signalling of modes), chuyển động của các vector (motion vectors) phức tạp hơn.

- Được trang bị tính năng hỗ trợ xử lý song song hiệu quả. Kết quả là HEVC cung cấp một tiêu chuân mã hoá video có khả năng nén tốt hơn giúp tăng khả năng xử lý hình ảnh.

Hình 2: cấu trúc của bộ mã hóa và giải mã HEVCVới HEVC, chúng ta có thể lưu trữ hoặc truyền tải video hiệu quả hơn so với các

công nghệ trước đó như H.264:Với kích thước và chất lượng hình ảnh tương đương, video nén bởi HEVC chiếm

ít dung lượng hơn so với video nén bằng H.264Với cùng dung lượng lưu trữ hoặc băng thông, chất lượng và độ phân giải của

video nén bởi HEVC cao hơn video tương ứng nén bởi H.2642. HEVC hoạt động như thế nào?

HEVC được dựa trên cấu trúc chung giống như tiêu chuân trước đó. Video nguồn bao gồm một chuỗi các khung hình video được mã hóa hay nén bởi một bộ mã hóa video để tạo ra bitstream video nén. Bitstream nén được lưu trữ hoặc truyền đi. Một bộ giải mã video giải nén bitstream để tạo ra một chuỗi các khung giải mã.

Các bước thực hiện bởi một bộ mã hóa video (hình 2) bao gồm: Phân vùng mỗi bức ảnh thành nhiều đơn vị Dự đoán mỗi đơn vị bằng cách sử dụng liên hoặc nội dự đoán, và trừ

các dự đoán từ các đơn vị Chuyển đổi lượng tử còn sót lại (sự khác biệt giữa các đơn vị hình ảnh

ban đầu và dự đoán)

Page 4: tiểu luận kỹ thuật truyền hình

Entropy mã hóa các biến đổi đầu ra, thông tin dự báo, chế độ thông tin và các tiêu đề

Một bộ giải mã video đảo ngược các bước : Entropy giải mã và trích xuất các yếu tố của chuỗi mã Thay đổi tỉ lệ và đảo ngược giai đoạn chuyển đổi Dự đoán từng đơn vị và thêm các dự đoán cho đầu ra của nghịch đảo Xây dựng lại một hình ảnh video giải mã

Các định nghĩa tiêu chuân HEVC (i) các cú pháp hoặc định dạng của một chuỗi video nén (ii) và một phương pháp giải mã một chuỗi nén. Thiết kế thực tế của bộ mã hóa không được tiêu chuân hóa. 2.1 Phân vùng HEVC hỗ trợ phân vùng rất linh hoạt của một chuỗi video liên tục (hình 3). Mỗi khung hình video hoặc hình ảnh đã được mã hóa được phân chia thành Titles và Slices và được tiếp tục phân chia thành Coding Tree Units (CTUs). CTU là đơn vị cơ bản của mã hóa, tương tự như các macroblock trong các tiêu chuân trước đó, và kích thước có thể lên đến 64x64 pixel. Một CTU có thể được chia thành các vùng ô vuông được goi là Coding Units (CUS) sử dụng cấu trúc Quadtree.

Hình 3: khung hình thể hiện Slices và CTU (code Tree unit) ( nguồn: Parabola Research)

2.2 Dự đoán (Prediction)Kỹ thuật đoán chuyển động dựa trên nguyên tắc là các khung hình trong

một cảnh Video (Video Sequence) dường như có liên quan mật thiết với nhau theo thời gian: Mỗi khung hình tại một thời điểm nhất định sẽ có nhiều khả năng

Page 5: tiểu luận kỹ thuật truyền hình

giống với các khung hình đứng ngay phía trước và ngay phía sau nó. Các bộ mã hoá sẽ tiến hành quét lần lượt từng phần nhỏ trong mỗi khung hình goi là MB, sau đó nó sẽ phát hiện MB nào không thay đổi từ khung hình này tới khung hình khác. Bộ mã hoá sẽ dự đoán trước sự xuất hiện của các MB khi biết vị trí và hướng chuyển động của nó. Do đó chỉ những sự thay đổi giữa các MB trong khung hình hiện tại và các MB được dự đoán mới được truyền tới bên phía thu.

Phía bên thu tức bộ giải mã đã lưu trữ sẵn những thông tin mà không thay đổi từ khung hình này tới khung hình khác trong bộ nhớ đệm của nó và chúng được dùng để điền thêm một cách đều đặn vào các vị trí trống trong ảnh được khôi phục.

Nén tín hiệu Video được thực hiện nhờ việc loại bỏ cả sự dư thừa về không gian (Spatial Coding) và thời gian (Temporal Coding). Trong Mpeg, việc loại bỏ dư thừa về thời gian (nén liên khung hình) được thực hiện trước hết nhờ sử dụng các tính chất giống nhau giữa các khung hình liên tiếp (Inter-Picture). Chúng ta có thể sử dụng tính chất này để tạo ra các khung hình mới nhờ vào những thông tin từ những khung hình đã gửi trước nó. Do vậy ở phía bộ mã hoá, chỉ cần gửi những khung hình có thay đổi so với những khung hình trước, sau đó dùng phương pháp nén về không gian (Spatial Coding) để loại bỏ sự dư thừa về không gian trong chính khung hình sai khác này. Nén về không gian dựa trên nguyên tắc là phát hiện sự giống nhau của các điểm ảnh (pixel) lân cận nhau (Intra-Picture).

Một Coding Unit (CU) được phân chia thành một hoặc nhiều Prediction Unit (PU), mỗi đơn vị được dự đoán sử dụng dự đoán Inter hoặc Intra. Dự đoán Intra: Mỗi PU được dự đoán từ dữ liệu hình ảnh lân cận trong cùng một hình ảnh, sử dụng dự đoán DC (giá trị trung bình cho PU), dự đoán phẳng (lắp một bề mặt phẳng với PU) hoặc dự đoán hướng (ngoại suy từ dữ liệu lân cận)

Một điểm chung với H.264 và MPEG-2 là HEVC sử dụng ba loại khung, I-, B-và P-frame trong một nhóm các ảnh, kết hợp các yếu tố của việc nén cả inter-frame và intra-frame. HEVC kết hợp nhiều tiến bộ, bao gồm:

Mã hóa Tree Blocks: khác với H.264 sử dụng macroblocks với kích thước tối đa 16x16, HEVC sử dụng mã hóa Tree Blocks, hoặc CTBs, với kích thước tối đa 64x64 pixel. Kích thước khối lớn đồng nghĩa với việc đạt được hiệu quả lớn hơn khi kích thước khung hình được mã hóa là lớn hơn, ví dụ như độ phân giải 4K. Điều này được thể hiện trong hình 1.

Page 6: tiểu luận kỹ thuật truyền hình

Hình 4. kích thước khối mã hóa lớn hơn giúp nâng cao hiệu quả.Nhiều dự đoán intra (intra-prediction): trong khi H.264 chỉ sử dụng 9 hướng nội

dự đoán thì HEVC có thể sử dụng trên 35.

hình 5: việc tìm kiếm được mở rộng để xác định thêm những khối pixel tham chiếu.

Dự đoán Inter: Mỗi PU được dự đoán từ dữ liệu hình ảnh trong một hoặc hai hình ảnh tham chiếu (trước hoặc sau khi hình ảnh hiện tại được hiển thị), sử dụng dự đoán bù trừ chuyển động. Vector chuyển động có độ phân giải lên đến quarter - sample (thành phần luma)

2.3.Chuyển đổi và lượng tửBất kỳ dữ liệu dư còn lại sau khi dự đoán được chuyển đổi bằng phép biến đổi

cosine rời rạc (DCT) hoặc phép biển đổi sin rời rạc (DST). Một hoặc nhiều khối biến đổi kích thước 32x32, 16x16, 8x8 và 4x4 được áp dụng cho dữ liệu còn lại trong mỗi CU. 

Page 7: tiểu luận kỹ thuật truyền hình

Công đoạn DCT biến đổi các giá trị điểm ảnh của khối thành một ma trận gồm các hệ số tần số ngang, doc đặt trong không gian tần số. Khi khối ban đầu có tần số không gian thấp, DCT sẽ tập hợp phần lớn năng lượng tần số vào góc tần số thấp của mạng. Nhờ vậy, những hệ số tần số thấp ở góc đó sẽ có giá trị cao hơn.

Một số lượng lớn các hệ số khác còn lại trên ma trận đều là các hệ số có tần số cao, năng lượng thấp và có giá trị thấp. Hệ số DC và một vài hệ số tần số thấp sẽ hàm chứa phần lớn thông tin được mô tả trong khối ban đầu. Điều này có nghĩa là bộ lập mã có thể loại bỏ phần lớn hệ số tần số cao còn lại mà không làm giảm đáng kể chất lượng hình ảnh của khối.

Bộ lập mã chuân bị các hệ số cho công đoạn này bằng cách quét chéo mạng lưới theo đường zig-zag, bắt đầu từ hệ số DC và qua vị trí của các hệ số ngang doc tăng dần. Do vậy nó tạo ra được một chuỗi hệ số được sắp xếp theo tần số.2.4 Mã hóa en-trô-pi (hệ số nhiễu loạn)

Dựa trên một hệ số tỷ lệ (có thể điều chỉnh bởi bộ mã hoá), bộ lượng tử hoá sẽ cân đối tất cả các giá trị hệ số. Do phần lớn hệ số đi ra từ DCT đều mang năng lượng cao nhưng giá trị thấp nên bộ lượng tử hoá sẽ làm tròn chúng thành 0. Kết quả là một chuỗi các giá trị hệ số đã được lượng tử hoá bắt đầu bằng một số giá trị cao ở đầu chuỗi, theo sau là một hàng dài các hệ số đã được lượng tử hoá về 0. Bộ lập mã entropy có thể theo dõi số lượng các giá trị 0 liên tiếp trong một chuỗi mà không cần mã hoá chúng, nhờ vậy giảm bớt được khối lượng dữ liệu trong mỗi chuỗi.

Một bitstream HEVC sẽ được mã hóa bao gồm chuyển đổi hệ số lượng tử, thông tin dự đoán như chế độ dự báo và vectơ chuyển động, thông tin phân vùng và dữ liệu khác... Tất cả những yếu tố này được mã hóa bằng cách sử dụng mã hóa nhị phân số hoc (CABAC). 3. HEVC tốt như thế nào?

Hình 5 là ảnh cận cảnh của 2 khung video đã được giải mã. Cùng một trình tự (Kristen và Sara, độ phân giải 720p) được mã hoá bằng cách sử dụng “high profile” H.264 (trái) và HEVC (phải) tại khoảng “bitrate” (420kbps). Chất lượng của clip HEVC rõ ang là tốt hơn. Ví dụ: Cận cảnh H.264 mmất nhiều chi tiết của tóc và có biến dạng rõ ang trong vùng mặt.

Page 8: tiểu luận kỹ thuật truyền hình

Hình 5: Khung mẫu mã hoá 420kbps sử dụng H.264 (trái) và HEVC (phải)Như thế nào là tốt hơn nhiều so với tiêu chuân HEVC trước đó? Điều này phụ

thuộc rất nhiều vào các đặc tính của video clip, thiết kế của bộ mã hoá video cũng như ý kiến của người xem. Một số nghiên cứu trước đó đã kết luận rằng HEVC có thể cung cấp chất lượng tương tự như H.264 một khoảng một nửa bitrate. Kết quả cụ thể có thể được thể hiện ở bảng dưới đây:

Bảng 1: so sánh các chuân nén video4. Triển vong ưng dung

Theo một báo cáo mang tên "HEVC Decoding in Consumer Devices", chuyên gia phân tích Michelle Abraham từ Nhóm nghiên cứu đa phương tiện ước tính rằng số

Page 9: tiểu luận kỹ thuật truyền hình

lượng các thiết bị tiêu dùng được xuất xưởng trong năm 2011 và 2012 có khả năng phát chuân HEVC (với một bản nâng cấp phần mềm) đạt khoảng 1,4 tỷ chiếc , và hơn một tỷ chiếc dự kiến sẽ được bán vào năm 2013.

Bảng 2 : số lượng các thiết bị tiêu dùng có hỗ trợ HEVC(sau khi nâng cấp phần mềm

Page 10: tiểu luận kỹ thuật truyền hình

Kết luận

HEVC đánh dấu một bước tiến lớn trong lĩnh vực nén video, áp dụng các kỹ thuật tiên tiến nhằm mục đích sử dụng băng thông hiệu quả hơn, hiệu suất nén cao hơn và đem lại chất lượng ảnh tốt hơn. Với các kỹ thuật này, HEVC có thể giảm tốc độ bit xuống hơn 50% so với chuân MPEG-4( H264) . Tuy nhiên, HEVC đòi hỏi một cấp độ phức tạp cao hơn trong cả quá trình lập mã lẫn giải mã. Mặc dù vậy, thử thách này hoàn toàn có thể chinh phục được nhờ có những tiến bộ mới liên tiếp trong khả năng xử lý phần mềm cũng như phần cứng. Điều này có nghĩa là HEVC là một ứng cử viên nặng ký có khả năng thay thế MPEG-4 trong những năm sắp tới.

Page 11: tiểu luận kỹ thuật truyền hình

Tài liệu tham khảo

1. “Overview of the High Efficiency Video Coding (HEVC) Standard” - “IEEE TRANSACTIONS ON CIRCUITS AND SYSTEMS FOR VIDEO TECHNOLOGY, VOL. 22, NO. 12, DECEMBER 2012”- trang 1649-1668

2. http://en.wikipedia.org/wiki/High_Efficiency_Video_Coding 3.