المعلوماتية > برمجيات

مستقبل تقنيات ضغط الفيديو وتقنية (AV1) الجديدة

في الأيام الحالية، لعلنا نمضي جُلّ أيامنا في مشاهدة الفيديوهات على الإنترنت؛ من فيديوهات التطبيق الشهير" TikTok" إلى "YouTube" إلى "Facebook Watch". 

وفي خضمّ هذا التطور، نسأل اليوم عن تقنيات ضغط الفيديوهات التي تساعد على نقل هذه الفيديوهات إليك لتتمكن من مشاهدتها. على سبيل المثال؛ في حال أردت مشاهدة فيديو غير مضغوط بدقة 1080p فيجب عليك التفكير بأنّ:

24-bit، 1080i @ 60 fps: 24 × 1920×540[b] × 60 = 1.49 Gbit/s
24-bit، 1080p @ 60 fps: 24 × 1920×1080 × 60 = 2.98 Gbit/s.
ولنكن واقعيين، معظمنا لا يستطيع الحصول على هذه السرعات في المنزل! ولذلك؛ لا بد من ضغط الفيديو إلى حجم يمكن معه المشاهدة بتجربة ممتعة.

إنّ استهلاكنا للفيديوهات سيصل إلى 82% من محتوى الإنترنت في عام 2022 (1)، ومع ارتفاع الطلب على تقنيات الاجتماع عبر الإنترنت (Video Conferencing) والبث المباشر؛ أُطلِقت عدة طرائق للبث عبر الإنترنت.

من أشهر هذه التقنيات: HTTP Dash، وHTTP Live Stream HLS؛ إذ يضغط المخدمُ الفيديو إلى عدة دقات مختلفة، ويقدّم الدقة المناسبة للمستخدم عبر ملف Manifest. (2)

ومن أجل ضغط هذه الملفات إلى مستويات دقة مختلفة، ولتوفير أماكن الوصول إلى الفيديو عمومًا؛ أُجريت في العقود الثلاثة الأخيرة عدةُ قفزات في مجال ضغط الفيديو. ومن أول خوارزميات الـ codec (وهي كلمة مختصرة عن compression وdecompression) المستخدمة بكثرة؛ كانت خوارزمية H.120، ثم طُوّرت إلى الخوارزمية الشهيرة MPEG-2 H.262، ومن ثم H.264/AVC. وقد أُطلِق مؤخرًا (Versatile Video Coding (VVC الذي يفترض أن يخفف الـ Bit Rate (معدل دفق البيانات) بنسبة 30%-50% من الوضع الحالي مع HEVC/H.265؛ مما يؤثر إيجابًا في حجم الملف النهائي بتخفيضه أيضًا. وعلى نحو منفصل؛ أنتج the Alliance for Open Media خوارزميتهم الخاصة "AV1" وأصدروها بصيغة ملف مفتوح المصدر Open Source. (3)

ولكن؛ كيف يُضغَط الفيديو؟

يشير أندي بيتش Andy Beach في كتابه "Real World Video Compression" إلى أنّ ضغط الفيديو يقوم على تحليل كل إطار (Frame) في الفيديو على حدة، ومحاولة إنشائه بكمّ أقل من البيانات، علمًا أنّ هذه العملية تُجرَى باستخدام codec التي تحلّ هذه المشكلة بعدة طرائق. 

على سبيل المثال؛ إذا كان لديك مشهد يتألف من لون أسود مدةَ 10 ثوان، فيكفي أن تتذكر الخوارزمية أنّ الشاشة سوداء لتركّب كل الأطر المكوّنة لهذا المشهد، ولكن لمّا كانت أغلب المشاهد تتألف من أكثر من لون واحد؛ فإن الخوارزمية تحلل تغيرَ اللون في المناطق المختلفة من الشاشة، وتضغط نتائج التحليل، وتتخلص من البيانات غير الضرورية، وتحفظ نتيجة قريبة قربًا كافيًا من الفيديو الأصلي في ملف، ومن ثم يعرض المستخدم المشهدَ من خلال الملف الناتج.

يُحلل تغير اللون على مجموعة من البكسلات في الإطار، وتسمى كل مجموعة منها macroblock؛ إذ تعيّن الخوارزمية لكل macroblock قيمًا يُعاد من خلالها تشكيل صورة قريبة كفاية من صورة الكاميرا الأساسية دون الحاجة إلى معرفة لون كل بكسل التقطته الكاميرا سابقًا، ويُعدّ هذا أساسَ عمل لواحق DV و MPEG (4).

وعلى سبيل المثال؛ في إطارٍ مؤلف من 3*5 بكسل، وفي البكسل (2،1) لون أسود، وفي البكسل (2،2) لون أسود، وفي البكسل (2،3) لون أسود؛ عندها يكفي القول إنّه يوجد لون أسود يبدأ من (2،1) وينتهي في (2،3).

إنّ هذا التحليل عملية معقدة جدًّا ومهمة جدًّا، وتعمل كثيرٌ من الشركات على تعديل هذه الخوارزميات وتطويرها، ومن هذه التحسينات أكثرُ الأنموذجين شهرة: H.264 وH.265. 

ولكن توجد نقطة مهمة هنا، فعلى الرغم من أنّ هذه الخوارزميات رائعة؛ لكنّها مرتبطة بالعديد من الرخص، وعندما تُستخدَم في الأجهزة فإنّ المصنّعين يدفعون المال إلى أصحاب هذه الخوارزميات على كل جهاز يُصنَّع.

من هنا انبثقت الحاجة إلى codec مفتوح المصدر يستطيع الأشخاص جميعهم التحسين عليه دون قيود. وهنا نشير إلى codec المسمّى "AV1"؛ وهو Codec حديث نسبيًّا وصديق للمنتجات المفتوحة المصدر. ويُذكَر هنا أنّ الملف المصدري (Source code) في مجلد المشروع على GitHub يحتوي على رخصة، وهي رخصة لرفض أية مسؤولية عن المنتج، وتعتمد على رخصتي BSD 2-Clause License وAlliance for Open Media Patent License 1.0.

إلى أي حد استُخدِمت الخوارزمية AV1؟ 

حسنًا، تشير صفحة "Members" في المنتج إلى أنّ هذه الخوارزمية يعمل على تطويرها أكبر شركات التقنية في العالم؛ مثل Mozilla، وSamsung، وGoogle، وNetflix، وAmazon، وMicrosoftوغيرها (5).

ولكن في دراسة ضمن مرحلة التدقيق، يشير الباحثون إلى عدم وجود فرق جوهري بين الخوارزميات المشهورة حاليًّا (6)، وفيما يبدو أننا وصلنا إلى مرحلة يصعب فيها تطوير مجمل خوارزميات ضغط الفيديو، ونعتمد اليوم على رفع سرعة الإنترنت وتطوير البنى التحتية اللازمة لتشغيل خدمات الجيل الخامس من الإنترنت (5G) وغيرها في مشاهدة مقاطع الفيديو وعقد المؤتمرات والاجتماعات عبر الإنترنت.

المصادر:

1- CISCO visual networking index: forecast and methodology، 2017–2022 Digital Copy could be found on هنا

2- Deep Video Precoding By Eirina Bourtsoulatze، Aaron Chadha، Ilya Fadeev، Vasileios Giotsas، and Yiannis Andreopoulos، Uploaded 13 Dec، 2019. Digital Copy could be found at هنا

3- Comparing VVC، HEVC، and AV1 using Objective and Subjective Assessments By Fan Zhang، Member، IEEE، Angeliki V. Katsenou، Member، IEEE، Mariana Afonso، Member، IEEE، Goce Dimitrov، and David R. Bull، Fellow، IEEE Uploaded 23 March 2020. Digital Copy could be found at هنا;

4- Andy، B. Real World Video Compression. Peachpit Press 2008.

5- AOMedia، Members. Retrieved 22 May 2020 Digital copy could be found at هنا

6- Fan Zhang، Member، IEEE، Angeliki V. Katsenou، Member، IEEE، Mariana Afonso، Member، IEEE،

7- Goce Dimitrov، and David R. Bull، Fellow، IEEE. Comparing VVC، HEVC and AV1 using Objective and Subjective Assessments 23 Mar 2020 Digital Copy Cold be found on هنا