المعلوماتية > الذكاء الصنعي

الرؤية في الظلام

يوجد الضجيج في أي نظام تصوير، وهو اختلاف عشوائي  في معلومات السطوع أو اللون في الصور؛ الأمر الذي يجعل من التصوير أمرًا صعبًا، وخاصة في الإضاءة المنخفضة؛ إذ يُعدُّ التصوير في مثل هذه الحالة تحديًّا كبيرًا؛ ذلك بسبب انخفاض عدد الجزيئات الضوئية (الفوتونات) التي تمثل الصورة أو المشهد، وبسبب محدودية معالجة الضجيج العالي الناتج عن الإضاءة المنخفضة أيضًا.

وتُستخدم تقنيات متعددة لحل مشكلة الضجيج، وترفع تقنية (ISO) -على سبيل المثال- السطوع في الصورة، وبذلك تؤدي إلى حدوث ضبابية، وتستخدم أيضًا تقنية التكبير أو المدرج التكراري (histogram stretching)، ولكن؛ لا تحل هذه الحلول المشكلة الأساس وهي انخفاض عدد الجزيئات الضوئية المكوِّنة للصورة بسبب الإضاءة المنخفضة؛ ما أدى إلى بدء العمل على إيجاد حلول لهذه المشكلة، وقد كان أفضلها استخدام تقنية (open aperture)، وهي عبارة عن مرشح  (filter) يتحكم بكمية الضوء الداخل إلى العدسة أو باستخدام الطريقة الأكثر شيوعًا وهي استخدام الفلاش، ولكل من هذه الحلول عيوبه، فمثلاً: يمكن أن ينتج عن زيادة فترة التعرض إلى الضوء باستخدام الفلاش حدوثَ تغبيش في الصورة، وخصوصًا في حالة اهتزاز الكاميرا أو العنصر الموجود في الصورة.

وانطلاقًا من هذه المشكلات التي مررنا بها؛ وجد الباحثون طريقة لحل مشكلة الضوء المنخفض؛ وطوروا نظامًا لمعالجة هذه الصورة غير الواضحة بعد أن وجدوا مجموعة من الصور ذات الإضاءة المنخفضة ومقابلاتها من الصور عالية الدقة والتي التُقطت في ظروف إضاءة جيدة، ودُرِّبت شبكة عصبونية مرتبطة بحساسٍ يقرأ البيانات مباشرة، وتوجد الصورة المقابلة لها بعد عدة مراحل؛ منها تحسين الصورة الملتقطة من الحساس ومراعاة تحويلات الألوان والحد من الضجيج في الصورة، وتحدث هذه المراحل على التوازي باستخدام مبدأ pipeline، والذي يعني تنفيذ أكثر من إجرائية أو تعليمة متداخلة في آن معًا.

الموضوع شيّق جداً عزيزي القارئ؛ لذلك أعرني انتباهك  قليلًا، وهيا نستكشف المراحل التي تمر بها أيّة آلية معالجة الصورة المعتمة وغير الواضحة.

مرحلة التخلص من الضجيج:

طُرحت العديد من التقنيات والأساليب في هذا المجال؛ منها التباين الكلي (total variation) ومعالجة مجال المويجات (wavelet-domain processing) والترميز المتقطع والمرشح ثلاثي الأبعاد (BM3D)، وتستند هذه التقنيات في عملها غالبًا إلى  صور فيها خصائص معينة؛ منها النعومة والتراخي والتشابه الذاتي (self-similarity)،وقد وجد الباحثون طرائق أخرى لمعالجة هذه المشكلة؛ منها استخدام الشبكات العصبونية المدربة مع مكدس التشفير العشوائي للتشويش (SSDA) وتقنية رد الفعل اللاخطي (INRQ)، ولكن للأسف؛ قُيّمت هذه التقنيات كلّها بعد تجريبها على بيانات غير حقيقية؛ أي ليست خام؛ بل عُدِّلت وأضيفت الضبابية والضجيج، ولكن بالنهاية، وبعد البحث والتجريب؛ اقتُرحت  طريقة المرشح الثلاثي الأبعاد بوصفها أفضل طريقة في معالجة الضجيج في الصور المأخوذة على نحوٍ خام وطبيعي.

مرحلة تحسين الصورة

تُطبق مجموعة متنوعة من التقنيات لتحسين تباين الصورة؛ ومنها (Histogram eqiztion) والتي توازن الخطوط البيانية المكونة للشكل الموجود في الصورة أو تصحيح غاما (Gma Correction) الذي يزيد من سطوع المناطق المظلمة عن طريق ضغط البكسلات الساطعة، وهناك العديد والعديد من هذه الطرائق، وكانت الأكثر تقدمًا هي القناة العكسية (inverse dark chanel) أو تحويل ويفلت (wavelet transform) أو أنموذج ريتنكس (Retinex) وكل خوارزمية تنفرد باستخدام واحدة من هذه التقنيات.

مرحلة جمع البيانات أو أزواج الصور

تؤدي هذه المجموعات دورًا أساسًا في معالجة الصور؛ إذ تُربط مع الشبكة العصبونية التي يتكون منها النظام، والتي بدورها تتخذ القرار وتختار الصورة المشابهة للصورة المعتمة ليعالج، وتطبق المراحل السابقة على أساس الصورة الأكثر دقة، وذلك بعد تدريبها من قبل المطورين، ومن هذه المجموعات نذكر على سبيل المثال (Renoir)؛ ولكن مشكلتها أن أزواج الصورة فيها تعاني اختلاطًا مكانيًّا (MisAlignment)، وتوجد مجموعة تدعى (DND) أيضًا، ولكن مشكلتها أن معظم الصور تُلتقط  في وضح النهار، وليست مناسبة للمقارنة .

وأما الأفضل؛ فهي مجموعة (SID) التي تحوي على ما يقارب 5094 صورة مأخوذة في الداخل وفي الخارج وفي الليل وتحت ضوء القمر أو إضاءة الشوارع .

"عينة من صورمجموعة (SID) المستخدمة في المطابقة"

التُقطت هذه العينات بنوعين من الكاميرات (sony) و (fuji) من الأعلى والأسفل ومن اليمين والشمال، وخصائص كل كاميرا موضحة بالجدول أدناه :

خوارزمية المعالجة

بدايةً؛ مرّت الطرائق التقليدية السابقة بالتسلسل على المراحل التي ذكرناها آنفًا؛ كالتخلص من الضجيج وتحسين الصورة والتخلص من الضبابية والأسلوب المتبع نفسه مع اختلاف التقنيات المستخدمة بين كل خوارزمية وأخرى، ونجد أدناه بعض المراحل التي كانت تكون عملية المعالجة:

في حين تمر الطريقة التي تتكون من الشبكة العصبونية المدربة بالمراحل الآتية:

يلتقط الحساس الموجود في العدسة الأشعة الضوئية المكونة من الفوتونات ويصنفها عن طريق ثلاثة أنواع من الفلاتر (أحمر - أخضر - أزرق)، والتي تمثل الألوان الأساس المكونة لأي لون في الطبيعة وتخزن في مصفوفة ثنائية البعد؛ كل عنصر فيها يحوي لونًا واحدًا فقط .

يصنف بعدها كل لون على حدة باستخدام  خوارزمية (Byeer Filter)؛ إذ توزع الألوان على أربعة أقنية؛ واحدة للون الأحمر وواحدة للون الأزرق وقناتين للون الأخضر؛ ذلك لأن العين تتحسس بشدة للون الأخضر عن باقي الألوان، وتخزن هذه القيم اللونية على هيئة مصفوفات ثنائية البعد، وتضرب كل مصفوفة بمعامل التضخيم الذي يمثل اللمعان المطلوب في الصورة.

وتدخَل هذه النتائج إلى المرحلة المركزية، وهي الشبكة العصبونية ليُتّخذ القرار، وتُختار الصور الأقرب للصورة الملتقطة الخام والمعتمة، بعد أن تطبق المراحل التي تحدثنا عنها من تحسين للصورة والتخلص من الضجيج وتطبيق بالتحويلات اللونية استنادًا إلى الصورة المنتقاة والواضحة، وهكذا نكون قد حصلنا على صورة واضحة جلية على الرغم من التقاطها في ظروف إضاءة ضعيفة.

أظهرت الدراسة السابقة أن معالجة الصور المعتمة والمأخوذة في ظروف إضاءة غير جيدة هي أحد أكثر موضوعات البحث تحديًّا ونشاطًا في علوم الحاسوب؛ إذ لم يقتصر لأمر على التقاط صورة  واضحة في وضح النهار وبظروف إضاءة مناسبة؛ بل تطور للتعرف إلى الصورة ومحتواها وإن التُقطت في الظلام، وترتَّب على ذلك مواجهة العديد من المشكلات والتحديات ومن تلك التحديات الضجيج والضبابية وتصنيف المعطيات والتحليل المرئي.

وبعد الدراسة والتجارب؛ وجدت مجموعات من أزواج الصورة الواضحة والمعتمة واتُّبعت خوارزمية لتتبع الضجيج ومعالجته وتصحيحه، وبذلك أصبحنا قادرين على التقاط الصور مهما كانت الظروف المحيطة بنا؛ سواء أكانت إنارة جيدة أم ظلام حالك.

الشيفرة البرمجية: هنا

المصادر:

هنا

هنا

هنا

هنا

هنا

هنا