الهندسة والآليات > الروبوتات

الذكاءُ الصُنعي يعلِّم الروبوتات القيمَ الأخلاقيةَ

استمع على ساوندكلاود 🎧

قامَ الكثيرُ منا بمشاهدةِ فيلمِ الخيالِ العلميّ Robot ، فَفي المستقبلِ البعيدِ والحياةِ الإلكترونية وتطور التكنولوجيا، يتمُّ صنعُ آليين فائقي القدراتِ والمهاراتِ في محاولةٍ لمساعدة البشر على إنجاز مهامهم اليومية ، فيتورط أحد الروبوتات في جريمة قتل. وحذّرَ Stephen Hawking من مخاطرِ الذكاءِ الاصطناعيّ على البشرِ، حيثُ إنه من الممكنِ للروبوتات التمرّدِ على البشر، القيام بأعمال سيئة مما يشكلُ صعوبةً في الاعتمادِ عليها في حياتنا اليومية. إلا أنّ حلاً لهذه المشكلة يلوحُ في الأفقِ. فهل ستسصبحُ الروبوتات مهذبةً في المستقبلِ؟

"لا يمكنُ لروبوت أن يؤذي إنساناً، أو أن يسمحَ لإنسانٍ أن يتأذّى ويتركه دون حماية". كان وجود هذه القوانين حلم "Isaac Asimov" منذ حوالي أكثر من 70 سنة. الآن، وبعد أن حذّر "Stephen Hawking" من أنّ تطور الذكاء الاصطناعيّ قد يُشَكّلُ خطراً على البشرية، قامَ باحثون بابتكار طريقة لتعليمِ الأخلاقِ للحواسيبِ والروبوتات وذلك برواية القصص لهم.[1]

قامَ الباحثان "Mark Riedl" و"Brent Harrison" من معهد جورجيا للتكنولوجيا بإزالة الستار عن نموذج لنظام يُسمّى "Quixote". لهذا النظام القدرة على تعلّم القيم الاجتماعية’ وذلك برواية القصص القصيرة للحواسيب أو الروبوتات. ويبين الباحثان آلية عمل هذا النظام، حيثُ يقومُ باستنتاج القيم الاجتماعية من القصص التي تُروى عليه، ويقوم بوسم هذه الأعراف بمكافأة أو ما يطلق عليها إشارة رقمية يمنحها لحاسوب عند القيام بتصرف نبيل، حيث يعمل هذا النظام مع خوارزمية التعلم المُعزّز أو "Reinforcement Learning".

وتعتبرُ خوارزميةُ التعلمِ المُعزّز إحدى خوارزميات الذكاء الاصطناعي، التي تُستخدَمُ لتعليمِ الحواسيبِ كيفيةَ التصرفِ في وضعٍ معينٍ، وفيها يقومُ الحاسوبُ بدراسةِ التصرفاتِ الممكنة في هذا الوضع، ومن ثم القيام بالفعل الأفضل.[2]

على سبيل المثال، إذا تمّ إعطاء روبوت ما مهمّة الذهاب لشراء وصفةٍ طبيّةٍ لإنسانٍ ما من الصيدلية بأسرع ما يمكن، فالروبوت قد:

- يسرق من الصيدليّة، يأخذ الدواء، ويهرب.

- يتصرّف بلباقة مع الصيدلاني.

- يقف على دور الانتظار.

بدون ترتيب القيم الأخلاقية وتعزيز القيم الإيجابيّة، قد يتعلّم الروبوت أنّ السرقة هي الطريقة الأسرع والأقل تكلفة لإتمام مهمّته. ولكن، مع تنظيم هذه القيم من قبل "Quixote"، سيُكافأُ الروبوت لانتظاره على الدور، وصبره، والدفع من أجل الوصفة الطبيّة.[1]

يقول "Riedl" إن الحاسوب يقومُ بعملِ محاكاةٍ افتراضيةٍ، يقومُ بها بتجربة أفعال مختلفة (كما لو أنه يفكر)، وكلما فعلَ شيئاً مشابهاً لما فعله بطل القصة يحصل على مكافأة. ومع الوقت يتعلم الحاسوب أن القيام بالأعمال بطريقة معينة هي أفضل من القيام بها بطرق أخرى. فهذا النظام قادر على تعلم كيفية القيام بأعمال معينة كما يقوم بها البشر. [1]

يُكمل "Riedl" أنه بعد رواية القصة على الروبوت فإنه لا يتعلم أن لا يسرق فقط، وإنما يفضّل عدم السرقة والتصرف كبطل لهذه القصة. [1]

و أضاف أن هذا يماثل كيف أن البشر يفضلون التمسك بالعادات التي تعلموها خلال حياتهم بدلاً من التفكير بالنتائج المترتبة على أعمالهم. أي أن هذه القصص هي بمثابة ذكريات للروبوت الذي لا يمكن له أن يعيش في مجتمع بشري دون أن يفهم عادات هذا المجتمع، فهذه القصص هي الوسيلة التي يتعلم بها العادات والتقاليد والقيم الاجتماعية. [1]

سُمي هذا النظام باسم "Quixote" تيمناً باسم "Don Quixote" وهو إحدى الشخصيات القصصية للكاتب الاسباني "Miguel de Cervantes"، وكان "Quixote" يقرأ قصصاً عن الفرسان ثم يحاول أن يقوم بأعمال تضاهي أعمال الفرسان قوة و شجاعة. يقول الباحثون:" إن جميع القصص هي بالضرورة مرآة المجتمع الذي حدثت فيه، فهي تعكس عاداته وتقاليده وأعرافه الاجتماعية". [1]

يقول الباحثون:" إن الحاسوب الذي بإمكانه قراءة واستيعاب القصص يستطيع أن يتبنّى القيم الاجتماعية الموجودة في المجتمع الذي حدثت فيه هذه القصص، بشرط أن يقرأ كمية كافية منها كي يحصل الحاسوب على ما يكفي من القيم؛ ليستطيع الانخراط مع البشر. "ماذا يعني أن تكون بشراً؟" هو ما يمكن للحاسوب أن يتعلّمه بقراءة القصص التي أنتجها البشر. [1]

يقول "Riedl" : إن رواية القصص للروبوتات واستخراج القيم الاجتماعية منها، والتي ستصبح فيما بعد أحد أهداف الروبوت نظرياً، أي أنه لا تطبيق عملي لهذه الأفكار بعد. [1]

حيث يرون أن نظام "Quixote" هو الأفضل للروبوتات التي تحتاج إلى التواصل مع البشر. [1]

وأضاف "Riedl" أن "Quixote" يعتبر أول خطوة في سبيل تعليم المبادئ الأخلاقية للروبوتات، ولكنه يؤكد أن كل الاختبارات التي أجريت على هذا النظام ما زالت محاكاة في بيئات افتراضية تشبه ألعاب الفيديو (أي أنه لم يتم تجربة النظام على أي روبوت بعد). [1]

ويقول أيضاً إنّ النظامَ لا يقومُ بأية أفعال تعتبرُ إجرامية أو مؤذية في الظروف المثالية، حيث إننا لم نخبره ما هو الصحيح و الخاطئ وإنما تعلم بنفسه، ومن الممكن أن يتعلم القيام بأعمال خاطئة كالسرقة مثلاً، وذلك بأن نتلاعب بفهمه للقصص. مما سبق نستنتج أن للذكاء الاصطناعي نقاط ضعف يجب تقويتها بالمزيد من الأبحاث. [1]

يُكمل Riedl": "وكما أنه من الممكن أن يقوم الناس بمخالفة القانون؛ لينقذوا أنفسهم أو أحد المقربين لهم، فمن الممكن أن نقوم بتعليم "Quixote" أن يقوم بذلك، ويتصرف كروبن هود إذا طُلب منه شيء ضروري لا يمكن الحصول عليه دون مخالفة القانون، كإحضار دواء لا يمكن الحصول عليه دون وصفة طبية". [1]

يقول الباحثان: إنه على الرغم من تعليم الأخلاق عن طريق "Quixote" فإنه ليس من المستحيل أن يقوم بأذية البشر، وإنما سيفعل جهده لتجنب القيام بأعمال سيئة إلا في الظروف القصوى. [1]

مخطط يوضح تسلسل الخطوات في نظام "Quixote"

كلما ازداد انتشار الذكاء الاصطناعي وتطبيقاته في مجتمعنا ازدادت أهمية الانتباه إلى الأعمال التي يقوم بها، وبالتالي فإن القدرة على قراءة وفهم القصص من الممكن أن تكون أفضل وسيلة لتعليم الروبوتات ثقافة المجتمع في سبيل الإسهام في السلامة العامة للبشر. [1]

المصادر:

[1] هنا

[2] هنا