الهندسة والآليات > الروبوتات

خوارزميةٌ جديدةٌ تمكّن الروبوتات من التحرك بطريقة أشبه بالبشر

باستثناء الجهد العضلي؛ لا يَبذُل البشرُ كثيرًا من الجهد عند تحرُّكهم في منطقة مكتظَّةٍ للوصول إلى مبتغاهم النهائي، ويتعلَّم الأطفالُ من الكبار كيف يتجاوزون العوائق وكيف يتعاملون مع البشر الآخرين الذين يتحركون في طريقهم، أمَّا في نظر الروبوتات؛ فإنَّ عمليةَ التحرُّك الفعَّالة ضمن بيئة مجهولة تُعَدُّ مشكلةً كبيرة في نظرهم، لكنَّ باحثين في معهد MIT للتكنولوجيا تمكَّنوا من اختراع خوارزمية جديدة تُمكِّن الروبوتات من التحَّرك بطريقةٍ أشبه بالبشر، إذ تُتيح الطريقة الجديدة المجال للروبوت أن يُحدِّد كيف سيَتحرك ضمن بيئته عن طريق استكشافه إيَّاها، ومراقبة الروبوتات الآخرين في المنطقة نفسها، إضافةً إلى استفادته ممَّا تعلَّمه سابقًا في مواقف مشابهة.

عمومًا، تُنشئ خوارزميات الحركة الشائعة شجرةً من الخُطوات المُمكِنة، وتتفرَّع تلك الشجرة من أجل العثور على طريق جيَّدٍ يُمكِّن الروبوت من الوصول إلى مبتغاه النهائي، فإذا كان روبوت (أ) في غرفة يُريد الوصول إلى الباب مثلًا؛ فإنَّ الخوارزمية ستُنشئ شجرةً تتضمّن كلَّ الطرائق المُمكنة للوصول إلى الباب، ومِن ثَمَّ يُختَار طريقٌ معيَّن بناءً على معايير يحدِّدها مطوِّرو تلك الخوارزمية، وتَكمُن المشكلة في أنَّ تلك الخوارزميات نادرًا ما تتعلَّم، فالروبوتات لا تستفيد من المعلومات التي يُمكن جمعها من مواقف مشابهة حدثت لهم أو لغيرهم من الروبوتات.

إذ يقول الباحث المُشارِك في الورقة البحثية (أندري باربو-Andrei Barbu): "عندما تَعبُر الروبوتات المنطقةَ نفسَها وتُعدُّ هذه المرَّة الألف؛ فإنَّ ذلك -في نظرها- هي درجة التعقيد نفسها التي كان عليها الأمر في أولِّ مرة، إذ إنَّهم يَستكشفون المنطقة باستمرار، ولكن؛ نادرًا ما يُسجِّلون ملاحظاتهم، ولا يتعلَّمون ممَّا حدث في الماضي إطلاقًا.

طوَّر الباحثون أُنموذجًا يجمع بين خوارزمية للتخطيط مع شبكة عصبونية تتعلَّم لتمُيِّز الطرائق التي تُعطي أفضل النتائج، وتَستخدم تلك المعرفة لتقود الروبوت نحو مبتغاه.

وفي ورقتهم البحثية؛ أظهر الباحثون ميزتَين أساسيَّتين تُميِّزان أنموذجهم: الأولى؛ هي الحركة ضمن بيئة صعبة مليئة بالعوائق والممرات الضيَّقة، والثانية؛ هي كيف تتفادى الروبوتات الاصطدام ضمن بيئة تَجمع عديدًا منهم، ويُعدُّ استخدام هذا الأنموذج في السيَّارات الذاتية القيادة أحد التطبيقات العملية له، إذ يعمل الباحثون الآن على تطبيقه على سيارة (تويوتا) ذاتية القيادة التي يُطوِّرها قسم علوم الحاسوب والذكاء الاصطناعي في معهد MIT بالتعاون مع شركة سيارات (تويوتا) اليابانية.

تبدأ عملية التعلُّم في الأنموذج المقدَّم عن طريق مجموعة من الأمثلة في البداية؛ إذ يُدرَّب الروبوت على بعض الطرائق من أجل التحرك ضمن بيئة معينة، وتَتعلم الشبكة العصبونية العواملَ التي جعلت الطرائق ناجحةً ضمن تلك البيئات عن طريق ملاحظة خصائص تلك البيئات مثل: (شكل الجدران، وأنماط تحرك الروبوتات الأخرى في البيئة، إضافةً إلى خصائص الهدف النِّهائي الذي يجب الوصول إليه).

عند التعرض إلى بيئة جديدة؛ تُنشئُ خوارزمية التخطيط شجرةً من الخُطوات المُحتمَلة الوصول إلى الهدف النهائي (كما تفعل الروبوتات في العادة)، ولكنَّ الجديد هنا هو أنَّ الشبكة العصبونية تضع توقُّعًا احتماليًا لكلِّ خُطوة بناءً على ما عُلِم مسبقًا، فإذا كان التوقُّع الاحتمالي عاليًا (أي إنَّ الشبكة العصبونية على قدر من الثقة بصحة هذا الطريق)؛ فإنَّ الروبوت يَسلك الطريق الذي تنتجه الشبكة العصبونية، أمَّا إذا كان التوقع الاحتمالي منخفِضًا؛ فإنَّ الروبوت يُكمل استكشاف المنطقة كما هي الحالة التقليدية.

اختبر الباحثون الأنموذج عبر عدِّة تجارِب، وكانت إحدى تلك التجارب محاكاةً لعدة روبوتات متحركة ضمن طريقة دائرية، إذ تُعدَّ الطرائق الدائرية والملتوية واحدةً من أصعب السيناريوهات التي تواجه السيارات الذاتية القيادة، ويفترض بالروبوت أن يتجاوز بعض الروبوتات الأخرى، ويتجنَّب الاصطدام بها أيضًا، ومن ثَمَّ يَصل إلى هدفه النهائي.

وتُظهر النتائجُ أنَّ الروبوتات جمعت ما يكفي من المعلومات التي تُمكّنها من التنبؤ بالسلوكيات المستقبلية للروبوتات الأخرى (أو السيارات في الحالة العملية)، واتخاذ قراراتٍ فعَّالة بناءً على ذلك.

فما الذي سيَحدُث في المستقبل القريب؟ وهل سنرى تلك الخوارزميات مطبَّقةً على أرض الواقع عندما تملأ السيارات الذاتية القيادة شوارعنا؟

أم هل يُعَدُّ السلوك البشري أكثر تعقيدًا من سلوك الروبوتات؟ وبهذا؛ فإنَّ التنبؤ به أكثر صعوبة.

المصدر:

هنا