المعلوماتية > الذكاء الصنعي

مشكلة اللغة و الذكاء الصنعي - الجزء الثاني

استمع على ساوندكلاود 🎧

لم يكن الجميعُ مقتنعاً بسهولةِ تعلّم اللّغة. فبعض النّقادِ مثل البروفيسور نوام تشومسكي Noam ­Chomsky علم اللّغات فيMIT شعرّ أنّ الباحثينّ في مجالِ الذَّكاءِ الصُّنعيّ سيواجهونَ تحدياتٍ كبيرةً لجعلِ الآلاتِ قادرةً على فهم اللّغات، خاصّةً أنَّ فهمنا لآليّةِ اللّغةِ عندَ البشرِ محدودةٌ وضعيفةٌ جدّاً.

و لكن هناك سببٌ للتّفاؤل: وكان جوزيف وايزينباوم Joseph Weizenbaum، وهو أستاذٌ ألمانيُّ المولدِ في معهدِ ماساتشوستس للتّكنولوجيا، قد بدأ ببناءِ أوّلِ برنامجِ chatbot يدعى إليزا ELIZA، تمَّت برمجته ليعمل مثل طبيبٍ نفسيٍّ يقوم بتكرارِ الأجزاءِ الرّئيسيّة من الحوار للتّشجيعِ على استمرارِ المحادثةِ. على سبيلِ المثالِ: لو قلتَ أنّك تكرهُ والدتك فسيسألك البرنامجُ ماذا يخطر ببالِكَ عندما تفكِّرُ بوالدتك؟

و مع أنَّها حيلةٌ بسيطةٌ إلّا أنَّها أثبتت فعاليّتها بشكلٍ مدهشٍ.

أراد وينوغراد Winograd تصميم شئٍ يستطيعُ حقاً فهمَ اللّغةِ، و بدأ أوّلاً بتصغيرِ أبعادِ المشكلةِ، حيث صمَّمَ بيئةً افتراضيّةً لما يُعرف بالـ “Block World” وتَشمل هذه البيئة عدة أشياءٍ وهميّةٍ موضوعةٍ على طاولةٍ وهميّةٍ. ثمَّ قام ببناءِ برنامجٍ اسمُهُ SHRDLU قادرٍ على تحليلِ كلِّ الأسماءِ، والأفعالِ، والقواعدِ البسيطةِ للّغةِ اللّازمةِ للإشارةِ إلى هذا العالمِ الافتراضيِّ المُصغَّرِ. و يستطيعُ هذا البرنامجُ وصفَ الأشياءِ والإجابةَ عن أسئلةٍ تتعلَّقُ بعلاقةِ هذه الأشياءِ مع بعضِها وتغيير هذا العالمَ بالتّناسبِ مع الأوامرِ المعطيّةِ له.

بالإضافةِ إلى ذلك، يمتلك البرنامج ذاكرةً بحيث لو طُلِبَ منه تحريكَ "القمع الأحمر" و من ثمَّ تمَّت الإشارةُ الى "القمع"، فسيفترضُ البرنامجُ أنَّ المعنيَّ بالذِّكِر هو "القمعُ الأحمرُ" دوناً عن باقي الألوان.

كان الظّنُّ أنّ برنامج SHRDLU هو إشارةٌ إلى تقدُّمِ مجالِ الذَّكاءِ الصُّنعيِّ. لكن عندما حاول وينوغراد Winograd جعلَ البرنامجِ أكبرَ، أصبحت القواعدُ اللّازمةُ لحسابِ الكلماتِ والقواعدِ اللّغويّةِ والنّحويّةِ المُعقدّةِ غيرَ خاضعةٍ للسّيطرةِ. وبعد بضع سنواتٍ استسلمَ وتخلّى عن مجالِ الذّكاءِ الصُّنعيِّ وتوجَّهَ إلى مجالاتٍ أخرى للبحث.

استنتج وينوغراد Winograd أنَّه من المستحيلِ جعلُ الآلاتِ تفهمُ اللّغةَ بشكلٍ حقيقيٍّ باستخدامِ الأدواتِ الّتي كانت متاحةً آنذاك.

إنّ المشكلةَ، كما وصفها هيوبرت دريفوس Hubert Dreyfus، أستاذُ الفلسفةِ في جامعةِ كاليفورنيا في بيركلي، في كتابٍ دعاهُ "مالا يمكن للكمبيوتر القيام به" عام 1972، هو أنّ العديدَ من الأشياءِ الّتي يفعلها البشر تتطلَّبُ نوعاً من الذّكاءِ الفطريِّ الّذي لا يمكن الحصول عليهِ من خلالِ تطبيقِ قواعدَ جامدةً، وهذا ما جعل الكثير من الخبراء يشكُّون بقدرةِ الآلةِ على إتقانِ لعبة Go قبلَ المباراة بين سيدول Sedol وَ AlphaGo . لكن في الوقت الّذي كان دريفوس Dreyfus يقدِّمُ حججه، كان القليلُ من الباحثينَ يعملون على تطوير نهجٍ يعطي الآلاتِ هذا النّوعَ من الذّكاء. وبالاعتمادِ القليلِ على علومِ الأعصابِ، كان الباحثون يقومون بتجاربَ باستخدام الشّبكاتِ العصبونيّةِ ( رابط مقالة الشبكات العصبونية: هنا)، و بالرّغم من بطئها الشّديد إلّا أنّها أثبتت قدرتَها على تعلُّمِ أشياءَ ليس بالإمكان برمجتها، و هذا ساعد على القيامِ بمهامِ بسيطةٍ كالتَّعرُّفِ على الرُّموزِ المكتوبةِ بخطِّ اليد. وتمّ استخدامُ هذه الخاصيّةِ بشكلٍ تجاريٍّ عامَ 1990 لقراءة الأرقام على الشّيكات.

خلالَ السّنواتِ القليلةِ الماضيةِ أصبحت الشّبكاتُ العصبونيّةُ أكثرَ تعقيداً وأكثرَ قوّةً. وأتى هذا التّطوُّرِ من تحسيناتٍ رياضيّةٍ وأجهزةِ كومبيوتر أسرع. في عام 2009 أظهر العلماء في جامعة تورونتو أنّ شبكات التّعلُّمِ العميقِ متعدِّدةَ الطّبقاتِ بإمكانها التَّعرُّفُ على الكلام بدقّةٍ عاليةٍ.

تستطيع الشّبكاتُ العصبونيّةُ التَّعرُّفَ على الأشياءِ في الصّورِ باستخدامِ حساباتٍ رياضيّةٍ تحاكي عملَ العصبوناتِ وتقوم بتغير بارامترات الدَّخْلِ حتّى تحصلَ على الخَرْجِ المطلوب، هكذا تستطيع التَّعرُّف على الوجوه مثلاً. و لكن هناك مشكلةٌ عند تطبيقِ التَّعلُّمِ العميقِ على اللّغة: قد تحمل نفسُ الكلمةِ عدَّةَ معانٍ، و قد تحملُ عدّةُ كلماتٍ نفسَ المعنى.

في عام 1980 استطاع الباحثون الخروج بفكرةٍ ذكيّةٍ حولَ كيفيّةِ تحويلِ اللّغةِ إلى نوعٍ من المشاكلِ الّتي تستطيع الشّبكة العصبونيّة معالجتها. وأظهر الباحثون أنّ الكلماتِ يمكن أن تكونَ ممثَّلةً على أنّها شعاعٌ رياضيٌّ (Vector)، ممّا يسمح بحسابِ التّشابه بين الكلمات ذات الصِّلة. على سبيل المثال، "المَرْكِب" وَ"المياه" تعتبر قريبة في الفضاء الشعاعي على الرّغم من أنّها تبدو مختلفةً جداً. استخدم الباحثون في جامعة مونتريال، بقيادة يوشع بينجيو Yoshua Bengio ومجموعةٍ أخرى في غوغل هذه الرّؤية لبناءِ شبكاتٍ تُستخدَمُ فيها كلُّ كلمةٍ في الجملة لبناءِ شيءٍ وصفَهُ جيفري هينتون، وهو أستاذٌ في جامعة تورنتو وباحثٌ في علمِ التَّعلُّمِ العميقِ بـ "شعاعِ الأفكار".

الهدفُ من الحياة:

عندَ اللّقاء بـ لي كوك Le Quoc وهو أحدُ الباحثينَ في غوغل، عبّر عن فائدة الآلاتِ القادرةِ على الكلامِ حيث قال: "أريدُ طريقةً لمحاكاةِ الأفكارِ في الآلاتِ"، "وإذا كنتَ تريد محاكاةَ الأفكارِ، عليك أن تكونَ قادراً على سؤال الجهازِ ما يُفكِّرُ فيه"

لقد بدأت شركة غوغل بتعليم آلاتِها مبادئ اللّغةِ، حيث في شهر أيار من عام 2016 أعلنت الشّركة عن نظامٍ اسمه Parsey McParseface والّذي يمكنه التَّعرُّفَ على الأسماءِ والأفعالِ وعناصرَ أخرى من النّصوصِ.

و ليس من الصّعب معرفةُ مدى فائدةِ الفهم الأفضلِ للّغة، حيث كان البحث في غوغل يعتمد على تتبُّعِ الكلماتِ المفتاحيةِ والروابطَ بين الصّفحاتِ. أمّا الآن، يتمُّ استخدامُ نظامٍ اسمه RankBrain قادرٍ على قراءةِ النّصوص في الصّفحاتِ في محاولةٍ لفهمها بشكلٍ حقيقيٍّ وبالتّالي استخلاصُ نتائجَ أفضلَ.

يريد لي Le أن يُطوِّرَ هذه الفكرةَ، حيث قام هو وزملاؤه ببناء نظامِ Smart Reply الّذي يقوم بقراءة رسائلَ Gmail ومن ثمَّ يقترحُ أجوبةً معيّنةً لها. كما قام أيضاً ببناءِ نظامٍ يستفيدُ من سجلّاتِ الدّردشةِ للـ Google IT ليصبح قادراً على الإجابةِ عن الاستفساراتِ التّقنيّةِ البسيطةِ.

في الآونةِ الأخيرةِ عَمِلَ لي Le على تصميمِ برنامجٍ للإجابةِ على الأسئلةِ المفتوحةِ، وذلك من خلالِ تغذيةِ البرنامجِ بأكثرَ من 18900 حواراً من الأفلام. وعند سؤال البرنامجِ: ما هو الهدف من الحياة؟ كانت إجابته: "لخدمةِ هدفٍ أسمى".

لكن سرعان ما ظهرت مشكلةُ البرنامج، فعندما سأله لي Le ماعدد أرجلِ القطّة؟ كانت إجابة البرنامج "أربعةٌ على ما أظنُّ"، وعندما سأله ماهو عدد أرجلِ الحريش (أمُّ أربعةٍ وَأربعين ☺ ) كانت الإجابة: "ثمانية". إذاً البرنامج لايعلمُ ماالّذي يتحدّثُ عنه وليس لديه إحساسٌ بالعالم الحقيقيِّ، بالتّالي "ذكاء" هذا النّظامِ مجرّدُ وهمٍ يفتقر إلى المنطقِ السّليمِ الموجودِ لدى البشر.

أمضت فيفي لِي Fei-Fei Li مديرة مختبر الذّكاءِ الصُّنعيِّ في جامعة ستانفورد معظم حياتِها المهنيّةِ في البحث في مجال تعلُّمِ الآلةِ ورؤيا الحواسيبِ، و قادت مشروعاً يهدف إلى بناءِ قاعدةِ بياناتٍ تحتوي على ملايين الصّورِ، كلُّ صورةٍ لديها كلماتُ دلالةٍ خاصّةٍ بها.

تعتقد لِي Li أنّ الآلاتِ بحاجةٍ إلى فهمٍ عميقٍ لما يحدث في العالم المحيط، لذلك قام فريقُها بإصدارِ قاعدةِ بياناتٍ للصُّور تحتوي معلوماتٍ تفصيليّةٍ أكثرَ عن كلِّ صورةٍ. تقول لي Li: "يتمُّ تغذيةُ جزءِ الدّماغِ المسؤولِ عن اللّغةِ من عدَّةِ أنظمةٍ منها النّظامُ البصريُّ"،و تتابع: "دمجُ هذه الأنظمةِ سيكونُ جزءاً مهمّاً من الذّكاء الصُّنعيّ".

هذه الطريقةُ أقربُ إلى كيفيّةِ تعلُّمِ الأطفالِ، عن طريق ربط الكلماتِ والأشياءِ، و لكنَّ البشر ليسوا بحاجةٍ إلى رؤيةِ كلبٍ يتزلَّجُ لِيتخيّلوا و يصفوا ذلك. وتقول لِي Li: "قدرتنا نحن البشرُ ضعيفةٌ في الحوسَبَةِ مع البياناتِ الضّخمةِ"، كما تقول: "لكنّنا بارعونَ في التّجريدِ والإبداعِ".

لا أحدَ يعلمُ كيف يمكن إعطاء الآلاتِ هذا النّوع من المهاراتِ، و حتّى لو كان ذلك ممكناً، فهل هنالك شيء يميّز البشر يَحُولُ دون استطاعةِ الذكّاءِ الصُّنعيِِّ الوصولَ إلى مستوى الذّكاء البشريِّ؟

يقول نوح غودمان Noah Goodman "إنّ اللّغةَ لها خصوصيّةٌ حيث تعتمد على المنطقِ السّليمِ والمعرفةِ عن العَالَمِ المحيطِ، وهذانِ العاملَان مرتبطان مع بعضِهِما بشكلٍ وطيدٍ".

قام غودمان Goodman وطلاّبه بتطوير لغةٍ برمجيّةٍ تُدعى Webppl يمكن استخدامها لإعطاءِ الآلاتِ نوعاً من المنطقِ السّليمِ اعتماداً على الاحتمالات. يستطيع البرنامج فهمَ جملِ المبالغةِ، فعلى سبيلِ المثال لو تمَّ إخبار البرنامج أنَّ بعضَ النّاسِ انتَظَروا إلى الأبدِ للحصولِ على طاولةٍ في مطعمٍ، فالبرنامجُ سيعلَم أنَّ هذا الاحتمالَ غيرُ موجودٍ، وأنَّ المقصودَ هنا أنّ النّاسَ انتظروا فترةً طويلةً وذلكَ تَسبَّبَ بالإزعاج.

ومع أنَّ البرنامج بعيدٌ عن "الذّكاءِ" بالمعنى الحقيقيِّ إلّا أنَّه يُثْبِتُ مدى فاعليّةِ استخدامِ طرقٍ جديدةٍ لمساعدةِ أجهزةِ الذّكاءِ الصُّنعيِّ على تعلُّمِ المحادثة.

تويوتا، الّتي تدرس مجموعةً من التّقنيّاتِ للسّيّاراتِ ذاتيّةِ القيادةِ، بدأت مشروعاً بحثيّاً في ​​معهد ماساتشوستس للتّكنولوجيا من قِبَلِ جيرالد سوسمان، وهو خبيرٌ في مجالِ الذّكاءِ الصّناعيِّ ولغةِ البرمجةِ، أدّى إلى تطويرِ أنظمةِ القيادةِ الآليّةِ القادرةِ على تفسيرِ سببِ اتّخاذِ السّيّاراتِ إجراءً مُعيّناً. والطّريقةُ الأمثلُ لمعرفةِ ذَلكَ ستكونُ من خلالِ قُدرةِ السّيارةِ على الكلام.

في الواقعِ، معَ ازديادِ تعقيدِ أنظمةِ الذّكاءِ الصُّنعيِّ، سيُصبِحُ من الصّعبِ تخيّلَ كيفيّةِ التّعاونِ معها بدون اللّغةِ، بدونِ القدرةِ على سؤالها: "لماذا؟".

بالإضافةِ إلى ذلك، سيجعل فائدةَ التّواصلِ مع أجهزةِ الكومبيوتر غيرَ محدودةٍ لنا، بل سيبدو عالَماً سحريّاً!

كيف لا واللّغةُ هي وسيلتنا الأقوى لفهم العالم الّذي حولنا والتّفاعل معه. لقد حان الوقتُ للآلات أن تفعلَ ذلك أيضاً.

ما رأيك؟ هل ستستطيع الآلات فهم اللّغة بشكلٍ حقيقيٍّ؟ و ما هي السُّبل إلى ذلك؟ هل ترى جانباً سلبيّاً لوصول الآلات إلى هكذا مستوى من الذّكاءِ؟

----------------------------------------------------------------------------

المصدر:

هنا