المعلوماتية > عام

"بوت" المحادثة ثنائيُّ اللُّغة - لبناءِ "بوت" محادثةٍ ذكيّ، عليك تعليمُهُ لغةً ثانيةً أولاً

استمع على ساوندكلاود 🎧

ابتداءً بـ"أليكسا" و"سيري" ومروراً بعددٍ لا يُحصى من "بوتات" المحادثة (chatbots) وأنظمةِ دعم العملاء الآلية (automated customer support lines)، يُمكننا القول أنَّ الحواسيبَ أصبحت قادرةً تدريجياً على الكلام، لكنَّ المشكلة الوحيدة تكمُنُ في أنَّ الحواسيب لا تزال ترتبكُ بسهولةٍ كبيرةٍ عند القيام بهذا.

ابتكر فريقُ بحثٍ في "سيلزفورس Salesforce" وسيلةً ذكيّةً لتحسين أداء العديد من برامج اللغة الحديثة والتي يُمكنِنُا تلخيصُها بـ: تعليم الحاسوب خوارزميةً تسمحُ لهُ بتكلُّم لغةٍ أخرى، وذلك قبل تدريبه على القيام بمهامٍ أخرى.

ولا يزال تعليمُ الآلاتِ لإجراءِ محادثةٍ مُتماسكةٍ إحدى التحدياتِ البارزةِ والكبيرةِ في مجال الذكاء الصنعيّ، وذلك لأنَّ فهمَ مغزى النص المنطوق أو المكتوب يعتمدُ في كثيرٍ من الأحيان على فهمٍ أوسعٍ للعالم أو المنطق السليم.

وقد تبيّنَ أن تدريبَ نظامِ تعلُّم الآلة (machine-learning system) الترجمةَ بين لغتين تلقائياً، كان كفيلاً بأن يعلِّمَه أشياءً مفيدةً حول السياقِ المناسب للكلامِ وعلاقةِ الكلمات ببعضها. وعند استخدام هذا النظام كأساسٍ لنظامِ تعلُّم آلةٍ آخر-حيثُ يكون هذا النظام مدَرَّباً لإجراء محادثةٍ أو الكشف عن طبيعة المشاعر في النص- فإنه يؤدي أداءً أفضلَ بكثيرٍ مقارنةً بنظامٍ مُدرَّبٍ من الصفر.

يقول ريتشارد سوشرRichard Socher كبيرُ العلماء في"سيلزفورس Salesforce" وخبيرٌ في تطبيق تعلُّم الآلة واللغة: "نحن نأخذ بياناتِ ترجمةِ الآلة (machine translation data)، ثم نقوم بتعليم النموذجِ كيفيةَ فهمِ الكلماتِ والسياق".

ويُعدُّ هذا العملُ مثالاً لقدرة أنظمةِ تعلُّم الآلة على تحسين المهارات اللغوية لأنظمة الذكاء الصنعي. وتستفيد العديد من أنظمة الرؤية الحاسوبية (computer vision systems) المدعومةِ بنظامِ التعلُّم العميق، من أشكالِ التدريب المُسبق للشبكة، ويشير "سوشرSocher" إلى أنَّ ترجمة الآلة قد تُوفِّرُ طريقةً مُشابهةً لتمهيد أنظمة اللغات الطبيعية (natural language systems).

وتقوم "سيلزفورس Salesforce"، والتي هي منصةٌ رقميّةٌ لإدارةِ مُعاملاتِ الزّبائن المتعلِّقة بالمبيعاتِ والتسويقِ والتجارة، بتوفير مجموعةٍ من أدواتِ الذَّكاء الصنعيِّ من خلال منصةِ أينشتاين الخاصَّة بِها. وتشمُلُ هذه الأدواتُ أداةً لتصنيف رسائل البريد الإلكتروني أو الدردشة بناءً على المشاعر المُستخلصَة من النَّص تلقائياً، وأداةً أُخرى تُعنى بتحديد أولوياتِ العُملاء بناءً على نشاطاتٍ سابقة.

ويعتقد "سوشرSocher" أنَّ هذا الاكتشاف سيُساعدُ على تحسين قدراتِ اللغة الطبيعية لمنصة آينشتاين. وحسب تعبيره "هذه الخاصيات مفيدةٌ جداً بالنسبة إلى بوتات المحادثة (chatbots) وأنظمةِ دعم العملاء الآلية (automating customer support)".

وقد قام باحثو "سيلزفورس Salesforce" بتدريبِ نظامِ تعلُّمٍ عميقٍ، للترجمةِ بين اللغة الإنجليزية والألمانية. وقامت هذه التجربة على تغذية شبكةٍ عصبونيةٍ متعدِّدة الطبقات بعددٍ كبيرٍ من الوثائق المُتَرجمة، وتعديلِ معامِلات الشبكة حتى تعلَّمتِ الشَّبكةُ أن تُنتِجَ ترجمةً جيِّدةً بنفسها. ويُمثِّل هذا النظامُ الكلماتِ باستخدام النواقل (vectors)، وهي طريقةٌ شائعةٌ لتشفيرِ وتحليلِ المعنى في النَّص.

ثم قام الباحثون بتدريبِ الشَّبكة ثنائيَّةِ اللغة للقيام بمجموعةٍ متنوِّعةٍ من الأشياء: تحديدِ مشاعرِ مقطعٍ مُعيَّنٍ من نَص، وتصنيف أنواعٍ مُختلفةٍ من الأسئلة، والإجابة على الأسئلة. وتبيَّن لهم أنَّ شبكتَهم المُدرَّبةَ مسبقاً تفوَّقت بأداءها على شبكةٍ لم تتعلم لغةً ثانية.

تتميز مجموعاتُ بياناتِ الترجمة الآلية بكِبَر حجمها بشكلٍ خاص، مما يساعد في تحدّي تعلُّم الآلة. يقول برايان ماكان، باحثٌ مشاركٌ في "سيلزفورس Salesforce" ضمنَ هذا المشروع: "هناك علاقةٌ مهمةٌ بين الترجمة وبقية اللغة". "[مجموعات بيانات الترجمة] عامَّةٌ جداً؛ فهي تحوي معلوماتٍ يُمكن أن تكون مفيدةً في جميع مجالات معالجةِ اللغة الطبيعية".

---------------------------------------

المصدر:

هنا