المعلوماتية > عام

مايكروسوفت ومستقبل التواصل

في عصر السرعة هذا، يحاولُ الناس اللحاق بالوقت دون جدوى لكسب لقمة العيش، وإنهاء أعمالهم وواجباتهم التي تكاد لا تنتهي.

عالمنا الذي أصبح صغيراً مع وجود كل هذه التقنيات التي غزت حياتنا الاجتماعية وأصبحت جزءاً رئيسياً فيه، وبالتحديد وسائل الاتصال الحديثة كأجهزة الحاسوب والهواتف المحمولة وشبكة الإنترنت العالمية التي اجتازت الحدود الجغرافية، وتمكّنت من تغيير مفهوم التواصل الاجتماعي من خلالِ بروزِ المواقع وخدمات التراسل والتطبيقات الإلكترونية.

على الرغم من أنّ كل هذا أصبح في متناول اليد، ما تزال بعض العوائق موجودةً حتى الآن، وأبرزها: حاجز اللغة.

اللغة هي الحاجز الذي يواجه كل شخصٍ يرغب بالسفر إلى بلدٍ يتكلم سكانه لغةً مختلفة ليكمل فيه حياته الدراسية أو المهنية، أو حتى شخصٍ يودّ التعرف على شخصٍ من قارةٍ أخرى.

بالطبع، سيضطر ذلك الشخص إلى تخصيص وقتٍ ومالٍ وجهدٍ كبير حتى يتمكن من إتقان لغةٍ ما.

الآن ولعدة ثوانٍ حاول تخيّل هذا المشهد:

رجلٌ يتحدث اللغة الانجليزية يتواصل في محادثةٍ كاملة مع امرأةٍ تتحدث اللغة الألمانية. هل ذكرتُ أيضًا أنّ الرجل لا يفهم أيّ كلمة ألمانية، وأن الإمرأة لا تفهم أيّ كلمةٍ انجليزية؟ بالرغم من ذلك، فهما يتواصلان مع بعضهما!

قد تكون الآن مذهولًا بعض الشيء وعلامات الحيرة والتعجب تعتلي وجهك وأنت تحدّق بالذي قرأته!

سنوضح أكثر، هناك في مؤتمر «رانشو بالوس فيردي»- كاليفورنيا-، عرض نائب المدير لفريق تطبيق (Skype) ومدير فريق برنامج أوفيس لاينك (Lync) في مايكروسوفت «غورديب بال» التطبيق الجديد من سكايب، والذي يترجمُ المكالمات الصوتية المتعددة اللغات في الزمن الحقيقي Real-Time (أي بشكلٍ فوري!).

هذا يعني أنّه بإمكان شخصٍ ما أن يتكلم بلغته الأم مع شخصٍ يتكلم لغةً مختلفة تماماً عنه، بينما تقوم مايكروسوفت بالترجمة. وقد أوضح أنّه بحلول نهاية العام، سيتوفر مترجم سكايب كتطبيقٍ في نظام ويندوز 10.

يقول «غودريب بال»: "تخيّل في تكنولوجيا المستقبل القريب السماح للبشر ببناء جسور وصل تزيل الحدود الجغرافية والعوائق اللغوية لتصل من عقل إلى عقل، ومن قلب إلى قلب بوسائل لم تمكن ممكنةً من قبل".

فيديو:

هنا

كما تلاحظون في العرض التجريبي المباشر، يستخدم «غودريب بال» برنامج سكايب لبدء مكالمةٍ فيديو مع المساعدة «ديانا» التي تتحدث اللغة الألمانية، وبالعكس.

يتمُّ كل هذا بينما يتحاور كلٌ منهما بلغة مختلفة عن الآخر، حيث تظهر الترجمة باللغتين الإنجليزية والألمانية في الجزء السفلي من الشاشة مصحوبةً بالترجمة الصوتية الفورية إلى حدٍ كبير، كما ينطقُ البرنامج الترجمة الإنجليزية لحوار ديانا بلغتها الألمانية بصوت أنثوي!

ووفقًا للرئيس التنفيذي لشركة مايكروسوفت «ساتيا ناديللا»، فإنّ مجموعة الترجمة الآلية كانت تعمل على الترجمة، والتعرف على الكلام، وتركيب الكلام منذ 15 عاماً.

كما أوضح «غودريب بال» قائلًا:

"إنّ مترجم السكايب يدمج تقنيات الدردشة والصوت للسكايب مع مترجم مايكروسوفت وتقنية التعرف على الكلام القائم على الربط الشبكي العصبي".

كيف يعمل مترجم سكايب؟

هو نتيجة عقود من الأبحاث في مجالات تمييز الكلام (Speech Recognition)، والترجمة الآلية، والتعلم التلقائي (Machine Learning)، إضافةً إلى التركيز على مايطلق عليه مسمى تجربة المستخدم (User Experience).

قدرة الحواسيب على التعلم التلقائي هي نتيجة لقدرة البرمجيات على التعلم من بيانات التدريب (Training Data Examples)، حيث بُني مترجم سكايب على منصة صلبة للتعلم التلقائي. فمن خلال التعلم التلقائي من بيانات التدريب في مراحل البناء الأولية يتمكن البرنامج من التعلم والتدرب على تمييز الكلام بشكل أفضل على اختلاف اللهجات والمواضيع واللغات وجميع الفروق الدقيقة في كلام البشر.

إن بروتوكولات التعلم التلقائي للمترجم تدرب وترفع من قدرات خوارزميات ومهام تمييز الكلام والترجمة الآلية، فهي تمثل الحاضنة الجامعة لكل مهام المترجم. تحسنُ هذه الحاضنة الكلام المستقبَل لتيسيره وتبسيطه للمترجم. فمثلا تحذف الأصوات التي ينتجها البشر أثناء التحدث والتي لاتعني شيء لغويًا كـالهمهمة (همممم) أو ما شابهها. كذلك تقوم بتقسيمِ الكلام إلى جمل وإضافة علامات الترقيم وإضافة أحرف كبيرة لكلمات بدايات الجمل في اللغات التي تتطلب ذلك.

حسنًا، ومن أين تأتي بيانات التدريب التي يتعلم عليها المبرمج في مراحله الأولى قبل النضوج؟

تأتي البيانات من العديد من المصادر ليس أولها صفحات الويب المترجمة وليس آخرها أفلام الفيديو وتعليقاتها (Videos with Captions)، دون أن ننسى المحادثات المترجمة مسبقاّ. إضافةّ إلى أن المترجم يقوم بتخزين المحادثات كي يقوم بتحليل نصها لاحقاً وتدريب النظام على فهم وترجمة المحادثات بشكل أفضل فيما بعد.

كان هناك العديد من المتبرعين الذين تبرعوا بمحادثاتهم للبرنامج كي يقوم بتحليلها، وتحويل الكلام المسموع إلى نص، ومن ثم ترجمة النص. فكل من تم تخزين محادثته تلقى تنبيها وتم ذلك بعد موافقته.

وماذا بعد جمع هذه البيانات؟

بعد جمع البيانات وتهيئتها وإدخالها إلى نظام التعلم التلقائي، يقوم برنامج التعلم التلقائي ببناء نموذج إحصائي للكلمات المذكورة في هذه المحادثات وسياقها. فعندما تنطق بكلمة، يستطيع البرنامج البحث وإيجاد مشابه لها ثم تطبيق نفس الترجمة وعمليات تحويل النص المطبقة مسبقاً على المدخلات الجديدة.

رغم أن مجال تمييز الكلام كان ومازال مجال بحث كبير وهام لعقود، إلا أن تطبيق تقنياته لازال محرجاً بمخرجاته التي تعاني من الكثير من الأخطاء وتأثر التقنية بالضوضاء المحيطة بالمدخل الصوتي وإلى ما هنالك من تحديات، ولكن التقدم الكبير الحاصل في تقنيات الشبكات العصبونية العميقة (Deep Neural Networks DNNs) الذي قادته مايكروسوفت خفض من نسبة الأخطاء بشكل كبير جداً وأنتج نتائج أصلب وأفضل، مماسمح لتقنيات تمييز الكلام بالمشاركة بشكل أوسع من ذي قبل في برامج معقدة كمترجم سكايب.

ماذا عن الترجمة؟

تتم الترجمة بنفس التقنيات المستخدمة في مترجم Bing الخاص بمايكروسوفت والذي يولد نماذج إحصائية ونماذج بناء الجملة (Syntax Models).

على الرغم أنّ ذلك يبدو أمراً مبالغاً فيه، فإنّ هذه التكنولوجيا تنبع من التعلم بالنقل، فهي في الأساس نسخةٌ حاسوبية من المقولة الشهيرة: "تمرّن، تمرّن، تمرّن".

كما ويتميز هذا التطبيق بانخفاض معدل التأخير، وتمّ تطوير «تغذيةٍ استرجاعية مرئية» حتى يظلّ نظام الترجمة على استمرارٍ في تطوير نفسه دائمًا.

يقول «ساتيا ناديللا»: "إنّه مشابهٌ للدماغ، بمعنى قدرته على التعلم. مع ذلك، وبغض النظر عن التفاصيل المهمّة لكيفية عمل هذه التقنية بالضبط، و بكلّ صراحة لا أحد منّا يعلم لماذا يبدو هذا كالسحر".

لقد تمكن هذا البرنامج من إزالة العوائق والحدود من خلال توفير خدمة الاتصال الصوتي والفيديو عبر عددٍ من الأجهزة، كأجهزة الحاسوب الشخصية والأجهزة اللوحية وأجهزة الهاتف الذكي وأجهزة التلفزة. لكن لطالما كان حاجز اللغة عائقاً للإنتاجية والتواصل الاجتماعي بين أعراق البشر المختلفة؛ فجاء تطبيق «مترجم سكايب» ليتغلب ويتخطى هذا الجدار.

"التقنية جيدةٌ فقط بقدر جودة البيانات". مينيزيس

ساهمت تحليلات المنشورات في وسائل التواصل الاجتماعي الإلكتروني بالحث على دراسة سلوك البشر من زاوية أخرى، "كيف يكتب الناس على مواقع التواصل الاجتماعي بأسلوبٍ وكلماتٍ قد تختلف كثيرًا عن طريقة تحدّثهم".

لكن مازال هناك بعض التقاطعات من اللغة العاميّة والألفاظ ذات الصلة، والتي يمكن أن تساعد هذا النظام في جعله معاصراً، فهي ليست مجرد تكرارٍ لكلمةٍ مفردةٍ فقط، وفي بعض اللغات يكون الأمر أكثر تحدياً من لغاتٍ أخرى.

«مترجم السكايب» هو أحد المساعي نحو بناء مستقبلٍ واعد في مجالاتٍ عدة: كمجال التعليم، والمجال الدبلوماسي، والعائلات متعددة اللغات، والمجال الاقتصادي.

فيديو 2:

هنا

برأيكم كيف يمكن أن تساعد هذه التقنية في توفير المال وفي تعلم اللغات التي لطالما وددت أن تتقنها؟ وهل ستنجح هذه التقنية والتقنيات المستقبلية المشابهة بإيجاد حلٍ نهائي لمشكلة اللغة يوماً ما؟ وهل يمكن أن تكون بديلاً عن ابتكار لغةٍ عالمية موحدة كلغة إسبرانتو مثلاً؟

المصادر:

هنا

هنا

هنا

للاطلاع أكثر على الموضوع:

هنا