ستعمل في البداية مع «الإنجليزية» و«الإسبانية» و«الألمانية» و«الفرنسية»
«غوغل» تزود الهواتف بخاصية ترجمة المحادثات لحظياً
كشفت شركة «غوغل» عن خاصية جديدة تنوي أن تزود بها الهواتف الذكية، تتيح للمستخدم التحدث عبر الهاتف بلغته الأصلية، فتتحول كلماته وجمله لحظياً إلى ملفات صوت مسموعة للطرف الآخر في المحادثة، ليسمعها هو أيضاً مفهومة وطبيعية بلغته الأصلية.
وعرضت «غوغل» أول تجربة من هذا النوع من الترجمة اللحظية الفورية في الوقت الفعلي، خلال مؤتمر صحافي خاص عقدته في مكتبها بمدينة سان فرانسيسكو، أخيراً، بحضور رئيس الذكاء الاصطناعي في الشركة، جيف دين.
وأفادت «غوغل» بأنها ستبدأ تشغيل الخاصية الجديدة تدريجياً خلال الأشهر القليلة المقبلة، موضحة أنها ستعمل في البداية مع اللغات الإنجليزية والإسبانية والألمانية والفرنسية.
تقنيات مختلفة
وخلال المؤتمر، كشف دين عن أحدث إنجازات «غوغل» في مجال الذكاء الاصطناعي وتعلم الآلة، ليس في مجال الترجمة اللحظية فقط، بل في مجالات أخرى، حيث عرض في مجال تقنية الصحة نظاماً للكشف عن فقر الدم يعتمد على الذكاء الاصطناعي، فيما عرض في مجال الأجهزة الشخصية والأدوات الإنتاجية نظاماً يمكنه التحكم في السماعات والأجهزة المختلفة من خلال لمس وثني «كيبل» من السلك مرتبط بها فقط من دون إجراء أي أمر آخر، حيث قام بالتحكم في مستوى صوت الموسيقى المنبعث من السماعة بمجرد لي وتحريك «كيبل» السلك المرتبط بها.
الذكاء الاصطناعي
وبالنسبة لخاصية الترجمة الجديدة، أكد دين أنها لم تعد بعيدة المنال، ولن تظل خيالاً علمياً، حيث تمكنت «غوغل» من استخدام علوم الذكاء الاصطناعي وتعلم الآلة، وتقنيات المعالجة العصبية للغات الطبيعية، في التوصل إلى خاصية أو أداة ترجمة لحظية فورية، تعمل على الهواتف الذكية، وتحقق المزيد من التقدم في هذا الاتجاه.
وبحسب ما قاله دين خلال المؤتمر، ونقله موقع «ذا فيرج» المتخصص في التقنية، فإن علماء الذكاء الاصطناعي في «غوغل» قطعوا أشواطاً مهمة نحو الوصول إلى الترجمة المباشرة اللحظية أثناء المحادثة، وقاموا ببناء خاصية جديدة، تسمح لمستخدمي الهواتف الذكية بالتحدث في «ميكرفون» الهاتف بطريقة طبيعية، فيتم تسجيل الصوت في ملف صوتي لحظياً في الوقت الفعلي، ثم يجري التعرف إلى هذا الصوت ومعالجة اللغة الطبيعية الموجودة به على خوادم «غوغل» عبر اتصال فائق السرعة بالإنترنت، ثم العودة بملف صوتي جديد باللغة الأخرى التي حددها المستخدم، ويفترض أن تكون هي لغة الطرف الآخر في المحادثة.
وأضاف دين أنه بعد ذلك يتم بث محتوى الملف الجديد بصوت مسموع وواضح، وذلك كله في الوقت الفعلي أو لحظياً، ما يفتح الطريق مستقبلاً للوصول إلى إجراء حوارات ومحادثات بين أشخاص مختلفين في اللغة عبر الهواتف الذكية، من دون حاجة أي منهم لمعرفة لغة الطرف الآخر، لأن كلاً منهم سيتحدث ويسمع الطرف الآخر بلغته الأصلية التي يفهمها، لتبدو المحادثة بالنسبة له وكأنها بلغة واحدة، في حين أنها تجري فعلياً بلغتين.
اختلاف
وأوضح دين أن الخاصية الجديدة تختلف عن خدمة الترجمة التي يقدمها تطبيق «ترجمة غوغل» الحالي على الهواتف الذكية، الذي يعتمد على مفهوم «الترجمة المعتمدة على الذكاء الاصطناعي»، وهي خدمة تتجاوز الترجمة المعتمدة على القواميس فقط، إذ يأتي الاختلاف من أن الخاصية الجديدة تعتمد على ترجمة النصوص المنطوقة في الوقت الفعلي، وليس ترجمة النصوص في الوقت الفعلي، فضلاً عن أنها تتم حتى الآن على خوادم «غوغل»، وليس بصورة محلية على الهاتف نفسه وبرنامج الترجمة.
وبيّن أن اعتماد هذه الطريقة المختلفة في العمل يرجع إلى أن تسجيل المحادثة ثنائية أو متعددة اللغات صوتياً بشكل لحظي في الوقت الحقيقي أمر أكثر تعقيداً من مجرد ترجمة النص المكتوب من لغة إلى أخرى، أو إدخال جمل مفردة من الكلام، وجعلها في نص بلغة مختلفة.
مرحلتان
وتابع دين أنه على الرغم من أن الخاصية الجديدة مصممة لتحقيق تواصل إنساني منساب وسريع وسلس، إلا أنها في البداية ستعاني بعض البطء، فهي تتم على مرحلتين، الأولى التقاط الصوت المباشر من خلال «ميكروفون» الهاتف الذكي وتسجيله لحظياً في ملف صوتي، والثانية معالجة وترجمة الملف وإنتاج ملف صوتي آخر، باللغة الجديدة، ثم تشغيله من خلال مكبر الصوت، والمفترض أن كل هذه العمليات تتم في الوقت الحقيقي، لكنها عملياً أظهرت بعض البطء في المحادثات.
جودة ودقة
أفادت شركة «غوغل» بأن خوارزميات الذكاء الاصطناعي ونماذج المعالجة العصبية للغة الطبيعية في ميزة التسجيل والترجمة اللحظية للصوت، تقوم بتقييم جمل كاملة باستمرار، لأن الصوت مستمر. وأوضحت أنه خلال عملية الجودة والدقة هذه تتم إضافة علامات الترقيم، وتصحيح بعض خيارات الكلمات وفقاً لسياق الجملة، ومحاولة تصحيح أشياء مثل اللهجات، ليحصل المستخدمون على ما يقولونه بمستوى دقيق.