النظام الجديد يعمل من خلال متابعة مقطع مصوّر لحديث الأشخاص ويقارن النص بحركة أفواههم بدقة تصل إلى 93%. غيتي

نظام ذكاء اصطناعي يتعرف على لغة الكلام «أفضل من البشر»

تمكن باحثون في جامعة أوكسفورد البريطانية من تطوير جهاز يمكنه قراءة لغة الكلام أفضل من البشر.

وأفاد الباحثون بأن نظام الذكاء الاصطناعي «ليب نت» يعمل من خلال متابعة مقطع مصور لحديث الأشخاص، ويقارن النص بحركة أفواههم بدقة تصل إلى 93%، مشيرين إلى أن الاستعانة بهذا الجهاز في معرفة لغة الكلام يمكن أن يساعد ملايين الأشخاص.

لكن الخبراء أوضحوا أن هذا النظام لايزال بحاجة إلى الاختبار في مواقف الحياة الحقيقية.

وتمثل قراءة الشفاه عملية معقدة، إذ يتمكن المتخصصون في هذا المجال من فك شفرة ما يقوله الشخص عبر لغة الشفاه بنسبة دقة تصل إلى 60%.

وقال الباحثون إن «قارئ لغة الشفاه الآلي يتمتع بفرص نجاح كبيرة مع وجود التطبيقات التي تتعلق بأجهزة المساعدة في تحسين السمع والإملاء الصامت في الأماكن العامة والمحادثات السرية، وفهم الكلام في البيئات الصاخبة، وتحديد الهوية بأجهزة القياس الحيوية، ومعالجة الأفلام الصامتة».

وأشار الباحثون إلى أن نظام الذكاء الاصطناعي زُوّد بجمل كاملة حتى يتسنى له التعرف على الأحرف التي تتناغم مع حركة الشفاه.

وفي إطار الاختبار، زود فريق البحث من معمل الذكاء الاصطناعي التابع لجامعة أوكسفورد، نظام الذكاء الاصطناعي، بنحو 29 ألف مقطع فيديو، وأضاف إليها النص الصحيح، وكانت مدة كل مقطع ثلاث ثوانٍ فقط يتبعها نمط قواعد نحوية متماثل.

وفي حين توصل الباحثون إلى أن نسبة الخطأ في الاختبارات التي أجريت على البشر وجرى تزويدهم بمقاطع الفيديو نفسها بلغت 47.7%، فإن نظام الذكاء الاصطناعي سجل خطأ واحداً من بين 6.6% فقط.

وأثارت حقيقة أن هذا النظام الآلي يستند إلى مقاطع فيديو متخصصة للتدريب، انتقادات لهذا البحث من جانب بعض مستخدمي موقع التواصل الاجتماعي «تويتر».

وقال أستاذ «التعلم الآلي وعلم الأحياء الحسابي» البروفيسور، نيل لورانس، في مقال له على موقع مؤسسة «أوبن ريفيو» العلمية، إن مقاطع الفيديو تتمتع «بمفردات محدودة وقواعد تركيب نحوية وحيدة».

وأضاف لورانس «رغم أنه أمر واعد أن تأتي هذه الاختبارات بنتائج جيدة وفقاً لهذه البيانات، فإنه (هذا النظام) لا يمثل اختراقاً في واقع الأمر»، مشيراً إلى أنه «رغم أن هذا النموذج يمكنه قراءة لغة الشفاه أفضل من البشر، فإنه يستطيع أن يفعل ذلك فقط حينما أقول قائمة من الكلمات ليس لها معنى من مفردات مقيدة للغاية وبترتيب محدد». يشار إلى أن خدمة «ديب مايند» للذكاء الاصطناعي التابعة لشركة «غوغل» تمول جزئياً هذا المشروع.

الأكثر مشاركة