بحثت في 700 مليون كلمة وعبارة وموضوع تضمنتها «تحديثات الحالة» على الموقع
دراسة تستخدم «فيس بوك» للتنبؤ بالسمات الشخصية للمستخدمين
يمكن للغة التي يستخدمها ملايين الأشخاص الذين يتكلمون عبر الشبكات الاجتماعية المختلفة، ويسجلون عبر منشوراتهم جوانب متزايدة من حياتهم، أن تكشف عن سماتهم الشخصية بطريقة تنافس الاستبيانات التقليدية التي يُجيب عنها الأشخاص أنفسهم.
وكشفت دراسة حديثة أجراها مجموعة من الباحثين في جامعة «بنسلفانيا» الأميركية، عن إمكانية استخدام التحليل الحسابي للغة التي يكتب بها الأشخاص تحديثات الحالة في موقع «فيس بوك» للكشف عن سمات شخصياتهم.
واعتمدت الدراسة على مشاركة 75 ألف متطوّع أجابوا عن أسئلة استبيان يتناول سمات شخصياتهم، من خلال تطبيق عبر موقع «فيس بوك»، وبعدها سمحوا للباحثين بالاطلاع على تحديثات الحالة التي ينشرونها عبر الموقع، وعمد فريق البحث إلى تحليل ودراسة الأنماط اللغوية العامة في كلماتهم.
وأثمر التحليل بناء نماذج نجحت في التنبؤ بعمر وجنس كل متطوّع، إضافة إلى التنبؤ بإجاباتهم عن استبيان تحديد السمات الشخصية، وفي بعض الحالات كانت النتائج دقيقة بدرجة كبيرة، إذ تمكن الباحثون من التنبؤ بجنس المتطوّع في 92% من الحالات، بناءً على الكلمات التي استخدموها في «فيس بوك».
وتتبع الدراسة سلسلة من الأبحاث المهتمة بدراسة الكلمات التي يلفظها أو يكتبها الناس، باعتبارها أداة لفهم مشاعرهم وحالتهم العقلية، لكنها تختلف عنها في المنهج المتبع، فبدلاً من منهج يعتمد على البحث عن مجموعة محددة من المفردات، اتجهت الدراسة إلى البحث المفتوح في البيانات المتاحة، واستخراج الكلمات والعبارات المهمة من العينة نفسها.
وسابقاً، اعتمدت طريقة المفردات المحددة على جمع علماء النفس لقائمة من الكلمات تشير إلى المشاعر الإيجابية مثل «قانع»، و«متحمس»، و«رائع»، ثم يقيسون معدل استخدام الشخص لها، باعتبارها مؤشراً على مدى سعادته، بحسب ما قالت الباحثة في «مركز علم النفس الإيجابي» وأحد أعضاء فريق البحث، مارغريت كيرن.
ولفتت كيرن إلى أن من بين حدود هذا المنهج، أن المفردات لا تقيس دوماً ما يريد العلماء قياسه.
ومن بين الحدود الأخرى التي يتضمنها هذا المنهج، اعتماده على مجموعة كلمات محددة وثابتة، ولذلك، فإنه قد يتمكن من التوصل إلى استخدام الأشخاص المصابين بالاكتئاب كلمة مثل «حزين» بمعدل أعلى من الآخرين.
إلا أنه وفي المقابل، لا ينجح ــ على سبيل المثال ــ في التوصل إلى رؤى جديدة مثل قلة حديث المكتئبين عن ممارسة الرياضة، أو الأنشطة الاجتماعية، مقارنة بالأشخاص السعداء.
كما أشار الأستاذ في علوم الكمبيوتر والمعلومات، لايل أونجار، إلى قيدٍ آخر، وهو حاجة هذا المنهج إلى البحث عن تعبيرات متعددة الكلمات لفهم المعنى الذي يقصده الشخص، لافتاً إلى الكلمات التي تحمل أكثر من معنى مثل كلمة «كرود» باللغة الإنجليزية التي تعني «خام»، ويكثر العاملون في قطاع الطاقة من استخدامها ضمن عبارة مثل «زيت خام»، لكنها تعني أيضاً «فظ».
وربما يرجع استخدام منهج البحث في مفردات محدودة في الماضي إلى محدودية عينة البحث، بينما أتاح الإعلام الاجتماعي تكوين قواعد كبيرة من البيانات، ما يسمح باعتماد مناهج مختلفة في التحليل.
وبحسب ما قال الباحث إتش. أندرو شوارتز، الذي قاد فريق البحث، فإن «مليارات الكلمات التي تتيحها مواقع الإعلام الاجتماعي تسمح بإيجاد نماذج على مستوى أكثر ثراءً».
وبحثت الدراسة فيما يزيد على 700 مليون من الكلمات والعبارات والموضوعات تضمنتها تحديثات الحالة الخاصة بالمتطوّعين في «فيس بوك»، ما وفر بيانات كافية للبحث بعيداً عن الكلمات والعبارات الشائعة، والوصول إلى اللغة غير المقيدة التي تعبّر أفضل عن سمات شخصية محددة.
واعتمد فريق البحث على أسلوب يُعرف باسم «تحليل اللغة التفاضلي»، أو «دي إل أيه» بغرض تحديد الكلمات التي تشير إلى خصائص معينة وردت في الاستبيانات التي أجاب عنها المتطوّعون، وتضمنت العمر والجنس، إضافة إلى درجاتهم على مقياس العوامل الخمسة الرئيسة للشخصية الإنسانية، وتشمل: الانبساطية، والعصابية، ويقظة الضمير، والانفتاح على الخبرات، والطيبة.
وخلال التحليل، شكل الباحثون سحابات من الكلمات، أشارت كلٌ منها إلى سمةٍ معينة، ويختلف حجم الكلمة في السحابة بحسب ارتباطها بهذه السمة؛ ومثال ذلك، فإن سحابة الكلمات التي تمثل اللغة التي يستخدمها أصحاب الشخصية الانبساطية، تبرز فيها كلمات منها «حفلة»، و«ليلة رائعة»، بينما تتكرر في سحابة الكلمات الخاصة بالشخصيات الانطوائية إشارات إلى الرموز اليابانية.
وقال عضو فريق البحث، مارتن سليجمان، إنه «تساءل من قبل حول معنى أن يكون الشخص انبساطياً، أو حول طبيعة فتاة في مرحلة المراهقة»، مشيراً إلى أن سحابات الكلمات تقترب من الأمور بأكثر مما تستطيع فعله جميع الاستبيانات المستخدمة.
من جانبه، رأى الباحث، يوهانس إيشستادت أن سحابات الكلمات تفتح نافذة لم يسبق أن توافرت من قبل على العالم النفسي للأشخاص الذين يتصفون بسمةٍمعينة.
وخلال الدراسة، وبهدف التأكد من دقة المنهج في رصد السمات الشخصية، قسم الباحثون المتطوّعين إلى مجموعتين، وبحثوا في ما إذا كان النموذج الإحصائي المعتمد على مجموعة واحدة منهم، يصلح للاستدلال على صفات المجموعة الأخرى.
واستعمل الباحثون تقنيات التعلم الآلي مع ثلاثة أرباع المتطوّعين، لبناء نموذج من الكلمات والعبارات التي تتنبأ بإجاباتهم عن الاستبيانات، ثم استخدموا هذا النموذج للتنبؤ بالعمر والجنس وشخصيات الربع الباقي من المتطوّعين بناءً على منشوراتهم في «فيس بوك».
وتمكن هذا النموذج من توقع جنس 92% من المتطوّعين، كما نجح في التنبؤ بعمر الشخص ضمن حدود ثلاث سنوات في أكثر من نصف الحالات، وفق ما قال شوارتز.
وتشير نتائج الدراسة إلى إمكانية بناء نماذج تنبؤية تعتمد على لغة الإعلام الاجتماعي، والاستفادة منها في الإجابة عن تساؤلات جديدة، وبدلاً من الحاجة إلى جمع إجابات ملايين الأشخاص للاستقصاءات، فإنه يمكن أن تتغير طريقة إجراء الدراسات مستقبلاً لتشكل مشاركات المتطوعين في «تويتر» و«فيس بوك» مصدراً للبحث.