دراسة تستخدم البيانات الوصفية للبطاقات الائتمانية في تحديد هوية الأشخاص

قد تبدو مجموعة بيانات تفتقد إلى الأسماء والعناوين وأرقام الهواتف قليلة القيمة في ما يتعلق بتحديد هوية الأشخاص، لكن تبين أنه يُمكن في معظم الأحوال استخدام معلومات قليلة لتحديد هوية شخص مُعين، بحسب ما كشفت عنه دراسة حديثة أجراها باحثون في «معهد ماساتشوستس للتكنولوجيا».

ولفتت نتائج الدراسة، التي نُشرت الأسبوع الماضي في مجلة «ساينس» العلمية، إلى قوة ما يُعرف بالبيانات الوصفية، واحتمال استغلالها في انتهاك الخصوصية بالاستعانة بقواعد البيانات الحكومية والتجارية. وفي غياب بيانات شخصية مثل الأسماء وأرقام الحسابات المصرفية، ساعد تحديد الأساليب المتباينة في التسوق على تمييز الأشخاص.

ودرس الباحثون بيانات معاملات البطاقات الائتمانية أجراها 1.1 مليون شخص على مدى ثلاثة أشهر، قدمها مصرف لم يُكشف عن اسمه في بلدٍ غير مُحدد. وتضمنت تاريخ كل معاملة، والمبلغ المدفوع، واسم المتجر. وتمكن فريق البحث بالاعتماد على معلومات ثانوية مثل موقع المتجر وتوقيت المعاملات في تحديد الأنماط الشرائية المميزة لنسبة 90% من الأشخاص، مع خلو البيانات من الأسماء وأرقام الحسابات وأي مُعرفات واضحة.

وقال طالب الدراسات العليا في «مختبر وسائط الإعلام» في «معهد ماساتشوستس» والمُؤلف الرئيس للدراسة، إيف-ألكسندر دي مونتجوي: «نُقدم طريقة لإيجاد ما تحتاجه لتحديد هوية فرد، أي قدر من البيانات يجعلك واضحاً وسط الحشد»، لافتاً إلى ارتباط ذلك بالحد الأساسي لتجهيل البيانات.

ومن خلال الاكتفاء بقدر قليل من البيانات، تمكن الباحثون بسهولة من تحديد نمط التسوق المُميز للشخص.

 

تحديد الأشخاص

وانطلاقاً من نمط التسوق المختلف للشخص، قال فريق البحث إنه بالإمكان العثور على شخص مُحدد من خلال مطابقة البيانات، مع أخرى متوافرة علناً مثل حسابات في مواقع مثل «فيس بوك» و«لينكد إن» و«إنستغرام»، وتغريدات منشورة في «تويتر» تتضمن التوقيت والموقع الجغرافي، وبيانات تطبيقات تسجيل زيارة الأماكن مثل «فورسكوير».

وتُضاف نتائج الدراسة إلى المُؤشرات الدالة على كشف الأشخاص حالياً، قدراً كبيراً من المعلومات عن أنفسهم بأكثر مما يُدركون من خلال المعاملات الرقمية، وتطبيقات الهواتف الذكية، وبيانات المكالمات الهاتفية عبر الهواتف المحمولة.

وبحسب ما قال الباحثون، فإن نحو 60% من المدفوعات المالية في الولايات المتحدة تجرى عبر البطاقات الائتمانية، كما يصل حجم المدفوعات عبر الهواتف المحمولة إلى مليار دولار سنوياً.

وحملت الدراسة عنوان «فريد في مركز التسوق.. إمكانية إعادة التحديد بالبيانات الوصفية للبطاقات الائتمانية»، وقد يهم أسلوبها العديد من الجهات مثل شركات الأبحاث، وإعلانات التجزئة، وجمعيات التجارة التي تشتري وتُكون قواعد ضخمة من البيانات؛ لتتبع المستهلكين، وتحسين قدرتها على توجيه الإعلانات إليهم.

وخلال الدراسة، تمكن الباحثون من تحديد النساء والرجال استناداً إلى تحليل نمط زيارتهم ومدة بقائهم في المتاجر المختلفة، كما استطاعوا تحديد الأشخاص ذوي الدخول المرتفعة، مشيرين إلى إمكانية تطبيق الأسلوب نفسه على أي بيانات تُسجل السلوكيات.

وأظهرت الدراسة، الصعوبة البالغة في تعطيل إمكانية تحديد أشخاص بين مجموعات البيانات، لاسيما البيانات المالية، بحسب ما قال جوزيف هول، المُتخصص في التكنولوجيا في «مركز الديمقراطية والتكنولوجيا»، وهو منظمة غير هادفة للربح تعنى بالبحث في قضايا الخصوصية والبيانات.

وأضاف هول الذي لم يُشارك في إجراء الدراسة أنه «يُمكن لوسطاء البيانات الذين يشترون ويجمعون قدراً كبيراً من المعلومات، استخدام الآلاف من نقاط البيانات، وربطها بالأفراد».

وتصب نتائج الدراسة في النقاشات الدائرة حول جمع برامج المُراقبة الحكومية للجانب الأكبر من البيانات، التي تشمل البيانات الوصفية للاتصالات بواسطة الهواتف المحمولة وقواعد البيانات الإلكترونية، مثل معلومات البطاقات الائتمانية، وفق ما قال العديد من الخبراء في خصوصية البيانات.

ويُشير ذلك إلى أهمية تغيير النظرة إلى معايير حماية البيانات ومدى قوة الأساليب الحالية في «تجهيل البيانات» أو تجريدها من أي مُعرفات واضحة. وقال دي مونتجوي: «الرسالة هي أنه ينبغي علينا إعادة التفكير وإعادة صياغة طريقة تفكيرنا في حماية البيانات».

 

بحوث مساندة

ومن بين الأبحاث الأخرى التي سعت لتسليط الضوء على أوجه القصور في الطرق المعتادة لإخفاء المعلومات الشخصية الحساسة من قواعد البيانات، دراسة أجراها اثنان من علماء الكمبيوتر في «جامعة تكساس» في أوستن، تعود إلى عام 2008، وتمكنا خلالها من تحديد بعض مستخدمي موقع «نيتفليكس» من قاعدة بيانات لا تتضمن الأسماء، كان الموقع قد وفرها للباحثين لتحسين قدرته على تقديم التوصيات.

كما عرضت عالمة الكمبيوتر في «جامعة هارفارد»، لاتانيا سويني، في عام 2013 توصل الباحثين إلى إعادة تحديد أسماء المرضى ضمن بيانات مستشفيات أتاحتها ولاية واشنطن. وفي أكتوبر الماضي، نجح مُحرر موقع «جاوكر» Gawker في تحديد بعض المشاهير ضمن سجلات وفرتها لجنة سيارات الأجرة في نيويورك.

في السياق نفسه، كشف باحثون في «جامعة كامبريدج» البريطانية في عام 2013 عن أن نمط «الإعجابات» أو «لايك» بمُشاركات في «فيس بوك» يكشف من دون قصد عن الآراء السياسية والدينية للأشخاص، واستخدامهم للمخدرات، وحالتهم الاجتماعية. كما توصلت دراسة نُشرت في يناير الماضي لباحثين في «جامعة كاليفورنيا» في ريفرسيد، أن «الإعجابات» تقيس شخصية المرء بقدر من الدقة يفوق تقدير أصدقائه المقربين.

 

الهويات الشخصية

في وقت يُفيد تحليل مجموعات كبيرة من البيانات، تتضمن تفاصيل حول سلوكيات الأشخاص، في تحسين الصحة العامة وتخطيط المُدن والتعليم، تدعو الدراسة إلى التساؤل حول الأساليب المُعتادة المعمول بها في كثيرٍ من الشركات والمستشفيات والوكالات الحكومية لإخفاء هويات الأشخاص في سجلاتها.

كما تدعم النتائج المتخصصين والمُدافعين عن الخصوصية في مساعيهم لمواجهة عمليات تتبع المستهلكين التي تقوم بها المؤسسات الإعلانية وشركات التحليل، بهدف تخصيص الإعلانات لما يدعونه مستخدمين مجهولي الهوية على الإنترنت.

ولفت فريق البحث إلى أنه إذا ما كانت الشركات وغيرها من المؤسسات ستُواصل توفير هذا النوع من البيانات على نطاقٍ واسع، فينبغي عليها الإشارة إلى المخاطر الناشئة عن إمكانية تحديد هوية الأشخاص. واعتبروا أن توفير بيانات تفتقر إلى الأسماء وعناوين المنازل وأرقام الهواتف وغيرها من عناصر التعريف الواضحة لا يضمن إخفاء هويات الأشخاص أو أمن بياناتهم عند نشرها للعموم أو نقلها إلى أطراف أخرى.

 

الأكثر مشاركة