تُثير تحديات حفظها بعيداً عن المخترقين وعمليات التجسس والكوارث الطبيعية

البيانات الضخمة.. نمو سريع واختلاف حول الملكية

صورة

يحضر الحديث عن «البيانات الضخمة»، وأهمية البيانات عموماً، في الاقتصاد والتكنولوجيا وخطط الحكومات والإنترنت، فالعديد من الشركات يعتمد تحليل البيانات لتحسين منتجاتها، أو فهم المستهلكين على نحوٍ أفضل، أو تقديم إعلانات أقرب إلى اهتماماتهم، وحتى ترشيح الكتب والأصدقاء في الشبكات الاجتماعية.

والواقع أن البيانات الضخمة أو الكبيرة لم تنشأ في السنوات الأخيرة فقط، فطالما أنتج البشر قدراً كبيراً من البيانات، وربما ما أبرز المصطلح الجديد هو زيادة حجم البيانات وسرعة نموها وتطور وسائل التخزين والتحليل، ومن بين مصادر بيانات الماضي القريب سجلات الضرائب، والإحصاءات السكانية، وتذاكر المواصلات، والوثائق الطبية والحكومية.

وبحسب ما قال رئيس التحليلات في شركة «إس أيه إس» أو «ساس» المتخصصة في خدمات وبرمجيات تحليلات الأعمال، لوري مايلز، فإن «مصطلح البيانات الكبيرة كان موجوداً على مدى عقود، وكنا نجري التحليلات طوال هذا الوقت.. إنها ليست ضخمة، إنها فقط أضخم».

وتسبب في زيادة حجم البيانات، توافر أدوات التنظيم، مثل جمع بيانات آلاف من فروع متاجر التجزئة وأوقات إقبال المتسوّقين، وأذواقهم باختلاف الأماكن عبر شبكة كمبيوتر مشتركة، وبيانات عمل سيارات الأجرة في إحدى المدن، كما ساعد على ذلك الاتجاه إلى الوسائل الرقمية والإنترنت، ما حوّل معظم ما نقوم به إلى سلاسل من الآحاد والأصفار يُمكن لأجهزة الكمبيوتر تسجيلها وتخزينها، ومن ثم يسهل تحليلها والبحث فيها.

كما أسهم في تصاعد حجم البيانات، انتشار ما يُطلق عليه «البيانات غير المهيكلة»، مثل البريد الإلكتروني، ومواقع التسوّق، والرسائل النصية، وتغريدات «تويتر»، وتحديثات الحالة في «فيس بوك»، ومقاطع الفيديو في «يوتيوب»، إضافة إلى أدوات نقل البيانات مثل الهواتف الذكية، والأجهزة المنزلية المتصلة بالإنترنت مثل الثلاجات، والمستشعرات الصناعية، وكاميرات الدوائر التلفزيونية المغلقة.

وينتج كل ذلك وغيره قدراً كبيراً جداً من البيانات، وتتردد على الأسماع وحدات قياس ضخمة مثل «إكسابِت» التي تساوي 1000«بيتابِت»، وهذه الأخيرة تساوي 1000«تيرابِت» أي مليون «غيغابِت»، ولا يمكن لأحد تحديد حجم البيانات بدقة، نظراً لسرعة نموها، ويُقدر البعض أن نحو 90% من جميع البيانات في العالم أنشئت خلال السنوات القليلة الماضية.

وتمتلك دول عدة مشروعات للبيانات المفتوحة تتيح من خلالها مجموعات من البيانات مجاناً للجمهور عن مجالات، مثل المواصلات والزراعة واستهلاك الطاقة، وتسمح بنشرها واستغلالها من دون قيود الملكية الفكرية، وفي الولايات المتحدة وحدها يُوفر مشروع البيانات المفتوحة ما يزيد على 120 ألف مجموعة بيانات للجمهور.

ووفق شركة «آي بي إم» الأميركية، ففي كل يوم من عام 2012 تولدت 2.5 إكسابِت (ما يُعادل 2.5 مليار غيغابِت) من البيانات. واعتبر «مايلز» أن 75% من البيانات تنتمي إلى النوع غير المهيكل، وتأتي من مصادر مثل النصوص، والصوت، والفيديو.

وفي الماضي، مثّل تخزين البيانات مشكلة، وهو ما لم يعد كذلك الآن، ففي حين تضمنت أجهزة الكمبيوتر الشخصية الأولى ذاكرات تُقاس بوحدة «كيلوبت»، فإنه يمكن للهواتف الذكية الحالة تخزين آلاف الأضعاف وتتعدى 32 غيغابِت، كما تُزود العديد من أجهزة الكمبيوتر المحمولة بأقراص صلبة سعة «تيرابِت».

وأشار الرئيس التنفيذي لشركة «بول» لاستشارات تكنولوجيا المعلومات في أيرلندا والمملكة المتحدة، أندرو كار، إلى تراجع تكاليف تخزين البيانات بالنسبة للشركات الكبيرة. ويمكن لها الاختيار بين الاحتفاظ ببياناتها داخل الشركة في مراكز بياناتها، أو نقلها إلى مُزودي تخزين البيانات المستندة على الحوسبة السحابية.

ونشأت العديد من المنصات مفتوحة المصدر خصيصاً للتعامل مع هذا القدر الكبير من البيانات بسرعة وكفاءة منها «هادوب»، و«مونجو دي بي»، و«كاساندرا»، و«نو إس كيو إل».

ولا تكمن أهمية البيانات في مراكمتها والحديث عن ملايين ومليارات غيغابِت، بقدر ما ترجع إلى المعلومات والعلاقات التي يمكن تحصيلها منها.

ومن الممكن أن يُسهِم التحليل الفعّال للبيانات في تحسين أعمال الشركات وتوصلها إلى قرارات أفضل، إذ أظهر تقرير حديث من شركة «باين» شمل 400 شركة كبيرة، أن المؤسسات التي تبنت تحليلات البيانات الضخمة تقدمت بفارق ملحوظ عن غيرها.

ولا تقتصر أهمية البيانات الضخمة على جانبٍ واحد في المجتمع، بل تشمل الجهات الحكومية والتجارية والمؤسسات غير الهادفة للربح، والأفراد، ويمكن لأي شخص أو جهة باختلاف تخصص وحجم العمل الاستفادة من تحليل البيانات لتحسين عمليات الإنتاج والتصنيع والتسويق، وكفاءة النفقات في مجالات مختلفة، منها الرعاية الصحية، والبحث العلمي، والزراعة، والتجهيزات اللوجيستية، وتصميم المدن، وتجارة التجزئة، والحد من الجرائم.

كما أن العديد من الشركات انتبه للتو إلى قيمة البيانات وضرورة حمايتها والاستفادة منها، إذ أشار رئيس ممارسة تكنولوجيا المعلومات في شركة الاستشارات الإدارية المرموقة «مجموعة بوسطن الاستشارية»، رالف دريشمير، إلى استخدام المصارف المالية ثلث البيانات المتاحة لديها فقط، لأنها عادة موجودة في قواعد بيانات يصعب الوصول إليها.

وتُثير البيانات الضخمة تحديات أمام الشركات والحكومات والهيئات العامة منها الحاجة للحفاظ على أمن البيانات الحساسة بعيداً عن المخترقين، وعمليات التجسس، والكوارث الطبيعية، الأمر الذي يزداد صعوبة مع الانتشار الواسع للأجهزة المحمولة والمتصلة.

ومع وجود هذا القدر الكبير من البيانات، فإنه لا يمكن إغفال التساؤل عن ملكيتها، وتتوقف الإجابة جزئياً عن مزوّد الخدمة الذي يستضيف البيانات، وصلاحيات تخزينها، وقبل ذلك نشأة هذه البيانات والجهة التي تعود إليها، ما يُمثل حقل ألغام من النقاشات والخلافات القانونية.

وعلى سبيل المثال، يمكن التساؤل عمّن يمتلك البيانات الوصفية للمكالمة الهاتفية، التي تشمل الموقع الجغرافي وتوقيت ومدة المكالمة، وليس محتوى المحادثة.. فهل تعود إلى المتصلين أم شبكة الهاتف المحمول أو وكالات التجسس الحكومية التي قد تتنصت على المكالمات؟

ومع اتصال السيارات بالإنترنت، يبرز تساؤل عن مصير بيانات القيادة، وهل تعود إلى السائقين أم أصحاب السيارات أم المُصنعين؟

وتبدو قوانين الخصوصية والملكية الفكرية متأخرة عن وتيرة التطور التكنولوجي وتحليلات البيانات، وحالياً يتجدد الجدال حول ملكية ما يُكتب ويُنشر في منصات الإعلام الاجتماعي التي تقول عادةً إن مستخدميها يمتلكون محتواها الخاص، ومع ذلك تُجادل بشأن كيفية استخدامها لهذا المحتوى، وأحقيتها في مشاركته مع أطراف إعلانية لأغراض إعلانية.

والواقع أن كتابة تغريدة في موقع التدوين المصغر «تويتر»، مثلاً، قد يعني فقدان المستخدم أي سيطرة على كيفية استخدامها في المستقبل.

تويتر