أدوات تؤدي بعض مهام علماء البيانات آلياً
في حين يسرت التقنيات الحالية سُبل جمع البيانات وتخزينها سواء كانت بيانات طبية أو علمية أو تجارية، يظل تحليل البيانات واستخراج رؤى مفيدة منها أحد التحديات الرئيسة في عصر المعلومات، ويكتسب الأمر أهميةً متزايدة في تخصصات عديدة من الطب إلى الإعلانات والإدارة والتعليم، وتالياً صارت الحاجة إلى مختصين مهرة يمكنهم تحليل البيانات المعقدة وشرحها ضرورة لا غنى عنها في مختلف المجالات.
وبالنظر إلى توافر كثير من الشركات على قدرٍ من البيانات يفوق ما يُمكنها تفسيره مع الحاجة الماسة إلى الخبرات والمهارات البشرية في هذا الشأن، تسعى مشروعات بحثية وشركات إلى تقديم أدوات آلية تؤدي بعض مهام علماء البيانات، في محاولة لتوفير المهارات المتطورة لتحليل البيانات على نطاقٍ أوسع.
ويعمل فريق من الباحثين، بدعم من شركة «غوغل»، على تطوير برنامج باسم «أوتوماتيك ستاتيستشن» Automatic Statistician أو «الإحصائي الآلي»، يُمكنه تحليل مجموعة من البيانات الخام، وتقديم تقرير مكتوب عنها يتألف من نصوص ومُخططات بيانية، لوصف الاتجاهات الرياضية التي توصل إليها.
وقال أستاذ هندسة المعلومات في «جامعة كامبريدج» البريطانية وقائد فريق البحث، زوبين قهرماني، إن البرنامج لا يُقصد منه القيام بمهمة خبير الإحصاء، لكن بإمكانه المساعدة كثيراً، وأضاف: «أحياناً ما يتوصل إلى أنماط لا يجدها مُحلل عادي للبيانات».
وفي الوقت الذي سهلت فيه الحواسيب كثيراً من إجراء العمليات الرياضية المُعقدة على مجموعات كبيرة من البيانات، إلى جانب ازدهار بيع البرمجيات المتخصصية في تحليل البيانات، فلايزال لتوافر الإبداع البشري والخبرة أهمية كبيرة لاختيار الأساليب التي يُمكنها تفسير الأنماط في مجموعات البيانات.
ويُعد برنامج «الإحصائي الآلي»، الذي يُقدّم كنموذج للاستعانة بالذكاء الاصطناعي في علوم البيانات، واحداً من أدوات عدة يجرى تطويرها لتحويل جانب من هذه المهارات والخبرات إلى عمليات آلية. وعلى سبيل المثال، حين تعامل البرنامج مع مجموعة من البيانات حول السفر الجوي خلال 10 سنوات، أمكنه تقديم تقرير يتألف من تسع صفحات بالإضافة إلى أربعة إيضاحات رياضية حول الاتجاهات التي لاحظها، بما يُتيح البناء عليها للوصول إلى توقعات.
وفي ديسمبر الماضي تلقى مشروع «الإحصائي الآلي» منحةً من شركة «غوغل» بقيمة 750 ألف دولار. ومن المُقرر أن تُتاح نسخة من البرنامج على شبكة الإنترنت خلال وقت لاحق من العام الجاري.
وقال قهرماني إنه سيبحث في ما بعد إمكانية إطلاق نسخة تجارية من البرنامج، إلى جانب مواصلة أبحاثه.
ويعتمد برنامج «الإحصائي الآلي» على مجموعة كبيرة من الأساليب الإحصائية التي يُمكن دمجها، مثل بناء كتل لإنشاء نماذج رياضية مختلفة، حسب قهرماني. ويبدأ البرنامج بمجموعة من البيانات، ثم يختار أفضل النماذج الرياضية لتطبيقها عليها وصولاً إلى جولة أخرى من التجارب، ويُضيف مزيداً من الأساليب الرياضية، ومن ثم يستخدم النموذج الأمثل لتأليف التقرير النهائي الذي يُفسر ما توصل إليه.
وتُركز تقارير برنامج «الإحصائي الآلي» على البيانات وليس ما يجري في العالم الحقيقي. وبالعودة إلى مثال بيانات السفر الجوي، تمكن البرنامج من أن يصف رياضياً الزيادة المتكررة في مُعدل السفر خلال كل صيف، لكنه لم يُشر إلى ارتباط الزيادة بموسم العطلات. ومع ذلك، اعتبر قهرماني أن البرنامج يُوفر نقطة جيدة للبدء أمام مُحللي البيانات من البشر الذين يستطيعون تقديم مثل هذه التفسيرات أو القيام بمزيد من التحليل.
وتبرز حالياً الحاجة إلى مزيد من علماء البيانات، وأشار تقرير صدر العام الماضي عن «الجمعية الملكية للإحصاء» في المملكة المتحدة إلى نقص في عدد علماء البيانات، بالتزامن مع نمو الطلب لدى مختلف المجالات على مهارات تحليل البيانات.
ووضع تقرير للشبكة الاجتماعية المهنية «لينكد إن» أصحاب مهارات الإحصاء والتنقيب في البيانات في المركز الأول بين أكثر المهارات التي ارتفعت احتمالات حصولها على وظيفة جديدة، أو جذبها لاهتمام مسؤولي التوظيف خلال عام 2014.
وإذا ما تحول برنامج «الإحصائي الآلي» إلى منتج تجاري، فسيُضاف بذلك إلى مجموعة من الخدمات الرامية لمساعدة الشركات على تحقيق الاستفادة القصوى من بياناتها، منها المنتج الذي أطلقته شركة «سكاي تري» Skytree أخيرا، واعتبرته أول أداة تتوافر تجارياً يُمكنها اختيار النموذج الأفضل لشرح مجموعة معينة من البيانات.
وخلافاً لبرنامج «الإحصائي الآلي»، لا يُمكن لأداة «سكاي تري» الجديدة تقديم تقرير مكتوب عما توصلت إليه. وتضم قائمة المتعاملين مع الشركة بعضاً من شركات التأمين والبطاقات الائتمانية التي تستعين بأداتها لكشف حالات الاحتيال.
ويرى العالم الرئيس في «سكاي تري» والأستاذ المُشارك في «معهد جورجيا للتكنولوجيا»، أليكس غراي، في برنامج «الإحصائي الآلي» مشروعاً بحثياً مُثيراً للاهتمام، لكنه اعتبر أن أساليبه لا تتمتع بفاعلية كافية للتعامل مع المجموعات الكبيرة جداً من البيانات.
ومن بين الشركات الأخرى «ناريتيف ساينس» Narrative Science التي تُتيح عبر أداة «كويل» Quill تحويل البيانات الرقمية إلى تقارير مكتوبة، واسُتخدمت بالفعل في مؤسسات صحافية للكتابة عن مباريات البيسبول والنتائج المالية للشركات، واستعانت بها مجلات منها «فوربس». وقال أحد مُؤسسي «ناريتيف ساينس» الأستاذ في «جامهة نورث وسترن» الأميركية، كريستين هاموند، إنه بمقدور برنامج «الإحصائي الآلي» المُساعدة في رفع كفاءة علماء البيانات، لكن تقاريره لن تُقدم الكثير لغير المعتادين على التعامل مع الإحصاءات. وأضاف هاموند أن «معظم مسؤولي الشركات لا يرغبون في معرفة النماذج الرياضية، بل يرغبون في معرفة أن بإمكانهم توفير المال من خلال تقليل عمل المصنع بنسبة 50% من الساعة الواحدة إلى السادسة صباحاً».