باختصار
تحدثنا عن إنترنت الأشياء، لكن لم نتحدث عن الاستخدام الأكبر له: البيانات الضخمة وتحليلها.

عندما تشغل تطبيق Netflix على جهازك المحمول أو حاسوبك، ستظهر لك برامج وأفلام لم تشاهدها من قبل، يرشحها لك التطبيق نفسه، وغالباً ما تكون جيدةً فعلاً وملائمة لذوقك، كيف قام بذلك؟

الخدعة تكمن هنا في قراءة سجلك في التطبيق وملاحظة ما تشاهده وأين تقضي الوقت الأطول من وقتك، هل تتابع الوثائقيات أم الكوميديا؟ وبعد تحليل ومقارنة بنتائج غيرك من المستخدمين الذي يشاهدون البرامج التي تشاهدها وبرامج أخرى، يقرر التطبيق أنّ ذوقكما قد يكون متشابهاً، فيعرض عليك هذه البرامج الأخرى..طبعاً هذا اختصار وتبسيط كبير، لاستخدام بسيط آخر لما يُعرف بالبيانات الضخمة Big Data.

البيانات الضخمة..ضخمة جداً

المصطلح المعقد بسيط جداً، فهو يعبر عن نفسه ببساطة: البيانات الضخمة تعني الكثير والكثير والكثير من البيانات. حسب دراسات سابقة فإننا حتى 2003 أنتجنا فقط 5 مليارات جيجابايت من البيانات، لكن في الفترة بين 2003 وحتى 2012 فإننا أنتجنا 2.7 ترليون جيجابايت، ونحن - حسب الباحثين في بيركيلي - ننتج تقريباً حوالي 5 مليارات من الجيجابايت أيضاً كلّ يومين حالياً. طبعاً علينا الأخذ بالاعتبار جميع البيانات، مثل تحديثات فيسبوك وتويتر، وصور إنستغرام وسناب شات، وفيديوهات يوتيوب المرفوعة بشكلٍ يومي وغيرها.

iStock_000027555541_Small-1260x840
اليوم نعمل بشكلٍ مباشر لتحليل هذه المعطيات واستخدامها في الحياة اليومية بهدف تحسين حياة البشر وتسهيل خياراتهم.
تزايد عدد الأدوات التي يمكن أن تنتج هذه المعطيات بشكلٍ كبير، من الهواتف الذكية، إلى الميزان الإلكتروني الذكي الذي يتصل بالشبكة ويضيف وزنك بشكل أوتوماتيكي للتطبيقات على هاتفك وساعتك الذكية، أو سوارك الرياضي الذي يحسب عدد الخطوات وعدد الحريرات التي كسبتها وخسرتها بشكلٍ يومي. أجهزة GPS والكاميرات الذكية، كل تلك المعلومات تُعتبر جزءاً من البيانات الضخمة، بالإضافة لحساسات السيارات والطائرات وغيرها من الأجهزة المتصلة بالانترنت بشكل مباشر.
ومع زيادة عدد الأجهزة والحساسات الخاصة بما يسمى إنترنت الأشياء (الذي تحدثنا عنه سابقاً) خصوصاً في الهواتف المحمولة، فإنّنا نتلقى كماً كبيراً من المعطيات بشكلٍ لحظي عن حالات الطقس في أماكن محددة. في السابق اعتمد الناس في القرى الصغيرة على النظر خارج النافذة لمعرفة الطقس، اليوم نستطيع بواسطة البيانات الضخمة أن نوفر لمحة عن الطقس في منطقتك، في أي مكان في العالم تقريباً، وبدقةٍ كبيرةٍ جداً.

باستخدام البيانات الكبيرة نستطيع أن نتعلم عن عوامل الخطر التي يمكن أن تؤدي بأمراض معيّنة، على سبيل المثال، فإنّ الأشخاص المصابين بالمتلازمة الاستقلابية معرضون بشكلٍ أكبر للإصابة بداء السكري من النمط الثاني. لذلك قامت شركة بتطوير خوارزمية تستطيع تحليل تاريخك المرضيّ، والفحوص الطبية والمخبرية التي قمت بها، واعتماداً على الدراسات المسبقة والمعلومات الجغرافية الخاصة بمنطقتك والمعروفة مسبقاً، فإنّها تستطيع أن تحدد إمكانية خطورة إصابتك بالمرض والوقت المتوقع له. كما تقترح الحلول المناسبة من تعديل نظام الحياة أو إضافة التمارين الرياضية وتخفيف الوزن وغيرها. ما زالت هذه البرمجيات والخوارزميات قيدَ التطوير، لكنها ستخرج سريعاً وتنتشر بشكلٍ كبير مستقبلاً.

استخلاص الأنماط وتحليلها
تجمع المعلومات وتُربط وتحلل معاً، فهي دون التحليل لا تحمل أي قيمةٍ أبداً. تقوم الشركات والمعاهد بتحليل كميات كبيرة من البيانات لاستهداف البيانات المفيدة لها، ومن ثم تقوم بواسطة الحواسيب الخارقة بتحليل معلومات وكميات هائلة (نحن نتكلم عن كميات من المعطيات تصل إلى مليارات الجيجابايت).
معظم العمل والتحليل الذي تخضع له هذه البيانات يستهدف معرفة أنماط محددة وارتباطات تستطيع أن توفر ثغرات معينة لتقوم الشركات باستهدافها، كعادات المشترين على سبيل المثال، ونوعية المنتوجات التي يرغبون في رؤيتها وشرائها. واليوم تقوم بعض الشركات بإرسال إعلانات مباشرةٍ لأولئك الذين قد أنهوا للتو شراءً بواسطة البطاقات الائتمانية، وتعرض عليهم الأماكن الأقرب والأيسر للوصول لها وشراء منتوجاتها.


كل هذه البيانات الضخمة تتخذ السحاب (التخزين السحابي طبعاً وليس السحاب الحقيقي!) موطناً لها، ولكن عندما تكون بحوزتك كل هذه المعطيات فإنّه لا بدّ أن تكون الخصوصية أمراً يشغل بالك بشكل مستمر، لكن باستخدام المعطيات نستطيع أيضاً أن نوقف الهجمات الإلكترونية ونمنعها، وذلك بدراسة وتحليل عدد مرات تسجيل الدخول في أماكن معينة، وذلك لتنبيه المستخدم بالقيام بالتدخل مباشرةً والقيام بالاحتياطات اللازمة لمنع اختراق بياناته.
بواسطة البيانات الضخمة تستطيع الحكومات تحليل نمط السير، وتتبع أماكن الجريمة واستخدام المرافق العامة، وبذلك تستطيع إعطاء المسؤولين قدرةً أكبر على تحسين الاختيارات بشكلٍ مستمر وتطوير قوانين تلائم المتغيرات بشكل يلائم القرن الجديد.

يوماً ما، وبسبب زيادة كمية المعلومات بشكلٍ كبير، فإننا قد نصل إلى خوارزميات تستخدم وسائل التواصل الاجتماعي في معرفة نتيجة الانتخابات حتى. لكن على الجانب الآخر، مع تزايد كمية البيانات يزداد أيضاً خطر انعدام الخصوصية والخوف من الاختراق بشكلٍ مستمر، وبالتالي معرفة المزيد من المعلومات الخاصة عن الأفراد دون إذنهم، لكن لا بدّ من تطوير حلٍ يمنع ذلك.

باختصار وتبسيط شديد:
كلّ ما يدخل على الشبكة العنكبوتية يتم تحليله، من بيانات وسائل التواصل الاجتماعي وحتى مشترياتك من أمازون وقائمة الأفلام على IMDB وNetflix، وأعداد الحوادث وأماكن حصولها بشكلٍ مباشر.
بعد تحليل هذه البيانات تحاول الحواسيب الخارقة إيجاد أنماط متشابهة فيها، وحسب هذه الأنماط تقوم بتوقع الاختيار التالي أو الاختيارات الأفضل للمستخدم، سواء كان برنامجاً وثائقياً في ليلةٍ هادئة، أو منتوجاً من مواقع التبضع الإلكترونية، أو حتى احتمالية الإصابة بمرض معيّن.
للمزيد من المعلومات يمكنكم قراءة المصادر المُستخدمة في هذا المقال ومشاهدة حلقة #لخطة عن البيانات الضخمة.