كيفية التنقيب في البيانات الضخمة، عندما نتحدث عن البيانات الضخمة، فإننا نتحدث عن كميات لا يمكن تصورها تأتي من العديد من الأنواع والمصادر بمئات تيرابايت أو حتى بيتابايت (البيتابايت هو رقم واحد متبوعًا بـ 15 صفرًا). تقارير IBM 2.5 كوينتيليون بايت من البيانات كل يوم (كوينتيليون هو رقم واحد متبوعًا بـ 18 صفراً). المعلومات في كل مكان وفي مواضيع مختلفة. هنا، يتساءل المرء عن مدى أهمية إعطاء هذه البيانات لأن المعلومات المنظمة من هذه البيانات لا تشكل سوى جزء صغير يصل إلى 10٪ مقارنة بالمعلومات غير المنظمة، والتي تشكل الباقي. وقد أدى ذلك إلى زيادة الحاجة إلى تطوير أدوات قوية لتحليل البيانات واستخراج المعلومات والمعرفة منها. لا يمكن للطرق التقليدية والإحصائية التعامل مع هذا الكم الهائل، لذلك يتم استخدام الأدوات الذكية لمعالجة هذه البيانات.

مامعنى البيانات الضخمة

انتشر مصطلح “البيانات الضخمة” في السنوات الأخيرة وقبل أن نصل إلى تعريف، نحتاج أولاً إلى معرفة ماهية البيانات وكيف تختلف عن المعلومات. المعلومات هي نتيجة أي عملية معالجة بيانات خام.

  • في عام 2011، حدد معهد ماكينزي العالمي البيانات الضخمة على أنها أي مجموعة من البيانات أكبر من قدرة أدوات قواعد البيانات التقليدية على التقاط وتخزين وإدارة وتحليل تلك البيانات. في الآونة الأخيرة، أثرت البيانات الضخمة أو البيانات الضخمة على جميع المجالات.
  • تعد البيانات الضخمة جزءًا حيويًا من أي عملية تنقيب عن البيانات.
  • تُستخدم هذه المعلومات على نطاق واسع في الأعمال والاقتصاد، لفهم العمليات التجارية، على سبيل المثال، يتم استخدامها لمعرفة سلوك الأسهم في سوق الأوراق المالية ومحاولة العثور على الأسهم الفائزة من خلال تحليل كمية كبيرة من البيانات. عن سلوك هذه الأسهم في الماضي والحاضر.

كيفية التنقيب في البيانات الضخمة

وهي مقسمة إلى ثلاثة أنواع:

  1. بيانات أولية أو بيانات بدون أي تحليل
  2. للمعلومات أو المعلومات، أي البيانات التي تم تحليلها للحصول على معلومات بسيطة
  3. المعرفة، أي التي يتم تحليلها بطريقة أكثر تعقيدًا.

استخدم Wal-Mart الشركة الشهيرة لاستكشاف Wal-Mart في الولايات المتحدة، حيث تؤدي الواردات الرئيسية إلى زيادة المبيعات في السوق دون أي تكلفة إضافية. اقترح أحد موظفي الشركة محاولة فهم سلوك العميل ومحاولة ربط المنتجات المتعقبة ببعضها البعض.

في الواقع، من خلال مراقبة سلوك ملايين العملاء، تمكنوا من ربط المنتجات ببعضها البعض من خلال مراقبة سلوك المشترين وزيادة أرباحهم بشكل كبير بفضل العروض على هذه المنتجات معًا. تسمى هذه الطريقة الآن تحليل سلة السوق.

بين استخدامات البيانات الضخمة

فيما يلي الاستخدامات الأكثر شيوعًا للبيانات الضخمة:

1. فهم وجذب العملاء

إنه أحد أهم استخدامات البيانات الضخمة اليوم. أصبح المثال الآن قادرًا على التنبؤ بالمنتجات التي تريدها، وحتى الحكومات قادرة على التنبؤ بنتيجة الانتخابات باستخدام البيانات الضخمة

2. فهم عملية الأعمال

يتم استخدام البيانات الضخمة على نطاق واسع من أجل تحسين العمليات التجارية. يمكن لمتاجر البيع بالتجزئة توقع احتياجات العملاء بناءً على المعلومات من مواقع التواصل الاجتماعي والأشياء المطلوبة. وكذلك تنبؤات الطقس مثل وول مارت التي سبق ذكرها

استخدام آخر للبيانات الضخمة في شركات النقل هو تحسين حركة المرور باستخدام بيانات حركة المرور الحية

3. في الاستخدام الشخصي

لا تقتصر فوائد البيانات الضخمة على الشركات والحكومات، بل يمكن استخدامها أيضًا بشكل شخصي، على سبيل المثال الساعات الذكية التي تجمع المعلومات على مدار اليوم عن السعرات الحرارية وأنماط الحركة والنوم

وبطبيعة الحال، فإن تحليل كل هذه الكمية من البيانات سيجعل من الممكن التفكير في الاستخدامات الفردية

4. تحسين الأداء الرياضي

تستفيد معظم النخب الرياضية اليوم من البيانات الضخمة بطريقة أو بأخرى، وهي IBM SlamTracker لبطولات التنس، ونستخدم أيضًا تحليلات الفيديو للاعبي كرة القدم لمراقبة أدائهم. تتعقب بعض الفرق الرياضية الكبرى اللاعبين خارج النادي لعاداتهم في النوم والأكل.