مميزات البيانات الضخمة الخمسة
يوجد إجماع عام على أن هناك سمات معينة تحدد البيانات الضخمة من غيرها وتوجد في معظم دوائر البيانات الضخمة ، تسمى هذه الدوائر الخمسة : الحجم ، التنوع ، السرعة ، الموثوقية ، و القيمة.
أولاً : الحجم.
السمة الرئيسية التي تجعل البيانات “ضخمة” هي حجمها الهائل، ليس من المنطقي التركيز على الحد الأدنى لوحدات التخزين لأن إجمالي كمية المعلومات ينمو بشكل كبير كل عام، وفي عام 2010 ، قدر طومسون رويترز في تقريره السنوي أنه يعتقد أن العالم “يحتوي على أكثر من 800 إكسابايت من البيانات وتتزايد بصورة يومية “.
ثانياً : الموثوقية
تشير الموثوقية إلى مدى دقة البيانات، وهل يمكن للمدير الاعتماد على صحة البيانات ؟ يعلم كل مدير جيد أن هناك تباينات متأصلة في جميع البيانات التي تم جمعها ويجب مراجعتها وتدقيقها.
ثالثاً : التنوع.
يعد التنوع من أكثر التطورات إثارة للاهتمام في التكنولوجيا حيث يتم رقمنة المزيد والمزيد من المعلومات. وتتضمن جميع أنواع البيانات مثل البيانات المنظمة “التقليدية” وهي الأشياء في كشف حساب بنكي مثل التاريخ والمبلغ والوقت، والنوع الآخر هي البيانات غير المنظمة وكذلك البيانات شبه المنظمة.
رابعاً : السرعة.
السرعة هي تكرار البيانات الواردة التي تحتاج إلى معالجة. فكر في عدد الرسائل النصية القصيرة أو تحديثات حالة الفيسبوك أو الضربات الشديدة لبطاقة الائتمان التي يتم إرسالها على شركة اتصالات معينة كل دقيقة من كل يوم ، وستحصل على تقدير جيد للسرعة. تطبيق الدفق مثل Amazon Web Services Kinesis هو مثال لتطبيق يعالج سرعة البيانات.
خامساً : القيمة.
يجب أن يكون الهدف النهائي لأي مشروع بيانات كبير هو توليد نوع من القيمة للشركة التي تقوم بكل التحليلات. خلاف ذلك ، فأنت تؤدي فقط بعض المهام التكنولوجية من أجل التكنولوجيا.