;
coinex

بیگ دیتا (کلان داده)

بزرگ داده، داده های بزرگ، کلان داده یا بیگ دیتا (big data) اصطلاح گسترده ای برای مجموعه داده های (data sets) بسیار بزرگ و یا پیچیده ای است که برنامه های کاربردی پردازش داده سنتی برای آن ها مساعد نیست.

مقیاس بزرگ‌داده، به طور مداوم در حال رشد از محدودهٔ چند ۱۰ ترابایت به چندین پتابایت، در یک مجموعهٔ داده واحد است. شاید به جرات بتوان گفت که وقتی صحبت از بیگ دیتا به میان می آید همه به اشتباه چند گیگابایت داده را نیز بیگ دیتا فرض کنند، اما باید در اینجا به این نکته تاکید کرد که صحبت روی ترابایت و پتابایت و اگزابایت خواهد بود.

البته ذکر این نکته نیز خالی از لطف نیست که با گذر زمان و با پیشرفتِ دانش و توان بشری در زمینه پردازش داده و اطلاعات، و همچنین با افزایش روز افزونِ داده و اطلاعات، تعریف کلان داده (big data) نیز تغییر می کند. شاید ۲۰ سالِ قبل وقتی صحبت از گیگابایت به میان می آمد همه می گفتند که چه داده ی عظیمی! اما امروزه که صحبت از پتابایت و حتی اگزابایت (ده به توانِ ۱۸ بایت!) به میان آمده است، مسلماً این ها به دوش کشنده اسمِ کلان داده (big data) خواهند بود.

مشخصات

بیگ دیتا (big data) با سه مشخصه اصلیِ حجم (volume)، تنوع (variety) و نرخ تولید (velocity) شناخته می شوند که به ۳V شهرت یافته اند، اما برخی منابع چندین مشخصه دیگر مثلِ تغییرپذیری (variability)، صحت (veracity)، پیچیدگی (complexity) و … را نیز برای کلان داده نام می برند که ما نیز در اینجا تنها به توضیحِ همان سه مشخصه اصلی بسنده می کنیم.

  • حجم (volume): حجم در اینجا به مقدار و اندازه داده تولید شده اشاره دارد. وقتی می گوییم حجمِ داده، منظورمان قطعاً همان اندازه آن (ترابایت، پتابایت و…) است.
  • تنوع (variety): این فاکتور به نوعِ داده ذخیره شده و نوعِ داده ای که قرار است روی آن پردازش انجام دهیم اشاره دارد. به طور مثال پردازشِ داده هایی که صرفاً از اعدادِ صحیح تشکیل شده باشند بسیار ساده تر از داده هایی است که از انواعِ عددی، انواع کاراکتری، انواع داده های ساختیافته، نیمه ساختیافته، غیر ساختیافته و… تشکیل شده باشند.
  • نرخ تولید (velocity): این فاکتور نیز به سرعتِ تولید و یا همان نرخِ تولید داده اشاره دارد، در برخی مواقع نیز می توان آن را به نرخِ ورود داده و یا حتی نرخ پردازش داده اطلاق کرد.

جستجو براساس حروف الفبا