بیگ دیتا (کلان داده) چیست؟

بیگ دیتا

امروزه تعریف های مختلفی از کلان داده یا به عبارتی بیگ دیتا مطرح می شود. یکی از جامع ترین این تعریف ها، تعریف four v است. در این تعریف کلان داده با استفاده از ۴ ویژگی آن توصیف می شود. این چهار ویژگی عبارتند از:

Volume
Velocity
Variety
Veracity

بیگ دیتا | کلان داده

حجم داده (volume)

 به مقادیر وسیع داده های تولید شده در هر ثانیه اشاره می کند. در حوزه کلان داده صحبت فراتر از ترابایت است و بیشتر حجم داده‌های مد نظر ما بین Zettabytes یا Brontobytes است. اگر ما تمام داده های تولید شده در جهان را بین آغاز زمان تا ۲۰۰۰ جمع کنیم، همان مقدار داده ها به زودی در هر دقیقه تولید می شود. با ابزارهای جدید بیگ دیتا و استفاده از سیستم های توزیع شده می توان به طوری که ما می توانیم داده ها را در پایگاه های داده ای که در نقاط مختلف دنیا قرار دارند، ذخیره و تجزیه و تحلیل کنیم.

سرعت داده (velocity)

به سرعتی که داده های جدید تولید می شود و سرعت در حال حرکت در اطراف آنها اشاره دارد. فقط به پیام های شبکه‌های اجتماعی که در عرض چند ثانیه منتشر می شوند فکر کنید. فناوری به ما اجازه می دهد در حالی که داده‌ها تولید می شود و بدون آن که آن را در پایگاه داده قرار دهیم، تجزیه و تحلیل کنیم.

تنوع داده (variety)

اشاره به انواع مختلف داده ای که می توانیم استفاده کنیم، دارد. در گذشته ما فقط روی داده های ساختاری تمرکز داشتیم که به صورت جداگانه در جداول یا پایگاه های اطلاعاتی مرتبط ذخیره شده اند(مانند داده های مالی یک بانک). در حالی که ۸۰٪ از داده های جهان بدون ساختار (متن، تصاویر، ویدئو، صدا، و …) است. با تکنولوژی کلان داده ما می توانیم داده ها را از انواع مختلف مانند پیام ها، مکالمات شبکه های اجتماعی، عکس ها، داده های سنسور ، ویدیو یا صوت ضبظ شده تجزیه و تحلیل کنیم.

صحت داده‌ (veracity)

با رشد سریع داده‌ها از نظر حجم و تنوع، احتمال وجود داده­‌های نادرست در آن­ها نیز افزایش می‌یابد. در نتیجه اگر ورودی قابل اعتماد نباشد، نمی‌توان به اطلاعات استخراج شده از آن اعتماد کرد. در دنیای کسب­ و­کار نیز، مدیران بطور کامل به اطلاعات استخراج شده از داده‌های عظیم، اعتماد نمی ­کنند.
 

نویسنده نوشته: MHQ

MHQ
محمدحسین قپانداران، دانشجوی مهندسی کامپیوتر دانشگاه خوارزمی، فعال در حوزه طراحی وب و دیجیتال مارکتینگ، علاقمند به فعالیت در حوزه کلان داده و ابزارهای تحلیلی آن

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *