Big Data یا داده های عظیم بر اساس مشخصه های زیر می تواند تعریف گردد:
در واقع Big Data را می توان به اصطلاح، با ۳V یا همان (Volume ,Variety ,Velocity) تعریف نمود. از دیگر مشخصه های Big Data می توان تغییرپذیری، پیچیدگی و صحت داده را نام برد.
Big Data اصطلاحی در حال تحول می باشد که مقدار زیادی داده ی ساختار یافته، نیمه ساختار یافته و یا بدون ساختار را توصیف می نماید که قابلیت استخراج به عنوان اطلاعات را دارند. اگرچه Big Data به مقدار کمّی مشخصی اشاره نمی کند، ولی این واژه معمولا زمانی که در رابطه با داده های با حجم پتابایت یا اگزابایت صحبت می شود، کاربرد ویژه پیدا خواهد کرد .
Big Data یک واژه ی پرکاربرد برای توصیف رشد نجومی داده است و ممکن است همچون اینترنت، برای کسب وکار و حتی جامعه با اهمیت گردد. در واقع Big Data می تواند توسط هرشخص یا رسانه های جمعی و در هر زمان و طی هر فرآیند دیجیتال تولید شود و از طریق سیستم ها، حسگر ها و … منتقل گردد. این داده ها در سرعت، حجم و نوع های مختلف و از منابع گوناگون ارسالمی گردند، در نتیجه برای دریافت و استخراج و تحلیل آن ها نیاز به قدرت پردازش زیاد و توانایی تحلیل بالا می باشد.
از آنجا که بارگذاری Big Data در پایگاه های داده ی عادی برای تحلیل، نیاز مند زمان و هزینه ی زیادی می باشد، رویکرد های نوین، به سمت ذخیره سازی و تحلیل داده ها با اتکای کمتر به نوع و طرح داده، حرکت کرده است. به طوری که داده های خام در تجمیع با ابرداده ها برای یافتن الگو های مشخص، توسط برنامه های هوش مصنوعی و با استفاده از الگوریتم های پیچیده، مورد جستجو قرار خواهند گرفت.
گاهی اوقات Big Data با Cloud Computing به طور مشترک عمل می نماید. تجزیه و تحلیل مجموعه ی بزرگی از داده ها در یک زمان خاص، نیازمند پلت فرم هایی مانند Hadoop است تا مجموعه ی بزرگی از داده را در کلاسترهای مختلف توزیع نماید که در نتیجه پردازش و ترکیب آن ها ساده تر گردد.
در صورتی که اغلب به نظر می رسد Big Data عنوانی برای حجم داده می باشد ولی در همه ی موارد اینگونه نیست. واژه ی Big Data گاهی نیز به معنای تکنولوژی می باشد که شامل پردازش ها و ابزار ها است.
مثالی از Big Data:
می توان پتابایت (۱۰۲۴ ترابایت) یا اگزابایت (۱۰۲۴ پتابایت) داده، مشتمل بر میلیاردها رکورد تولید شده توسط انسان ها که از منابع مختلف مثل وب سایت ها، فروشگاه ها، شبکه های اجتماعی و … به دست می آید را مثالی از Big Data عنوان نمود، که داده هایی متنوع و بدون ساختار هستند.