Apache Spark

Apache Spark

Apache Spark چیست؟ Apache Spark  یک چهارچوب متن باز پردازش موازی برای اجرای برنامه های تجزیه و تحلیل داده در مقیاس بزرگ در رایانه های خوشه بندی شده است که می تواند هر دو تجزیه و تحلیل دسته ای و بلادرنگ و نیز داده های مربوط به پردازش داده ها را رسیدگی کند. Spark  یک […]

Apache Hive

Apache Hive

Apache Hive انبار داده ای متن باز برای پرس و جو(query) و تجزیه و تحلیل مجموعه داده های بزرگ ذخیره شده در فایل های هدوپ است.  هدوپ چهارچوبی برای مدیریت مجموعه کلان داده ها در یک محیط محاسباتیِ توزیع شده است. Hive  دارای سه عملکرد اصلی است : خلاصه سازی داده ها، پرس و جو […]

ماژول‌های هدوپ

ماژول‌های هدوپ

ماژول‌های هدوپ هدوپ به عنوان یک چارچوب نرم افزاری از چندین ماژول کاربردی تشکیل شده است. هدوپ از Hadoop Common به عنوان یک هسته برای ارائه کتابخانه های ضروری چارچوب استفاده می کند. سایر اجزاء شامل سیستم فایل توزیع شده هدوپ(Hadoop Distributed File System  یا به اختصار HDFS ) است که قادر به ذخیره داده […]