Apache Spark چیست؟ Apache Spark یک چهارچوب متن باز پردازش موازی برای اجرای برنامه های تجزیه و تحلیل داده در مقیاس بزرگ در رایانه های خوشه بندی شده است که می تواند هر دو تجزیه و تحلیل دسته ای و بلادرنگ و نیز داده های مربوط به پردازش داده ها را رسیدگی کند. Spark یک […]
برچسب: هدوپ اکوسیستم
Apache Hive
Apache Hive انبار داده ای متن باز برای پرس و جو(query) و تجزیه و تحلیل مجموعه داده های بزرگ ذخیره شده در فایل های هدوپ است. هدوپ چهارچوبی برای مدیریت مجموعه کلان داده ها در یک محیط محاسباتیِ توزیع شده است. Hive دارای سه عملکرد اصلی است : خلاصه سازی داده ها، پرس و جو […]
ماژولهای هدوپ
ماژولهای هدوپ هدوپ به عنوان یک چارچوب نرم افزاری از چندین ماژول کاربردی تشکیل شده است. هدوپ از Hadoop Common به عنوان یک هسته برای ارائه کتابخانه های ضروری چارچوب استفاده می کند. سایر اجزاء شامل سیستم فایل توزیع شده هدوپ(Hadoop Distributed File System یا به اختصار HDFS ) است که قادر به ذخیره داده […]