مهندس بيانات (PySpark)

Client of HireAlpha

نشرت في 22 ابريل

الخبرة

1 - 7 سنوات

التعليم

أي تخرج()

الجنسية

أي جنسية

جنس

غير مذكور

عدد الشواغر

1 عدد الشواغر

الوصف الوظيفي

الأدوار والمسؤوليات

تطوير خطوط بيانات: تصميم وتطوير وصيانة خطوط ETL عالية القابلية للتوسع والمثلى باستخدام PySpark على منصة بيانات Cloudera، مع ضمان سلامة البيانات ودقتها.

استيعاب البيانات: تنفيذ وإدارة عمليات استيعاب البيانات من مجموعة متنوعة من المصادر (مثل قواعد البيانات العلائقية، واجهات برمجة التطبيقات، أنظمة الملفات) إلى بحيرة البيانات أو مستودع البيانات على CDP.

تحويل البيانات ومعالجتها: استخدام PySpark لمعالجة وتنظيف وتحويل مجموعات البيانات الكبيرة إلى تنسيقات ذات مغزى تدعم الاحتياجات التحليلية ومتطلبات الأعمال.

تحسين الأداء: إجراء ضبط أداء كود PySpark ومكونات Cloudera، وتحسين استخدام الموارد وتقليل زمن تشغيل عمليات ETL.

جودة البيانات والتحقق: تنفيذ فحوصات جودة البيانات، والمراقبة، وروتينات التحقق لضمان دقة البيانات وموثوقيتها طوال خط الأنابيب.

الأتمتة والتنظيم: أتمتة سير العمل البيانات باستخدام أدوات مثل Apache Oozie، Airflow، أو أدوات التنظيم المشابهة داخل نظام Cloudera البيئي.

المراقبة والصيانة: مراقبة أداء خط الأنابيب، واستكشاف المشاكل.

القطاع المهني للشركة

المجال الوظيفي / القسم

الكلمات الرئيسية

  • مهندس بيانات (PySpark)

تنويه: نوكري غلف هو مجرد منصة لجمع الباحثين عن عمل وأصحاب العمل معا. وينصح المتقدمون بالبحث في حسن نية صاحب العمل المحتمل بشكل مستقل. نحن لا نؤيد أي طلبات لدفع الأموال وننصح بشدة ضد تبادل المعلومات الشخصية أو المصرفية ذات الصلة. نوصي أيضا زيارة نصائح أمنية للمزيد من المعلومات. إذا كنت تشك في أي احتيال أو سوء تصرف ، راسلنا عبر البريد الإلكتروني abuse@naukrigulf.com

وظائف مماثلة

مهندس البيانات

مهندس البيانات

مهندس البيانات

TASC Outsourcing

  • 2 - 7 سنوات
  • أبوظبي - الإمارات العربية المتحدة

مهندس البيانات

عرض الكل