مهندس استخراج البيانات الأول (بايثون)

Mindrift

صاحب عمل نشط

نشرت قبل 6 ساعات

الخبرة

3 - 8 سنوات

موقع العمل

السعودية - السعودية

التعليم

بكالوريوس في العلوم(أجهزة الكمبيوتر)

الجنسية

أي جنسية

جنس

غير مذكور

عدد الشواغر

1 عدد الشواغر

الوصف الوظيفي

الأدوار والمسؤوليات

هذا دور مستقل لمشروع تندم. كمهندس استخراج بيانات بايثون، ستتعامل مع مهام استخراج البيانات التي تتطلب دقة فنية لاستخراج البيانات ومعالجتها، باستخدام أدوات متنوعة مثل Apify و OpenRouter التي نقدمها جنبًا إلى جنب مع أساليبك الخاصة.resourceful approaches.

المسؤوليات الرئيسية

  • امتلاك سير عمل استخراج البيانات من البداية إلى النهاية عبر مواقع الويب المعقدة، مع ضمان التغطية الكاملة والدقة والتسليم الموثوق لمجموعات البيانات المهيكلة.
  • استغلال الأدوات الداخلية (Apify، OpenRouter) جنبًا إلى جنب مع سير العمل المخصص لتسريع جمع البيانات والتحقق من صحتها وتنفيذ المهام مع تلبية المتطلبات المحددة.
  • ضمان استخراج موثوق من مصادر الويب الديناميكية والتفاعلية، مع تكييف الأساليب حسب الحاجة للتعامل مع المحتوى الذي يتم تقديمه بواسطة JavaScript وسلوك الموقع المتغير.
  • فرض معايير جودة البيانات من خلال فحوصات التحقق من الصحة، ومراقبة التناسق بين المصادر، والامتثال لمواصفات التنسيق، والتحقق المنهجي قبل التسليم.
  • توسيع عمليات الاستخراج لمجموعات البيانات الكبيرة باستخدام التجميع الفعال أو التوازي، مراقبة الفشل، والحفاظ على الاستقرار ضد التغييرات الطفيفة في هيكل الموقع.

الملف الشخصي المطلوب للمرشحين

على الأقل 3 سنوات من الخبرة ذات الصلة في هندسة البيانات، واستخراج البيانات، والأتمتة، أو تطوير البرمجيات (مطلوب).

  • درجة البكاليوس أو الماجستير في الهندسة، الرياضيات التطبيقية، علوم الحاسوب، أو المجالات الفنية ذات الصلة ميزة.
  • خبرة قوية في استخراج البيانات من الويب باستخدام بايثون (BeautifulSoup، Selenium أو مشابه)، بما في ذلك المحتوى الديناميكي (JS، AJAX، التمرير اللانهائي) وواجهات برمجة التطبيقات عبر الوكلاء.
  • قدرة مثبتة على استخراج البيانات من الهياكل المعقدة (الهياكل الهرمية، الصفحات المؤرشفة، HTML غير المتسق).
  • خلفية قوية في تنظيف البيانات، التطبيع، والتحقق من الصحة، مع تقديم مجموعات بيانات مهيكلة (CSV، JSON، جداول بيانات Google).
  • خبرة عملية مع LLMs وأطر الذكاء الاصطناعي لتعزيز الأتمتة وحل المشكلات.
  • اهتمام قوي بالتفاصيل والتزام بدقة البيانات.
  • أخلاقيات العمل الذاتية مع القدرة على استكشاف الأخطاء وإصلاحها بشكل مستقل.
  • رابط إلى GitHub هو ميزة.
  • إجادة اللغة الإنجليزية: مستوى فوق المتوسط (B2) أو أعلى (مطلوب).

القطاع المهني للشركة

المجال الوظيفي / القسم

الكلمات الرئيسية

  • مهندس استخراج البيانات الأول (بايثون)

تنويه: نوكري غلف هو مجرد منصة لجمع الباحثين عن عمل وأصحاب العمل معا. وينصح المتقدمون بالبحث في حسن نية صاحب العمل المحتمل بشكل مستقل. نحن لا نؤيد أي طلبات لدفع الأموال وننصح بشدة ضد تبادل المعلومات الشخصية أو المصرفية ذات الصلة. نوصي أيضا زيارة نصائح أمنية للمزيد من المعلومات. إذا كنت تشك في أي احتيال أو سوء تصرف ، راسلنا عبر البريد الإلكتروني abuse@naukrigulf.com