مهندس استخراج بيانات أول (بايثون)

Mindrift

صاحب عمل نشط

نشرت قبل 10 ساعة

الخبرة

3 - 8 سنوات

موقع العمل

السعودية - السعودية

التعليم

بكالوريوس في العلوم(أجهزة الكمبيوتر)

الجنسية

أي جنسية

جنس

غير مذكور

عدد الشواغر

1 عدد الشواغر

الوصف الوظيفي

الأدوار والمسؤوليات

هذا دور مستقل لمشروع Tendem. كمهندس استخراج بيانات بايثون، ستتعامل مع مهام استخراج البيانات التي تتطلب دقة تقنية لاستخراج البيانات ومعالجتها من الويب، باستخدام أدوات متنوعة مثل Apify و OpenRouter المقدمة بالإضافة إلى أساليبك الخاصة.resourceful approaches.

المسؤوليات الرئيسية

  • امتلاك سير عمل استخراج البيانات من البداية إلى النهاية عبر مواقع الويب المعقدة، مع ضمان تغطية كاملة، ودقة، وتسليم موثوق لمجموعات البيانات المهيكلة.
  • استغلال الأدوات الداخلية (Apify، OpenRouter) جنبًا إلى جنب مع سير العمل المخصص لتسريع جمع البيانات والتحقق من صحتها وتنفيذ المهام أثناء تلبية المتطلبات المحددة.
  • ضمان استخراج موثوق من مصادر الويب الديناميكية والتفاعلية، مع تكييف الأساليب حسب الحاجة للتعامل مع المحتوى المعروض بواسطة JavaScript وسلوك الموقع المتغير.
  • فرض معايير جودة البيانات من خلال فحوصات التحقق، وضوابط تناسق المصادر المتقاطعة، والالتزام بمواصفات التنسيق، والتحقق المنهجي قبل التسليم.
  • توسيع عمليات الاستخراج لمجموعات بيانات كبيرة باستخدام التوزيع الفعال أو التوازي، ومراقبة الفشل، والحفاظ على الاستقرار ضد التغييرات الطفيفة في بنية الموقع.

الملف الشخصي المطلوب للمرشحين

خبرة لا تقل عن 3 سنوات ذات صلة في هندسة البيانات، واستخراج البيانات من الويب، والأتمتة، أو تطوير البرمجيات (مطلوب).

  • خبرة قوية في استخراج البيانات من الويب باستخدام بايثون (BeautifulSoup، Selenium أو ما شابه)، بما في ذلك المحتوى الديناميكي (JS، AJAX، التمرير اللانهائي) وواجهات برمجة التطبيقات عبر الوكلاء.
  • قدرة مثبتة على استخراج البيانات من الهياكل المعقدة (التسلسلات الهرمية، الصفحات المؤرشفة، HTML غير المتسق).
  • خلفية قوية في تنظيف البيانات، والتطبيع، والتحقق من صحتها، مع تقديم مجموعات بيانات مهيكلة (CSV، JSON، جداول بيانات جوجل).
  • خبرة عملية مع LLMs وأطر الذكاء الاصطناعي لتعزيز الأتمتة وحل المشكلات.
  • اهتمام قوي بالتفاصيل والتزام بدقة البيانات.
  • أخلاقيات العمل ذاتية التوجيه مع القدرة على استكشاف الأخطاء وإصلاحها بشكل مستقل.
  • إتقان اللغة الإنجليزية: متوسطة عليا (B2) أو أعلى (مطلوب).

القطاع المهني للشركة

المجال الوظيفي / القسم

الكلمات الرئيسية

  • مهندس استخراج بيانات أول (بايثون)

تنويه: نوكري غلف هو مجرد منصة لجمع الباحثين عن عمل وأصحاب العمل معا. وينصح المتقدمون بالبحث في حسن نية صاحب العمل المحتمل بشكل مستقل. نحن لا نؤيد أي طلبات لدفع الأموال وننصح بشدة ضد تبادل المعلومات الشخصية أو المصرفية ذات الصلة. نوصي أيضا زيارة نصائح أمنية للمزيد من المعلومات. إذا كنت تشك في أي احتيال أو سوء تصرف ، راسلنا عبر البريد الإلكتروني abuse@naukrigulf.com

Mindrift

The Mindrift platform connects specialists with AI projects from major tech innovators. Our mission is to unlock the potential of Generative AI by tapping into real-world expertise from across the globe.

https://apply.workable.com/toloka-ai/j/D2F2DB98FC/

وظائف مماثلة

مهندس جمع بيانات حر (بايثون)

محلل بيانات أقدم

مهندس بيانات أول

كبير علماء البيانات

inDrive

  • 3 - 8 سنوات
  • القاهرة - مصر

مهندس بيانات أول

عرض الكل