مهندس استخراج بيانات مستقل (بايثون)

Mindrift

صاحب عمل نشط

نشرت قبل 4 ساعات

الخبرة

3 - 8 سنوات

موقع العمل

السعودية - السعودية

التعليم

بكالوريوس في العلوم(أي)

الجنسية

أي جنسية

جنس

غير مذكور

عدد الشواغر

1 عدد الشواغر

الوصف الوظيفي

الأدوار والمسؤوليات

هذه وظيفة مستقلة لمشروع Tendem. بصفتك مهندس استخراج بيانات بايثون، ستتعامل مع مهام استخراج البيانات التي تتطلب دقة تقنية لاستخراج ومعالجة الويب، باستخدام أدوات متنوعة مثل Apify وOpenRouter المقدمة من جانبنا بالإضافة إلى أساليبك الخاصة.

المسؤوليات الرئيسية

  • امتلاك سير عمل استخراج البيانات من البداية إلى النهاية عبر مواقع الويب المعقدة، مع ضمان التغطية الكاملة والدقة والتسليم الموثوق لمجموعات البيانات المنظمة.
  • استغلال الأدوات الداخلية (Apify، OpenRouter) جنبًا إلى جنب مع سير العمل المخصص لتسريع جمع البيانات والتحقق من صحتها وتنفيذ المهام مع تلبية المتطلبات المحددة.
  • ضمان استخراج موثوق من المصادر الديناميكية والتفاعلية على الويب، وتكييف الأساليب حسب الحاجة للتعامل مع المحتوى المعروض بواسطة JavaScript وسلوك الموقع المتغير.
  • فرض معايير جودة البيانات من خلال فحوصات التحقق، والتحكم في اتساق المصادر المتعددة، والالتزام بمواصفات التنسيق، والتحقق المنهجي قبل التسليم.
  • توسيع عمليات الاستخراج لمجموعات البيانات الكبيرة باستخدام تجميع فعال أو توازي، ومراقبة الفشل، والحفاظ على الاستقرار أمام التغييرات الطفيفة في هيكل الموقع.

الملف الشخصي المطلوب للمرشحين

على الأقل 3 سنوات من الخبرة ذات الصلة في هندسة البيانات، واستخراج الويب، والأتمتة، أو تطوير البرمجيات (مطلوب).

  • درجة بكاليوس أو ماجستير في الهندسة، الرياضيات التطبيقية، علوم الكمبيوتر، أو المجالات التقنية ذات الصلة ميزة.
  • خبرة قوية في استخراج بيانات الويب باستخدام بايثون (BeautifulSoup، Selenium أو ما شابه)، بما في ذلك المحتوى الديناميكي (JS، AJAX، التمرير اللانهائي) وAPIs عبر البروكسيات.
  • قدرة مثبتة على استخراج البيانات من الهياكل المعقدة (الهياكل الهرمية، الصفحات المؤرشفة، HTML غير المتناسقة).
  • خلفية قوية في تنظيف البيانات، والتطبيع، والتحقق من صحتها، مما يوفر مجموعات بيانات منظمة (CSV، JSON، جداول بيانات Google).
  • خبرة عملية مع LLMs وأطر الذكاء الاصطناعي لتعزيز الأتمتة وحل المشكلات.
  • اهتمام قوي بالتفاصيل والتزام بدقة البيانات.
  • أخلاقيات العمل الذاتية مع القدرة على حل المشكلات بشكل مستقل.
  • رابط إلى GitHub ميزة.
  • إجادة اللغة الإنجليزية: متوسطة عليا (B2) أو أعلى (مطلوب).

القطاع المهني للشركة

المجال الوظيفي / القسم

الكلمات الرئيسية

  • مهندس استخراج بيانات مستقل (بايثون)

تنويه: نوكري غلف هو مجرد منصة لجمع الباحثين عن عمل وأصحاب العمل معا. وينصح المتقدمون بالبحث في حسن نية صاحب العمل المحتمل بشكل مستقل. نحن لا نؤيد أي طلبات لدفع الأموال وننصح بشدة ضد تبادل المعلومات الشخصية أو المصرفية ذات الصلة. نوصي أيضا زيارة نصائح أمنية للمزيد من المعلومات. إذا كنت تشك في أي احتيال أو سوء تصرف ، راسلنا عبر البريد الإلكتروني abuse@naukrigulf.com

Mindrift

Mindrift is looking for highly skilled Python Data Scraping Engineers to join the Tendem project and drive specialized data scraping workflows within our hybrid AI + human system.

In this role, as an AI Pilot that s how we refer to this role at Mindrift you ll collaborate with Tendem Agents that handle repetitive tasks, while you provide critical thinking, domain expertise, and quality control to deliver accurate and actionable results.

The Mindrift platform connects specialists with AI projects from major tech innovators. Our mission is to unlock the potential of Generative AI by tapping into real-world expertise from across the globe.

قراءة المزيد

https://apply.workable.com/toloka-ai/j/FDCF7FEFF9/