مهندس استخراج بيانات مستقل (بايثون)
Mindrift
صاحب عمل نشط
نشرت قبل 10 ساعة
أرسل لي وظائف مثل هذه
الجنسية
أي جنسية
جنس
غير مذكور
عدد الشواغر
1 عدد الشواغر
الوصف الوظيفي
الأدوار والمسؤوليات
هذه وظيفة حرة لمشروع تندم. كمهندس استخراج بيانات بايثون، ستقوم بإدارة مهام استخراج البيانات التي تتطلب دقة تقنية لاستخراج البيانات ومعالجتها، باستخدام أدوات متنوعة مثل Apify و OpenRouter المقدمة بالإضافة إلى أساليبك الخاصة.
المسؤوليات الرئيسية
- امتلاك تدفقات استخراج البيانات من البداية إلى النهاية عبر مواقع الويب المعقدة، مع ضمان تغطية كاملة ودقة وموثوقية تسليم مجموعات البيانات المنظمة.
- استغلال الأدوات الداخلية (Apify، OpenRouter) جنبًا إلى جنب مع تدفقات العمل المخصصة لتسريع جمع البيانات والتحقق منها وتنفيذ المهام مع تلبية المتطلبات المحددة.
- ضمان استخراج موثوق من مصادر الويب الديناميكية والتفاعلية، مع تكييف الأساليب حسب الحاجة للتعامل مع المحتوى المعروض بواسطة JavaScript وسلوك الموقع المتغير.
- فرض معايير جودة البيانات من خلال فحوصات التحقق، وضوابط الاتساق عبر المصادر، والالتزام بمواصفات التنسيق، والتحقق النظامي قبل التسليم.
- توسيع عمليات الاستخراج لمجموعات البيانات الكبيرة باستخدام دفعات فعالة أو توازي، ومراقبة الفشل، والحفاظ على الاستقرار ضد التغييرات الطفيفة في هيكل الموقع.
الملف الشخصي المطلوب للمرشحين
خبرة ذات صلة لا تقل عن 3 سنوات في هندسة البيانات، استخراج البيانات من الويب، الأتمتة، أو تطوير البرمجيات (مطلوب).
- درجة بكاليوس أو ماجستير في الهندسة، الرياضيات التطبيقية، علوم الحاسوب، أو المجالات التقنية ذات الصلة هي ميزة إضافية.
- خبرة قوية في استخراج البيانات من الويب باستخدام بايثون (BeautifulSoup، Selenium أو ما شابه)، بما في ذلك المحتوى الديناميكي (JS، AJAX، التمرير اللانهائي) وواجهات برمجة التطبيقات عبر البروكسيات.
- قدرة مثبتة على استخراج البيانات من الهياكل المعقدة (الهيراركي، الصفحات المؤرشفة، HTML غير المتسق).
- خلفية قوية في تنظيف البيانات، والتطبيع، والتحقق من الصحة، مع تقديم مجموعات بيانات منظمة (CSV، JSON، جداول بيانات جوجل).
- خبرة عملية مع نماذج اللغة الكبيرة وأطر الذكاء الاصطناعي لتعزيز الأتمتة وحل المشكلات.
- اهتمام قوي بالتفاصيل والتزام بدقة البيانات.
- أخلاقيات عمل ذاتية التوجيه مع القدرة على حل المشكلات بشكل مستقل.
- رابط إلى GitHub هو ميزة إضافية.
- إجادة اللغة الإنجليزية: متوسطة علوية (B2) أو أعلى (مطلوب).
القطاع المهني للشركة
- إنترنت
- التجارة الإلكترونية
- دوتكوم
المجال الوظيفي / القسم
- سوفت وير تقنية المعلومات
الكلمات الرئيسية
- مهندس استخراج بيانات مستقل (بايثون)
تنويه: نوكري غلف هو مجرد منصة لجمع الباحثين عن عمل وأصحاب العمل معا. وينصح المتقدمون بالبحث في حسن نية صاحب العمل المحتمل بشكل مستقل. نحن لا نؤيد أي طلبات لدفع الأموال وننصح بشدة ضد تبادل المعلومات الشخصية أو المصرفية ذات الصلة. نوصي أيضا زيارة نصائح أمنية للمزيد من المعلومات. إذا كنت تشك في أي احتيال أو سوء تصرف ، راسلنا عبر البريد الإلكتروني abuse@naukrigulf.com
Mindrift
Mindrift is looking for highly skilled Python Data Scraping Engineers to join the Tendem project and drive specialized data scraping workflows within our hybrid AI + human system. In this role, as an AI Pilot that s how we refer to this role at Mindrift you ll collaborate with Tendem Agents that handle repetitive tasks, while you provide critical thinking, domain expertise, and quality control to deliver accurate and actionable results. The Mindrift platform connects specialists with AI projects from major tech innovators. Our mission is to unlock the potential of Generative AI by tapping into real-world expertise from across the globe.
وظائف مماثلة
مهندس استخراج بيانات أول (بايثون)
Mindrift
- 3 - 8 سنوات
- السعودية - السعودية
مهندس البيانات
DUBAI PROPERTIES GROUP LLC
- 3 - 6 سنوات
- دبي - الإمارات العربية المتحدة
مهندس بيانات (3-5 سنوات)
Sol Analytics
- 3 - 5 سنوات
- دبي - الإمارات العربية المتحدة
مهندس البيانات
TASC Outsourcing
- 2 - 7 سنوات
- أبوظبي - الإمارات العربية المتحدة
لحسابهم الخاص المجند
Code Healers LLC
- 2 - 5 سنوات
- Remote - الولايات المتحدة الأمريكية (الولايات المتحدة الأمريكية)