رائد منصة الذكاء الاصطناعي Integrant Inc

نشرت في 9 ابريل

الخبرة

8 - 13 سنوات

موقع العمل

القاهرة - مصر

التعليم

أي تخرج()

الجنسية

أي جنسية

جنس

غير مذكور

عدد الشواغر

1 عدد الشواغر

الوصف الوظيفي

الأدوار والمسؤوليات

مهندس منصة الذكاء الاصطناعي الرائد مسؤول عن ربط أحمال العمل الذكائية مع البنية التحتية الإنتاجية، مع تركيز قوي على مجموعة أدوات NVIDIA AI، مما يمكّن أنظمة الذكاء الاصطناعي عالية الأداء، القابلة للتوسع، والمُحسّنة.

تتركز هذه الدور على تحسين النماذج، وكفاءة وقت التشغيل، واستخدام وحدة معالجة الرسومات، مما يضمن أن أحمال العمل الذكائية جاهزة للإنتاج، وفعالة من حيث التكلفة، وأداءً عبر بيئات الشركات.

الأدوار والمسؤوليات:

  • ترجمة أحمال العمل الذكائية/تعلم الآلة إلى بنية تحتية مُحسّنة واستراتيجيات نشر
  • تحسين أداء النموذج عبر بيئات GPU (الزمن، الإنتاج، استخدام الذاكرة)
  • تصميم وتنفيذ خطوط أنابيب الاستدلال والتدريب باستخدام أدوات مجموعة NVIDIA (TensorRT، Triton، NIM)
  • تحويل وتحسين النماذج عبر الأطر (PyTorch ONNX TensorRT)
  • تحليل وحل اختناقات الأداء باستخدام أدوات التقييم (GPU، الذاكرة، الشبكة)
  • تحسين استخدام GPU وكفاءة الجدولة عبر المجموعات
  • تصميم بنى تدريب واستدلال موزعة قابلة للتوسع
  • العمل بشكل وثيق مع العملاء لتحديد استراتيجيات بنية الذكاء الاصطناعي ونماذج النشر
  • دعم عمليات النشر الإنتاجية بما في ذلك المراقبة، والعودة، والتحقق من الأداء
  • إجراء أبحاث تطبيقية لتحسين كفاءة النموذج واستخدام البنية التحتية
  • توجيه أعضاء الفريق في بنية الذكاء الاصطناعي، والتحسين، وأنظمة GPU
  • أدوات تتبع التجارب (MLflow، W&B، Neptune) تسجل المعلمات، والمقاييس، والقطع الفنية للمقارنة
  • العثور على تدهور النموذج الذي يحدث بعد النشر: انزلاق المفاهيم، تغييرات خط أنابيب البيانات، تحول أنماط الحركة
  • تحليل السبب الجذري (RCA) ينطبق على أنظمة تعلم الآلة: عزل المتغيرات، إعادة إنتاج المشكلات

من الجيد أن يكون لديك

  • خبرة في نظام NVIDIA NIM ونظام NGC
  • التعرض لمشروع Megatron-LM، NeMo، أو تدريب/استدلال LLM على نطاق واسع
  • خبرة في تقنيات تحسين LLM (التخزين المؤقت KV، استراتيجيات التجميع)
  • الإلمام بممارسات MLOps و CI/CD لأنظمة الذكاء الاصطناعي
  • خبرة في الأدوار المعمارية أو الاستشارية التي تتعامل مع العملاء
  • الإلمام ببيئات HPC السحابية الهجينة / المحلية

الملف الشخصي المطلوب للمرشحين

ملف المرشح:

  • 8+ سنوات من الخبرة في أنظمة الذكاء الاصطناعي
  • 8+ سنوات من الخبرة في أنظمة تعلم الآلة، HPC والبنية التحتية للذكاء الاصطناعي
  • إجادة قوية في بايثون
  • خبرة قوية مع أحمال العمل الذكائية المستندة إلى GPU وتحسين الأداء
  • فهم عميق لتقنيات تحسين النماذج (التكميم، التقليم، التجميع)
  • خبرة عملية مع:
  1. PyTorch
  2. ONNX / وقت التشغيل ONNX
  3. TensorRT / TensorRT-LLM
  4. خادم استدلال Triton
  • معرفة بأساسيات CUDA، cuDNN، وهندسة GPU
  • خبرة في الأنظمة الموزعة (متعدد GPU / متعدد العقد)
  • الإلمام بـ:
  1. اتصالات NCCL
  2. NVLink / InfiniBand
  3. Kubernetes أو Slurm للتنظيم
  • خبرة في نشر نماذج الذكاء الاصطناعي في بيئات الإنتاج
  • القدرة على تحليل اختناقات النظام (الحوسبة، الذاكرة، الشبكة)
  • خبرة في أدوات التقييم (Nsight، TensorRT profiler، إلخ.)
  • معرفة باستراتيجيات تحسين التكلفة لأحمال العمل GPU
  • أدوات تتبع التجارب (MLflow، W&B، Neptune) تسجل المعلمات، والمقاييس، والقطع الفنية للمقارنة
  • العثور على تدهور النموذج الذي يحدث بعد النشر: انزلاق المفاهيم، تغييرات خط أنابيب البيانات، تحول أنماط الحركة
  • تحليل السبب الجذري (RCA) ينطبق على أنظمة تعلم الآلة: عزل المتغيرات، إعادة إنتاج المشكلات

القطاع المهني للشركة

المجال الوظيفي / القسم

الكلمات الرئيسية

  • رائد منصة الذكاء الاصطناعي

تنويه: نوكري غلف هو مجرد منصة لجمع الباحثين عن عمل وأصحاب العمل معا. وينصح المتقدمون بالبحث في حسن نية صاحب العمل المحتمل بشكل مستقل. نحن لا نؤيد أي طلبات لدفع الأموال وننصح بشدة ضد تبادل المعلومات الشخصية أو المصرفية ذات الصلة. نوصي أيضا زيارة نصائح أمنية للمزيد من المعلومات. إذا كنت تشك في أي احتيال أو سوء تصرف ، راسلنا عبر البريد الإلكتروني abuse@naukrigulf.com

Integrant Inc

Integrant is looking for game changers to join our team as " Lead AI Platform".

https://apply.workable.com/integrant/j/C096ADF78E/