<p>بناء وتشغيل Kubernetes للذكاء الاصطناعي: تكوين مجموعات GPU متعددة المستأجرين (MIG/GPUDirect RDMA، مكونات NVIDIA/DCGM)، الجدولة/الحصص، HPA/Cluster Autoscaler (حيثما ينطبق)، وعزل عبء العمل.</p>
Client of MBR Partners
صاحب عمل نشط
نشرت قبل 5 ساعات
أرسل لي وظائف مثل هذه
الجنسية
أي جنسية
جنس
غير مذكور
عدد الشواغر
1 عدد الشواغر
الوصف الوظيفي
الأدوار والمسؤوليات
تصميم وتشغيل البنية التحتية المحلية ككود: تأليف وحدات Terraform/Ansible/Helm القابلة لإعادة الاستخدام؛ بناء تدفقات عمل GitOps (مثل، Argo CD) للتغييرات القابلة للتكرار والمراجعة عبر البيئات.
الملف الشخصي المطلوب للمرشحين
5+ سنوات في DevOps/SRE/هندسة المنصات مع ملكية عملية للبيئات المحلية. خبرة مثبتة في تشغيل Kubernetes في الإنتاج (RBAC متعدد المستأجرين، الشبكات/CNI، التخزين، الدخول، المراقبة). إتقان IaC والأتمتة (Terraform، Ansible، Helm؛ GitOps مع Argo CD/Flux). إدارة قوية لنظام Linux، البرمجة النصية (Bash/Python)، واستكشاف الأخطاء وإصلاحها عبر المكدس (الحوسبة، الشبكة، التخزين). خبرة في CI/CD (GitLab CI/GitHub Actions)، أمان بناء الحاويات (SBOM، توقيع الصور)، وإدارة العناصر. أساسيات الشبكات قوية (L2/L3، التوجيه، BGP، VLANs، EVPN/VXLAN، توازن الحمل، TLS/mTLS). خبرة في تنفيذ المراقبة (Prometheus/Grafana، السجلات، التتبع) وتشغيل استجابة الحوادث.
القطاع المهني للشركة
المجال الوظيفي / القسم
الكلمات الرئيسية
- <p>بناء وتشغيل Kubernetes للذكاء الاصطناعي: تكوين مجموعات GPU متعددة المستأجرين (MIG/GPUDirect RDMA
تنويه: نوكري غلف هو مجرد منصة لجمع الباحثين عن عمل وأصحاب العمل معا. وينصح المتقدمون بالبحث في حسن نية صاحب العمل المحتمل بشكل مستقل. نحن لا نؤيد أي طلبات لدفع الأموال وننصح بشدة ضد تبادل المعلومات الشخصية أو المصرفية ذات الصلة. نوصي أيضا زيارة نصائح أمنية للمزيد من المعلومات. إذا كنت تشك في أي احتيال أو سوء تصرف ، راسلنا عبر البريد الإلكتروني abuse@naukrigulf.com
Client of MBR Partners
Our client is a young high-tech company incorporated in the heart of one of the world's fastest-growing tech hubs Dubai, UAE. As the exclusive software partner to one of the world's largest ODMs in the networking equipment space, they develop the Network Operating Systems that power critical data centre and telecom routing & switching infrastructure. Building on this foundation, they have recently launched an AI division focused on designing our own chips to accelerate inference and training workloads. What sets them apart is their unique position at the centre of a historic development: our ODM partner is establishing the first networking equipment factory of its kind in the GCC region, and they are the software engine driving this groundbreaking initiative. They are not just building technology they are building a true networking vendor that serves regional interests while meeting the growing demand for networking equipment across the MENA region and further. Their long-term vision extends beyond products to people: creating a thriving ecosystem for embedded systems and ASIC design talent that will produce generations of world-class professionals, establishing our region as a global centre of excellence for Enterprise Compute innovation. As a rapidly growing company at the forefront of AI hardware innovation, they are constantly seeking talented and motivated individuals to join their team. We offer a dynamic and challenging work environment, with opportunities to make a significant impact on the future of AI technology. Your Missionbr>Own the end-to-end design and operation of our on-premise infrastructure for AI and enterprise workloads built as code, automated, observable, and secure. You will architect and run Kubernetes clusters for training/inference, manage servers, networks, and core services, and enable developers with reliable CI/CD and platform tooling. This is where minutes, time-to-br>recovery and cost-per-job directly impact AI velocity at scale.