HPC/AI Infrastructure Engineer

K20s Kinetic Technologies

صاحب عمل نشط

نشرت قبل 17 ساعة

الخبرة

5 - 7 سنوات

موقع العمل

Riyadh - Saudi Arabia

التعليم

أي تخرج()

الجنسية

أي جنسية

جنس

غير مذكور

عدد الشواغر

1 عدد الشواغر

الوصف الوظيفي

الأدوار والمسؤوليات

Key Responsibilities:

  • Deploy, configure, and manage NVIDIA Base Command Manager for orchestrating GPU workloads (critical).
  • Implement and maintain NVIDIA AI Enterprise Suite to support enterprise-grade AI frameworks.
  • Operate and optimize NVIDIA GPU and Network Operators within Kubernetes environments.
  • Utilize NVIDIA NIMs and Blueprints to streamline AI model deployment and infrastructure automation.
  • Administer and scale Slurm workload manager for HPC job scheduling (critical).
  • Manage vanilla Kubernetes clusters, ensuring high availability and resource efficiency.
  • Maintain and secure systems running on Canonical Ubuntu OS, including patching and performance tuning.

Required Skills & Qualifications:

  • Strong expertise with NVIDIA GPU technologies and AI infrastructure.
  • Hands-on experience with Slurm in HPC environments.
  • Proficiency in Kubernetes cluster administration.
  • Deep knowledge of Linux (Ubuntu) system administration.
  • Familiarity with network operators and GPU scheduling in containerized environments.
  • Ability to troubleshoot complex distributed systems.

Preferred Skills:

  • Experience with automation tools (e.g., Ansible, Terraform).
  • Knowledge of cloud-native architectures and hybrid HPC/AI deployments.
  • Familiarity with observability tools (Prometheus, Grafana).
  • Background in AI/ML workflows and performance optimization.

الملف الشخصي المطلوب للمرشحين

Experience: 5+ years

Location: KSA- Saudi Arabia

Contract Duration: 1year

Overview:br>We are seeking a highly skilled HPC/AI Infrastructure Engineer to design, deploy, and manage advanced computing environments leveraging NVIDIA technologies, Kubernetes, and Linux systems. This role is critical to ensuring the performance, scalability, and reliability of AI workloads across GPU-accelerated clusters./p>

القطاع المهني للشركة

المجال الوظيفي / القسم

الكلمات الرئيسية

  • HPC/AI Infrastructure Engineer

تنويه: نوكري غلف هو مجرد منصة لجمع الباحثين عن عمل وأصحاب العمل معا. وينصح المتقدمون بالبحث في حسن نية صاحب العمل المحتمل بشكل مستقل. نحن لا نؤيد أي طلبات لدفع الأموال وننصح بشدة ضد تبادل المعلومات الشخصية أو المصرفية ذات الصلة. نوصي أيضا زيارة نصائح أمنية للمزيد من المعلومات. إذا كنت تشك في أي احتيال أو سوء تصرف ، راسلنا عبر البريد الإلكتروني abuse@naukrigulf.com