مهندس موثوقية الموقع الأول (SRE) Salla

نشرت في 10 اكتوبر

الخبرة

8 - 13 سنوات

موقع العمل

السعودية - السعودية

التعليم

بكالوريوس في العلوم(أجهزة الكمبيوتر)

الجنسية

أي جنسية

جنس

غير مذكور

عدد الشواغر

1 عدد الشواغر

الوصف الوظيفي

الأدوار والمسؤوليات

ستكون عمليًا مع Kubernetes والرؤية و GitOps والأتمتة والبنية التحتية السحابية، بينما تتعاون عن كثب مع فرق التطبيقات والمنصات والبيانات لتقديم بيئة موثوقة للغاية وقابلة للشفاء الذاتي.

تصميم ونشر ومراقبة وصيانة أحمال العمل الإنتاجية عبر Kubernetes (EKS/AKS/GKE) العناقيد.

  • بناء أنظمة قابلة للشفاء الذاتي وقابلة للتوسع تلقائيًا تقلل من العمل اليدوي والتدخل اليدوي.
  • تحسين الشبكات والتحكم في حركة المرور الواردة / الصادرة والشبكة الخدمية للتواصل الآمن والأداء العالي.
  • تصميم وتشغيل منصات قواعد بيانات موثوقة ومنصات تخزين (SQL و NoSQL ومتاجر الكائنات) في بيئات Kubernetes.
  • امتلاك استراتيجيات النسخ الاحتياطي والتعافي من الكوارث والتكرار والتحويل لتلبية أهداف RPO/RTO لخدمات البيانات الحرجة.
  • تحسين أداء التخزين والتكلفة من خلال استراتيجيات متعددة الطبقات وفصل البيانات الساخنة / الباردة، وسياسات دورة حياة S3/التفريغ.
  • استكشاف الأخطاء وإصلاحها واستعادة Kubernetes Persistent Volumes بثقة خلال الحوادث (StorageClasses، CSI drivers، PVC issues).
  • تأمين وتوسيع منصات تخزين الكائنات (مثل MinIO/S3-المتوافقة) ودمجها مع أحمال العمل لخطوط بيانات عالية الإنتاجية.
  • العمل مع تخزين الكتل (EBS/io2/gp3) وأنظمة الملفات المشتركة (EFS، NFS) لتحقيق التوازن بين الأداء والموثوقية والتكلفة.

الأتمتة والتسليم

  • دعم أفضل الممارسات في GitOps و CI/CD (ArgoCD، Flux، GitHub Actions). بناء الأتمتة لتوفير البنية التحتية والترقيات باستخدام Terraform و Helm و Kubernetes Operators.
  • تقليل مخاطر الإصدار من خلال استراتيجيات التسليم التدريجي (الأزرق/الأخضر، الكاناري، تحديثات التجاوز المتقطعة).

الرؤية واستجابة الحوادث

  • امتلاك مجموعة المراقبة والتنبيه (Prometheus، Grafana، Loki، VictoriaMetrics، OpenSearch).
  • قيادة إدارة الحوادث وما بعدها لمنع تكرارها.
  • توفير رؤية في الوقت الفعلي لصحة النظام وأداءه ومقاييس التكلفة.

الأمان والامتثال

  • تنفيذ سياسات IAM الأقل امتيازًا، وتأمين الاتصال بين الخدمات، و ACLs/firewalls الشبكية.
  • فرض RBAC في Kubernetes، وإدارة الأسرار، وسلسلة توريد الصور الآمنة.
  • المشاركة في جهود جاهزية التدقيق والامتثال.

الأداء وتحسين التكلفة

  • تحليل وضبط أداء النظام تحت الضغط (CPU/ذاكرة/IO).
  • التعاون مع فرق المنتجات والمنصات لتحديد الحجم المناسب للعناقيد وقواعد البيانات وطبقات التخزين.

تقديم لوحات معلومات لرؤية التكلفة لقيادة الهندسة.

الملف الشخصي المطلوب للمرشحين

درجة البكالوريوس في علوم الكمبيوتر أو الهندسة أو مجال ذي صلة أو خبرة عمل معادلة قوية.

8+ سنوات في أدوار SRE / DevOps / هندسة البنية التحتية.

خبرة عميقة في Kubernetes (متعددة العناقيد، تطوير مخططات Helm، الشبكات المتقدمة).

عمليات GitOps قوية باستخدام ArgoCD/Flux.

خبرة مع AWS (مفضل) أو Azure/GCP، بالإضافة إلى البنية التحتية ككود (Terraform، Pulumi، CloudFormation).

معرفة متقدمة بقواعد بيانات SQL & NoSQL (MySQL/Aurora، PostgreSQL، MongoDB، Redis).

مهارات البرمجة / الأتمتة في Python و Bash أو Go.

خلفية قوية في المراقبة / الرؤية (Prometheus، Grafana، Loki، ELK/Opensearch، VictoriaMetrics).

خبرة في CI/CD على نطاق واسع وإدارة حوادث الإنتاج.

خبرة في البث / الرسائل (Kafka، RabbitMQ أو ما شابه).

مهارات تواصل قوية وقدرة على العمل الجماعي للتعاون عبر فرق الهندسة و DevOps والأمان والمنتجات.

القطاع المهني للشركة

المجال الوظيفي / القسم

الكلمات الرئيسية

  • مهندس موثوقية الموقع الأول (SRE)

تنويه: نوكري غلف هو مجرد منصة لجمع الباحثين عن عمل وأصحاب العمل معا. وينصح المتقدمون بالبحث في حسن نية صاحب العمل المحتمل بشكل مستقل. نحن لا نؤيد أي طلبات لدفع الأموال وننصح بشدة ضد تبادل المعلومات الشخصية أو المصرفية ذات الصلة. نوصي أيضا زيارة نصائح أمنية للمزيد من المعلومات. إذا كنت تشك في أي احتيال أو سوء تصرف ، راسلنا عبر البريد الإلكتروني abuse@naukrigulf.com

وظائف مماثلة

مهندس DevOps رئيسي (Azure, Terraform)

Confidential Company

  • 8 - 12 سنوات
  • أبوظبي - الإمارات العربية المتحدة

مهندس ديفأوبس

مهندس سحابة AWS

عرض الكل