مهندس بنية تحتية للحوسبة الذكية
Kraken
صاحب عمل نشط
نشرت قبل 2 ساعات
أرسل لي وظائف مثل هذه
الجنسية
أي جنسية
جنس
غير مذكور
عدد الشواغر
1 عدد الشواغر
الوصف الوظيفي
الأدوار والمسؤوليات
الفريق
تقوم Kraken بإنشاء فريق مخصص للحوسبة الذكية والبنية التحتية لتحفيز الجيل التالي من تدريب النماذج، الاستدلال، التقييم، والتجريب عبر البورصة. يجلس هذا الفريق ضمن قيادة الهندسة ويمتلك طبقة البنية التحتية التي تتيح لـ Kraken تشغيل أحمال العمل الذكية مع التحكم، السرعة، الاعتمادية، والانضباط التكلفي.
الفريق مسؤول عن بنية تحتية لـ GPU وموصلات التسريع، عمليات التجمع، الجدولة، تقديم النماذج، المراقبة، تخطيط السعة، والحوسبة الاقتصادية على النطاق الكبير. هذه هي العمود الفقري الذي يسمح لـ Kraken بتدريب وتقديم وتقييم وتكرار أنظمة الذكاء الاصطناعي داخليًا حيث يكون ذلك مهمًا للخصوصية، الكمون، الاعتمادية، التكلفة، أو تمييز المنتج.
ستشارك في فريق صغير وكبير التأثير يعمل مباشرة مع الباحثين في الذكاء الاصطناعي/تعلم الآلة، مهندسي المنصة، فرق الأمان، وفرق المنتج. المأمورية بسيطة: جعل طموحات الذكاء الاصطناعي لـ Kraken حقيقة من خلال بناء بنية تحتية للحوسبة سريعة، موثوقة، فعالة، ومنتجة.
الفرصة
-
امتلاك وتشغيل تجمعات GPU وموصلات التسريع المستخدمة للتدريب، الاستدلال، التقييم، والتجريب، بما في ذلك السائقين، أوقات التشغيل، النوى، ملحقات الأجهزة، تكوين العقد، العناصر الأساسية للجدولة، وعزل الأحمال.
-
تصميم بنية تحتية تمكّن فرق Kraken من تشغيل النماذج محليًا على وحدات معالجة الرسوميات حيث يكون ذلك مفضلًا استراتيجيًا واقتصاديًا، مما يقلل من الاعتماد غير الضروري على مقدمي الخدمات الخارجيين ويحتوي على تكاليف الحوسبة.
-
بناء وتحسين أنظمة الجدولة، التنسيق، التوزيع، إدارة الحصص، والانتفاع عبر بيئات التسريع المتنوعة.
-
تحسين خطوط أنابيب الاستدلال للكمون، الإنتاجية، الاعتمادية، كفاءة الذاكرة، والتكلفة باستخدام أطر مثل vLLM، خادم استدلال Triton، TensorRT، أو مكدسات الخدمة المكافئة.
-
الشراكة مع مهندسي التعلم الآلي والباحثين لإزالة الاختناقات في التدريب، التقييم، الاستدلال بالجملة، الاستدلال عبر الإنترنت، نشر العمل، وعمليات تصحيح الإنتاج.
-
بناء المراقبة لاستخدام GPU، ضغط الذاكرة، عمق الطابور، التشبع، إنتاجية الرموز، كمون الطلبات، الأحمال الفاشلة، ضغط السعة، والإنفاق.
-
دفع الاعتمادية، استجابة الحوادث، التنبيهات، الكتب التشغيلية، والتحسينات بعد الحوادث للبنية التحتية للحوسبة الذكية دائماً.
-
تقييم ودمج الأجهزة الجديدة، عائلات مثيلات السحابة، موصلات متخصصة، أوقات التشغيل، المجدولين، وأطر الخدمة مع تطور مشهد البنية التحتية للذكاء الاصطناعي.
-
بناء أدوات تجعل استخدام GPU مرئيًا، وقابلًا للمساءلة، وأسهل للفرق الداخلية لاستهلاكها دون الحاجة إلى أن تصبح خبراء في البنية التحتية.
-
المساهمة في قرارات المعمارية طويلة الأجل التي توازن بين الأداء، كفاءة التكلفة، القابلية للتوسع، بساطة التشغيل، وسلامة الإنتاج.
المهارات التي يجب عليك الاحتفاظ بها
-
5+ سنوات من خبرة الهندسة في البنية التحتية، مع قضاء وقت كبير في حوسبة GPU، بنية التعلم الآلي، أنظمة موزعة، حوسبة عالية الأداء، أو منصات إنتاج واسعة النطاق.
-
خبرة عملية في تشغيل تجمعات GPU أو بنية تحتية مدعومة من موصلات في بيئات الإنتاج أو بيئات شبيهة بالإنتاج، بما في ذلك الجدولة، التنسيق، مراقبة الاستخدام، وتحسين التكلفة.
-
أساسيات هندسة الأنظمة قوية عبر Linux، الشبكات، التخزين، الحاويات، Kubernetes، أوقات التشغيل الموزعة، وتصحيح الإنتاج.
-
خبرة مع أطر خدمة التعلم الآلي مثل vLLM، خادم استدلال Triton، TensorRT، TorchServe، KServe، Ray Serve، أو أنظمة مكافئة.
-
إتقان Python لأتمتة البنية التحتية، الأدوات، التصحيح، التكامل، وعمليات العمل التشغيلية.
-
فهم عملي لمفاضلات الأداء عبر التجميع، التزامن، استخدام الذاكرة، استخدام GPU، حجم النموذج، الكمون، الإنتاجية، التوافر، والتكلفة.
-
سجل حافل في تحسين تكاليف الحوسبة مع الحفاظ على توقعات أداء، اعتمادية، وتوافر واضحة.
-
خبرة في بناء أنظمة قابلة للرؤية مع مقاييس، سجلات، تتبع، لوحات معلومات، تنبيهات، وعمليات عمل الحوادث مفيدة.
-
راحة في العمل في بيئات ذات مخاطر عالية ودائمة حيث يكون وقت التشغيل، الإنتاجية، الدقة، والانضباط التشغيلي أمرًا حاسمًا.
-
متحدث واضح يمكنه ترجمة مفاضلات البنية التحتية للباحثين، فرق المنتج، مهندسي المنصة، أصحاب المصلحة في الأمان، وقيادة الهندسة.
ما هو جيد أن يكون لديك
-
خبرة في مختبر الذكاء الاصطناعي المتقدم، أو مزود خدمات سحابية، أو شركة تداول عالية التردد، أو منصة بحث، أو منظمة تعلم آلي على نطاق واسع.
-
إلمام بالسيليكون المخصص أو موصلات متخصصة مثل TPUs، AWS Trainium، Gaudi، أو منصات مشابهة.
-
خلفية في تخطيط السعة، مدخلات الشراء، استراتيجية السعة المحجوزة، اقتصاديات موصلات السحابة، أو إدارة تكاليف أسطول GPU.
-
خبرة في أطر التدريب الموزعة مثل DeepSpeed، Megatron-LM، FSDP، Ray، أو أنظمة مكافئة.
-
خبرة في تصحيح أخطاء CUDA، NCCL، النوى، السائق، وقت التشغيل، الذاكرة، الشبكات، أو مشكلات الأداء على مستوى منخفض.
-
خبرة في Rust، C++، Go، CUDA، أو لغات النظام الأخرى المستخدمة للبنية التحتية الحرجة من حيث الأداء.
-
خبرة في التشفير، الخدمات المالية، بنية التداول، أو بنية الإنتاج الحساسة للأمان.
الملف الشخصي المطلوب للمرشحين
5+ years of infrastructure engineering experience, with significant time spent on GPU compute, ML infrastructure, distributed systems, high-performance computing, or large-scale production platforms.
Hands-on experience operating GPU clusters or accelerator-backed infrastructure in production or production-like environments, including scheduling, orchestration, utilization monitoring, and cost optimization.
Strong systems engineering fundamentals across Linux, networking, storage, containers, Kubernetes, distributed runtimes, and production debugging.
Experience with ML serving frameworks such as vLLM, Triton Inference Server, TensorRT, TorchServe, KServe, Ray Serve, or equivalent systems.
Proficiency in Python for infrastructure automation, tooling, debugging, integration, and operational workflows.
Practical understanding of performance tradeoffs across batching, concurrency, memory usage, GPU utilization, model size, latency, throughput, availability, and cost.
Track record of optimizing compute costs while maintaining clear performance, reliability, and availability expectations.
Experience building observable systems with useful metrics, logs, traces, dashboards, alerts, and incident workflows.
Comfortable working in high-stakes, always-on environments where uptime, throughput, correctness, and operational discipline are critical.
Clear communicator who can translate infrastructure tradeoffs for researchers, product teams, platform engineers, security stakeholders, and engineering leadership.
القطاع المهني للشركة
- وسائل الإعلام
- النشر
- التلفزيون
- راديو
- خارجي
- رقمي
المجال الوظيفي / القسم
- سوفت وير تقنية المعلومات
الكلمات الرئيسية
- مهندس بنية تحتية للحوسبة الذكية
تنويه: نوكري غلف هو مجرد منصة لجمع الباحثين عن عمل وأصحاب العمل معا. وينصح المتقدمون بالبحث في حسن نية صاحب العمل المحتمل بشكل مستقل. نحن لا نؤيد أي طلبات لدفع الأموال وننصح بشدة ضد تبادل المعلومات الشخصية أو المصرفية ذات الصلة. نوصي أيضا زيارة نصائح أمنية للمزيد من المعلومات. إذا كنت تشك في أي احتيال أو سوء تصرف ، راسلنا عبر البريد الإلكتروني abuse@naukrigulf.com
Kraken
Our Krakenites are a world-class team with crypto conviction, united by our desire to discover and unlock the potential of crypto and blockchain technology. Kraken is a mission-focused company rooted in crypto values. As a Krakenite, you ll join us on our mission to accelerate the global adoption of crypto, so that everyone can achieve financial freedom and inclusion. For over a decade, Kraken s focus on our mission and crypto ethos has attracted many of the most talented crypto experts in the world.
https://jobs.ashbyhq.com/kraken.com/055adaf0-a15b-40f3-89ab-dc5ab4fa719e