بصفتك مهندس خلفية، ستقوم ببناء الأنظمة الأساسية وراء وكلاء الذكاء الاصطناعي الصوتي لدينا. ستقوم بتصميم خطوط الأنابيب في الوقت الحقيقي التي تعالج الكلام المباشر، وتنظم المحادثات المدعومة من LLM، وتدير جلسات الصوت المتزامنة على نطاق واسع، وتضمن أن كل مكالمة سريعة وموثوقة وذكية. وهذا يعني العمل بشكل مباشر مع معالجة الصوت في الوقت الحقيقي، وتحويل الكلام إلى نص وتحويل النص إلى كلام، وتنظيم LLM، والاتصالات (SIP/Asterisk)، والبنية التحتية الخلفية الموزعة. ستعمل يوميًا مع Python وFastAPI وPipecat وLiveKit (WebRTC) وCelery وPostgreSQL وRedis وKubernetes.
ماذا ستفعل
بناء وتحسين خطوط الأنابيب الصوتية في الوقت الحقيقي - التعرف على الكلام (STT)، معالجة LLM، وتوليد الكلام (TTS) تعمل في حلقات أقل من ثانية
تصميم وصيانة خدمات الخلفية التي تدير جلسات وكيل الصوت، وتوجيه المكالمات، ودمج الاتصالات (SIP/Asterisk)
تصميم أنظمة تنظيم متعددة الوكلاء - تدفقات المحادثة، تسليم الوكلاء، ونقل السياق بين وكلاء الذكاء الاصطناعي الصوتي
بناء وتوسيع البنية التحتية للتعامل مع آلاف المكالمات الصوتية المتزامنة مع زمن تأخير منخفض
تطوير وتحسين طبقات الاتصال في الوقت الحقيقي المعتمدة على WebSocket وWebRTC
تنفيذ وإدارة معالجة المهام الموزعة لحملات المكالمات الجماعية، وتحليلات المكالمات، وتحليل الذكاء الاصطناعي بعد المكالمات
تصميم، وتحسين، وصيانة قواعد بيانات PostgreSQL، وتخزين Redis، وطوابير الرسائل
تنفيذ الرصد عبر خطوط الأنابيب الصوتية: تتبع زمن التأخير، مقاييس جودة المكالمات، التتبع الموزع (OpenTelemetry، Sentry)
التعامل مع تصحيح الأخطاء في أنظمة الصوت في الوقت الحقيقي - تشخيص مشاكل جودة الصوت، وارتفاعات زمن التأخير، وفشل الجلسات
العمل بشكل وثيق مع فرق الذكاء الاصطناعي، والمنتج، وDevOps لشحن ميزات الذكاء الاصطناعي الصوتي من البداية إلى النهاية
من أنت
إتقان قوي في Python مع فهم عميق لنمط التزامن في الوقت الحقيقي async/await
خبرة في بناء أنظمة الخلفية للإنتاج مع FastAPI أو أطر عمل غير متزامنة مشابهة
فهم عميق لـ PostgreSQL، وتصميم قواعد البيانات العلائقية، وأنماط ORM
خبرة مع الأنظمة في الوقت الحقيقي - WebSockets، والبث، وخطوط الأنابيب الصوتية، أو الاتصالات ذات زمن التأخير المنخفض
خبرة عملية مع معالجة المهام الموزعة (Celery، Redis)
الراحة في التعامل مع أنظمة الإنتاج من البداية إلى النهاية، من التصميم إلى النشر إلى الاستجابة للحوادث
الازدهار في بيئات سريعة الوتيرة وعالية الملكية حيث يكون الذكاء الاصطناعي الصوتي هو المنتج الأساسي
من الجيد أن تكون لديك
خبرة مع الذكاء الاصطناعي الصوتي، أو الذكاء الاصطناعي الحواري، أو معالجة الكلام (STT، TTS، VAD)
خبرة مع أنظمة الاتصالات (SIP، Asterisk، WebRTC)
إلمام بتنظيم الذكاء الاصطناعي/LLM (OpenAI، LangChain، LangGraph، Pipecat، Livekit)
خبرة مع أطر العمل الصوتية في الوقت الحقيقي أو منصات الروبوت الصوتي
خبرة في بنية السحاب (AWS، GCP، Kubernetes)
قواعد بيانات المتجهات وأنماط RAG لوكلاء الصوت المعتمدين على المعرفة