Senior Site Reliability Engineer - HPC — Nvidia | cvGO!
Nvidia · 3 Locations · Office
### О роли Senior SRE для HPC-инфраструктуры Nvidia. Обеспечение надежности, масштабируемости и производительности кластеров под AI/HPC-нагрузки. ### Обязанности - Проектирование отказоустойчивых HPC-кластеров и GPU-инфраструктуры. - Автоматизация деплоя, мониторинга и восстановления (IaC, CI/CD). -