Senior Site Reliability Engineer - HPC — Nvidia | cvGO!

Nvidia · 3 Locations · Office

### О роли Senior SRE для HPC-инфраструктуры Nvidia. Обеспечение надежности, масштабируемости и производительности кластеров под AI/HPC-нагрузки. ### Обязанности - Проектирование отказоустойчивых HPC-кластеров и GPU-инфраструктуры. - Автоматизация деплоя, мониторинга и восстановления (IaC, CI/CD). -