Senior Software Engineer, RL Post-Training Frameworks — Nvidia | cvGO!
Nvidia · 3 Locations · Office
### О роли Senior Software Engineer в команду RL Post-Training. Разработка фреймворков для дообучения LLM и генеративных ИИ-моделей с подкреплением (RL). Ускорение внедрения моделей в продакшн. ### Обязанности - Проектирование и реализация масштабируемых фреймворков для RL-посттренировки (PPO, GRPO,