Senior Software Engineer, RL Post-Training Frameworks — Nvidia | cvGO!

Nvidia · 3 Locations · Office

### О роли Senior Software Engineer в команду RL Post-Training. Разработка фреймворков для дообучения LLM и генеративных ИИ-моделей с подкреплением (RL). Ускорение внедрения моделей в продакшн. ### Обязанности - Проектирование и реализация масштабируемых фреймворков для RL-посттренировки (PPO, GRPO,