Senior Research Scientist, Nemotron Post-training — Nvidia | cvGO!
Nvidia · 2 Locations · Office
### О роли Senior Research Scientist в команде Nemotron Post-training. Разработка и оптимизация методов пост-тренировки LLM (RLHF, синтез данных) для повышения производительности и безопасности моделей. ### Обязанности - Разработка и внедрение алгоритмов пост-тренировки (RLHF, DPO, PPO) для моделей