Research Engineer, Code RL (Reinforcement Learning) — Anthropic | cvGO!
Anthropic · San Francisco, CA | New York City, NY · Office · 500000 USD
### О роли Research Engineer в команду Code RL (Reinforcement Learning) Anthropic. Разработка и внедрение RL-систем для обучения моделей (Claude) написанию, редактированию, тестированию и отладке реального кода. ### Обязанности - Проектирование RL-сред и задач по кодингу. - Создание сигналов вознагр