Middle RL Engineer (SberAI)
Город:
Москва
Занятость:
Полная занятость
Компания "Сбербанк"
Мы в Сбере запускаем новый проект - Embodied AI. Наша цель - стать центром компетенций по использованию новых модальностей при обучении роботов и VLA, упростить сбор подобных данных, а также разработать собственную модель, способную эффективно работать с самыми разными модальностями, включая запахи и прикосновения.
Обязанности
- Проектировать и реализовывать RL‑и имитационные пайплайны для роботов и VLA‑агентов: постановка задач, выбор алгоритмов, дизайн наград, оценка политики
- Разрабатывать и поддерживать инфраструктуру обучения: симуляторы, сценарии, генерация мультимодальных данных (визуальные, сенсорные, тактильные), интеграция с существующими дата‑платформами Сбера
- Адаптировать и дорабатывать state‑of‑the‑art алгоритмы и архитектуры (off‑policy/on‑policy RL, offline RL, imitation learning, VLA‑модели) под конкретные задачи роботов и виртуальных агентов.
Требования
- 2+ года опыта в ML/RL, из них не менее года с фокусом на RL, робототехнику или сложные sequential‑decision задачи
- Уверенное владение математическим аппаратом: математический анализ, линейная алгебра, теория вероятностей
- Продвинутые знания Python и PyTorch: реализация кастомных датасэмплеров и функций потерь
- Понимание принципов Distibuted training
- Глубокое понимание RL: on‑policy/off‑policy, value‑based vs policy‑gradient, entropy regularization, replay buffers, exploration, credit assignment.
- Практика с распространенными алгоритмами (PPO, SAC, TD3, DQN‑семейство, BC, GAIL и др.), умение адаптировать их под нестандартные среды
- Опыт работы с симуляторами и/или реальными роботами: Isaac Gym / Isaac Sim, MuJoCo, PyBullet, Habitat, Unity/Unreal‑симуляции.
Будет большим плюсом
- Опыт разработки на C++ для low-level robotics
- Знакомство с мультимодальными моделями: CLIP, Flamingo‑подобные архитектуры, VLA‑подходы.
Условия
- Комфортный современный офис рядом с м. Кутузовская
- Гибридный формат работы
- Ежегодный пересмотр зарплаты. Годовая премия
- Корпоративный спортзал и зоны отдыха
- Более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
- Программа адаптации и помощь руководителя на старте
- Расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
- Гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ
- Бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
- Вознаграждение за рекомендацию друзей в команду Сбера.
11 Февраля
Бизнес-аналитик (middle)( Смарт Горизонт )
Москва
Компания "Смарт Горизонт" Смарт Горизонт - Российская компания, центр разработки и поддержки инновационных платформ. Мы реализуем как...
14 Февраля
Middle+/Senior Business Development Manager / Менеджер по развитию бизнеса
Москва
Компания "Тулидс" Мы — агентство нового мобильного маркетинга 2LEADS. С 2016 года мы меняем на рынке индустрию performance-маркетинга для...
19 Февраля
Middle+ / Senior Bitrix разработчик
Москва
от 100 000 до 160 000 руб.
Компания "Линсофтверпродакшн" «Lean Software Production» — глобальная ИТ-компания , которая занимается созданием ПО и формированием выделенных...
17 Февраля
Senior Data Engineer / Старший инженер данных( «UZUM TECHNOLOGIES». )
Москва
Компания "«UZUM TECHNOLOGIES»." Чем предстоит заниматься: Участвовать в построении Lake House с единой точкой входа для ad-hoc запросов...
19 Февраля
Менеджер по работе с объектами (Sales Engineer)
Москва
Компания "ТехноНИКОЛЬ" В компании «ТехноНИКОЛЬ» - крупнейшем в Европе производителе и поставщике кровельных, гидроизоляционных и...
Вакансия размещена в отрасли