Middle RL Engineer (SberAI)

16 Января

Партнерские Вакансии

Город:

Москва

Занятость:

Полная занятость

Компания "Сбербанк"

Мы в Сбере запускаем новый проект - Embodied AI. Наша цель - стать центром компетенций по использованию новых модальностей при обучении роботов и VLA, упростить сбор подобных данных, а также разработать собственную модель, способную эффективно работать с самыми разными модальностями, включая запахи и прикосновения.

Обязанности

  • Проектировать и реализовывать RL‑и имитационные пайплайны для роботов и VLA‑агентов: постановка задач, выбор алгоритмов, дизайн наград, оценка политики
  • Разрабатывать и поддерживать инфраструктуру обучения: симуляторы, сценарии, генерация мультимодальных данных (визуальные, сенсорные, тактильные), интеграция с существующими дата‑платформами Сбера
  • Адаптировать и дорабатывать state‑of‑the‑art алгоритмы и архитектуры (off‑policy/on‑policy RL, offline RL, imitation learning, VLA‑модели) под конкретные задачи роботов и виртуальных агентов.

Требования

  • 2+ года опыта в ML/RL, из них не менее года с фокусом на RL, робототехнику или сложные sequential‑decision задачи
  • Уверенное владение математическим аппаратом: математический анализ, линейная алгебра, теория вероятностей
  • Продвинутые знания Python и PyTorch: реализация кастомных датасэмплеров и функций потерь
  • Понимание принципов Distibuted training
  • Глубокое понимание RL: on‑policy/off‑policy, value‑based vs policy‑gradient, entropy regularization, replay buffers, exploration, credit assignment.
  • Практика с распространенными алгоритмами (PPO, SAC, TD3, DQN‑семейство, BC, GAIL и др.), умение адаптировать их под нестандартные среды
  • Опыт работы с симуляторами и/или реальными роботами: Isaac Gym / Isaac Sim, MuJoCo, PyBullet, Habitat, Unity/Unreal‑симуляции.

Будет большим плюсом

  • Опыт разработки на C++ для low-level robotics
  • Знакомство с мультимодальными моделями: CLIP, Flamingo‑подобные архитектуры, VLA‑подходы.

Условия

  • Комфортный современный офис рядом с м. Кутузовская
  • Гибридный формат работы
  • Ежегодный пересмотр зарплаты. Годовая премия
  • Корпоративный спортзал и зоны отдыха
  • Более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
  • Программа адаптации и помощь руководителя на старте
  • Расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
  • Гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ
  • Бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
  • Вознаграждение за рекомендацию друзей в команду Сбера.
Похожие вакансии

07 Января

Senior Computer Vision Engineer (команда Kandinsky3D)

Москва

Компания "Сбербанк" Мы ищем увлеченного исследователя-инженера, которому интересно 3D направление машинного обучения. Вы будете заниматься...

Отправить резюме подробнее

04 Января

Middle/Senior Data Scientist (Time series)( Сбербанк )

Москва

Компания "Сбербанк" Команда ценообразования для Кредитов ЮЛ. Проекты: Индивидуальные модели эластичности клиентов к ставке по вкладам (...

Отправить резюме подробнее

04 Января

Senior ML Engineer

Москва

Компания "Сбербанк" Мы - команда Intelligent Search, создаем поисковый сервис, который отвечает на запросы пользователей на естественном языке....

Отправить резюме подробнее

04 Января

Middle/Senior LLM Engineer (Intelligent Content)

Москва

Компания "Сбербанк" Наша команда занимается задачами, связанными с извлечением информации из н естр уктурированного контента: документов,...

Отправить резюме подробнее

05 Января

Middle+/Senior AI python-разработчик (команда Сo-pilot)( Сбербанк )

Москва

Компания "Сбербанк" Команда создает AI-системы на основе GigaChat, которые улучшат рабочий процесс клиентских менеджеров и повысят качество...

Отправить резюме подробнее

Вакансия размещена в отрасли

Банки / Инвестиции / Лизинг: