Middle RL Engineer (SberAI) (в архиве)

10 Февраля

Партнерские Вакансии

Город:

Москва

Занятость:

Полная занятость

Компания "Сбербанк"

Мы в Сбере запускаем новый проект - Embodied AI. Наша цель - стать центром компетенций по использованию новых модальностей при обучении роботов и VLA, упростить сбор подобных данных, а также разработать собственную модель, способную эффективно работать с самыми разными модальностями, включая запахи и прикосновения.

Обязанности

  • Проектировать и реализовывать RL‑и имитационные пайплайны для роботов и VLA‑агентов: постановка задач, выбор алгоритмов, дизайн наград, оценка политики
  • Разрабатывать и поддерживать инфраструктуру обучения: симуляторы, сценарии, генерация мультимодальных данных (визуальные, сенсорные, тактильные), интеграция с существующими дата‑платформами Сбера
  • Адаптировать и дорабатывать state‑of‑the‑art алгоритмы и архитектуры (off‑policy/on‑policy RL, offline RL, imitation learning, VLA‑модели) под конкретные задачи роботов и виртуальных агентов.

Требования

  • 2+ года опыта в ML/RL, из них не менее года с фокусом на RL, робототехнику или сложные sequential‑decision задачи
  • Уверенное владение математическим аппаратом: математический анализ, линейная алгебра, теория вероятностей
  • Продвинутые знания Python и PyTorch: реализация кастомных датасэмплеров и функций потерь
  • Понимание принципов Distibuted training
  • Глубокое понимание RL: on‑policy/off‑policy, value‑based vs policy‑gradient, entropy regularization, replay buffers, exploration, credit assignment.
  • Практика с распространенными алгоритмами (PPO, SAC, TD3, DQN‑семейство, BC, GAIL и др.), умение адаптировать их под нестандартные среды
  • Опыт работы с симуляторами и/или реальными роботами: Isaac Gym / Isaac Sim, MuJoCo, PyBullet, Habitat, Unity/Unreal‑симуляции.

Будет большим плюсом

  • Опыт разработки на C++ для low-level robotics
  • Знакомство с мультимодальными моделями: CLIP, Flamingo‑подобные архитектуры, VLA‑подходы.

Условия

  • Комфортный современный офис рядом с м. Кутузовская
  • Гибридный формат работы
  • Ежегодный пересмотр зарплаты. Годовая премия
  • Корпоративный спортзал и зоны отдыха
  • Более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
  • Программа адаптации и помощь руководителя на старте
  • Расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
  • Гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ
  • Бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
  • Вознаграждение за рекомендацию друзей в команду Сбера.
Похожие вакансии

11 Февраля

Бизнес-аналитик (middle)( Смарт Горизонт )

Москва

Компания "Смарт Горизонт" Смарт Горизонт - Российская компания, центр разработки и поддержки инновационных платформ. Мы реализуем как...

Отправить резюме подробнее

14 Февраля

Middle+/Senior Business Development Manager / Менеджер по развитию бизнеса

Москва

Компания "Тулидс" Мы — агентство нового мобильного маркетинга 2LEADS. С 2016 года мы меняем на рынке индустрию performance-маркетинга для...

Отправить резюме подробнее

19 Февраля

Middle+ / Senior Bitrix разработчик

Москва

от 100 000 до 160 000 руб.

Компания "Линсофтверпродакшн" «Lean Software Production» — глобальная ИТ-компания , которая занимается созданием ПО и формированием выделенных...

Отправить резюме подробнее

17 Февраля

Senior Data Engineer / Старший инженер данных( «UZUM TECHNOLOGIES». )

Москва

Компания "«UZUM TECHNOLOGIES»." Чем предстоит заниматься: Участвовать в построении Lake House с единой точкой входа для ad-hoc запросов...

Отправить резюме подробнее

19 Февраля

Менеджер по работе с объектами (Sales Engineer)

Москва

Компания "ТехноНИКОЛЬ" В компании «ТехноНИКОЛЬ» - крупнейшем в Европе производителе и поставщике кровельных, гидроизоляционных и...

Отправить резюме подробнее

Вакансия размещена в отрасли

Банки / Инвестиции / Лизинг: