Senior Research Engineer (Kandinsky)
11 Февраля 2026
Город:
Москва
Занятость:
Полная занятость
Компания "Сбербанк"
Мы команда исследователей и инженеров, разрабатывающих технологии post-training (SFT, RL) и контролируемой генерации для моделей генерации изображений, видео и омни-модальных. Мы сфокусированы на повышение качества, управляемости и устойчивости генеративных моделей с помощью методов RLHF / RLAIF и инструктивного редактирования. Помимо фундаментальных исследований, мы создаём прикладные решения для B2B-партнёров от системы генерации интерьера до системы генерации персонализированных аватаров.
Обязанности
- проектирование и обучение высокопроизводительных диффузионных моделей (R2V, R2I, R2V+A) для редактирования и генерации видео / изображений
- разработка новых подходов и архитектурных решений для post-training фазы диффузионных моделей: RLHF (PPO, DPO и др.), RLAIF, SFT
- разработка, масштабирование и поддержание RL пайплайнов
- руководство экспериментами: постановка гипотез, разработка протоколов, анализ результатов
- проведение code review, менторинг младших исследователей и инженеров, участие в планировании исследовательской дорожной карты
- взаимодействие с командами Pretraining, Data, Infrastructure, Production для масштаб пайплайнов и повышения стабильности моделей в продакшене
- поддержание и внедрение SOTA-подходов: мониторинг литературы (arxiv, NeurIPS, ICML, CVPR, ICLR), инициирование внутренних исследований.
Требования
- бакалавриат/магистратура по направлению компьютерных наук/прикладной математике/ машинному обучению или близких к ним
- 3+ лет релевантного опыта исследований и разработки в области глубокого обучения/компьютерного зрения/генеративного ИИ
- глубокие знания в Computer Vision и Generative Modeling: Diffusion Models, GANs, VAEs, Flow/Rectified Flow Matching
- опыт работы с современными диффузионными фреймворками (Diffusers) и моделями FLUX, Wan 2.X и др.)
- уверенное владение PyTorch и навыки распределённого обучения (DDP/FSDP)
- понимание и практическое применение RL и RLHF ( PPO/DPO и др.)
- умение проектировать архитектуры, планировать эксперименты и интерпретировать результаты.
Условия
- крупнейшее DS&AI community — более 600 DS-специалистов банка
- дайджест о самых последних разработках в области DS&AI и отчеты с крупнейших конференций мира
- возможность быть соавтором НИРов и статей для международных конференций
- возможность выбрать удобный формат работы: гибрид или офис
- ежегодный пересмотр зарплаты, годовая премия
- корпоративный спортзал и зоны отдыха
- более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
- расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
- ипотека выгоднее до 7% для каждого сотрудника
- бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
- вознаграждение за рекомендацию друзей в команду Сбера.
Зарегистрируйтесь или войдите, чтобы открыть контакты работодателя
Прикрепите резюме для отклика
Уже с нами?
Войдите, чтобы отправить резюме
10 Февраля
Middle+/Senior Java разработчик
Москва
Компания "Сбербанк" Продукт "Цифровое урегулирование задолженности" - это 70+ сервисов. Мы ищем Middle+/Senior Java разработчика. Задачи:...
10 Февраля
Middle QA Engineer (Москва/Якутск)
Москва
Компания "Центр разработки программного обеспечения" Привет! Я Таня, тимлид QA отдела в Драйви. Мы ищем Middle QA инженера в нашу команду....
10 Февраля
Senior Go Developer for Parsers
Москва
Компания "Ostrovok.ru" Команда Parsers занимается всем циклом обработки данных о ценах конкурентов - от задач на парсинг до финальных топиков...
10 Февраля
Москва
Компания "Tele2" Что нужно делать: Поддерживать процессы для продуктовых команд. Принимать участие в разработке продуктов на основе...
10 Февраля
Senior Java Developer( Смартсофт )
Москва
Компания "Смартсофт" Возможно, мы ищем именно вас! Мы разрабатываем решения в сфере e - government. И делаем это профессионально. В нашей...
Вакансия размещена в отрасли