ML-engineer (Search Alignment)

08 Ноября

Партнерские Вакансии

Город:

Москва

Занятость:

Полная занятость

Компания "Сбербанк"

Мы - команда ML-инженеров GigaChat Data. Наша команда готовит данные для обучения всей линейки моделей LLM GigaChat (GigaChat, GigaChat Vision, GigaChat Audio, Giga Embeddings и др.). Мы собираем данные как для базовых моделей, так и для их адаптации под конкретные сценарии:

• сore-модели – базовые модели

• продукты B2C – WEB-версия GigaChat, персонализированные интеллектуальные ассистенты и пр.

• внутренние банковские задачи – автоматизация обработки документов, анализ финансовых данных, поддержка сотрудников и пр.

• внешние заказчики – кастомные решения для корпоративных клиентов, интеграция LLM в бизнес-процессы и пр..

Чем предстоит заниматься

  • внедрение сервиса поиска в работу GigaChat
  • собирать данные для alignment-обучения LLM: Supervised Finetuning (SFT), Reinforcement Learning (DPO, PPO, GRPO и др.)
  • улучшать пайплайны предобработки данных: автоматизация фильтрации, очистки и подготовки для разметки
  • работать в плотной связке с ML-командой: LoRA-finetuning, проверка экспериментальных гипотез, анализ результатов
  • взаимодействовать с командой асессоров/разметчиков: мониторинг качества, корректировка инструкций, настройка разметки (включая SBS/side-by-side)
  • рассчитывать метрики и принимать решения по улучшению качества данных, сравнивая с конкурентами (Perplexity, OpenAI (ChatGPT Search), DeepSeek, YandexGPT (Яндекс Нейро) и пр.)
  • развивать комплекс DeepResearch: создавать глубокие отчёты по пользовательским запросам и бизнес-аналитике.

Для нас важно

  • знание Python и опыт работы с проприетарными и open-source LLM (Llama, Mistral, Qwen, GPT, Anthropic и т. д.)
  • понимание процессов подготовки данных и их использования в больших языковых моделях: сбор, фильтрация, валидация
  • навыки в построении пайплайнов для SFT/RL, настройке LoRA-finetuning и работе над многозадачными проектам.

Мы предлагаем

  • крупнейшее DS&AI community — более 600 DS-специалистов банка
  • дайджест о самых последних разработках в области DS&AI и отчеты с крупнейших конференций мира
  • возможность выбрать удобный формат работы: гибрид или офис
  • комфортный современный офис: ст. м. Кутузовская, пр. Кутузовский, 32
  • ежегодный пересмотр зарплаты, годовая премия
  • корпоративный спортзал и зоны отдыха
  • более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
  • расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
  • ипотека выгоднее до 7% для каждого сотрудника
  • бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
  • вознаграждение за рекомендацию друзей в команду Сбера.
Похожие вакансии

07 Ноября

DS/LLM Engineer (Центр практического ИИ)

Москва

Компания "Сбербанк" Центр практического искусственного интеллекта занимается разработкой и внедрением высокотехнологичных AI-инструментов....

Отправить резюме подробнее

07 Ноября

NLP Engineer (команда GigaChat Pretrain)

Москва

Компания "Сбербанк" Мы в GigaChat делаем core-технологию генеративной языковой модели: она пишет тексты, генерирует изображения, пишет код,...

Отправить резюме подробнее

08 Ноября

Middle Research Engineer (AI Algorithms & Architectures)( Сбербанк )

Москва

Компания "Сбербанк" Мы развиваем мультиагентную систему, которая, как и AlphaEvolve от DeepMind, открывает новые алгоритмы и улучшает...

Отправить резюме подробнее

26 Ноября

ML Engineer (команда Feature Store B2C)

Москва

Компания "Сбербанк" Мы - Команда MLOps B2C – проектируем, разрабатываем, внедряем современные инструменты и практики распределенного машинного...

Отправить резюме подробнее

27 Ноября

SAP BW/4HANA Data Engineer (HR направление) Middle+/Senior

Москва

Компания "Центр Орбита" Группа Компаний Орбита - ведущий разработчик цифровых решений, российская аккредитованная ИТ-компания. Масштабный...

Отправить резюме подробнее

Вакансия размещена в отрасли

Банки / Инвестиции / Лизинг: