ML Engineer (GigaChat Data)

22 Марта

Партнерские Вакансии

Город:

Москва

Занятость:

Полная занятость

Компания "Сбербанк"

Мы — команда ML-инженеров, специализирующаяся на инфраструктуре данных и валидации моделей. Наша команда создает критически важные инструменты для оценки качества моделей, разрабатывает пайплайны обработки данных и фокусируется на генерации высококачественных технических и кодовых данных для обучения моделей.

Наши основные направления:

• Validation & Metrics — инструменты валидации и замера моделей

• Data Engineering — пайплайны чистки и синтеза данных

• Code & Technical Data — генерация кодовых/технических данных

• MLOps — хостинг и использование open source моделей

• Model Training — эксперименты с LoRA и SFT.

Если тебе интересно создавать инфраструктуру для развития LLM и работать с передовыми технологиями в области данных — приходи к нам.

Обязанности

  • разработка инструментов для валидации и замера качества моделей и систем контроля качества данных
  • создание метрик оценки производительности и точности LLM
  • автоматизация процессов тестирования и бенчмаркинга, фильтрации и предобработки
  • построение и оптимизация пайплайнов чистки и синтеза данных
  • генерация высококачественных кодовых и технических датасетов
  • создание синтетических данных для обучения моделей на технических задачах
  • поддержка инфраструктуры для хостинга open source моделей
  • интеграция и использование open source модели в продуктовых решениях
  • обучение LoRA адаптеров для экспериментальных задач
  • проведение SFT обучения в рамках исследований данных
  • анализ результатов экспериментов и интерпретация подходов.

Требования

  • отличное знание Python и опыт работы с ML-библиотеками (LangChain/LangGraph, PyTorch, llm-foundry, verl)
  • опыт работы с LLM (как open source: Llama, Mistral, Qwen, так и проприетарными: GPT, Claude)
  • понимание принципов работы с данными для обучения моделей: сбор, очистка, валидация
  • навыки построения ML пайплайнов и автоматизации процессов
  • понимание процессов, знание подходов к валидации и тестированию моделей машинного обучения
  • понимание основ MLOps и работы с контейнеризацией (Docker).

Будет плюсом:

  • опыт с фреймворками для работы с агентами и RAG
  • знание подходов к fine-tuning (LoRA, QLoRA, SFT)
  • опыт работы с системами версионирования данных и экспериментов (DVC, MLflow, W&B)
  • понимание принципов работы с кодовыми данными и техническими текстами
  • опыт развертывания и мониторинга ML-моделей в production.

Условия

  • крупнейшее DS&AI community — более 600 DS-специалистов банка
  • дайджест о самых последних разработках в области DS&AI и отчеты с крупнейших конференций мира
  • возможность выбрать удобный формат работы: гибрид или офис
  • комфортный современный офис: ст. м. Кутузовская, пр. Кутузовский, 32
  • ежегодный пересмотр зарплаты, годовая премия
  • корпоративный спортзал и зоны отдыха
  • более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
  • расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
  • ипотека выгоднее до 7% для каждого сотрудника
  • бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
  • вознаграждение за рекомендацию друзей в команду Сбера.
Похожие вакансии

25 Марта

Ведущий менеджер по развитию бизнеса (продукт BigData)

Москва

Компания "edna" Мы - аккредитованная IT-компания, ищем Ведущего менеджера по развитию бизнеса на проект MobileScoring. MobileScoring -...

Отправить резюме подробнее

23 Марта

Senior Data Scientist

Москва

Компания "Страховая компания «Сбербанк страхование»" Мы в поиске специалиста по Data Science, который будет внедрять современные ML и AI решений...

Отправить резюме подробнее

24 Марта

Data Engineer в Платформу данных Yandex Cloud

Москва

Компания "Яндекс" Платформа данных — ключевой дифференциатор Yandex Cloud как облачного провайдера в России. Это набор облачных сервисов,...

Отправить резюме подробнее

26 Марта

Data Engineer в Сеть Продаж

Москва

Компания "Сбербанк" Команда Блока «Сеть Продаж» в поиске Дата-инженера. Мы разрабатываем и внедряем end-to-end решения на основе больших...

Отправить резюме подробнее

25 Марта

Аналитик-разработчик (Big Data)

Москва

Компания "Московский метрополитен" Мы ищем талантливого Аналитика-разработчика (Big Data) , который готов столкнуться с непростыми задачами в...

Отправить резюме подробнее

Вакансия размещена в отрасли

Банки / Инвестиции / Лизинг: