• Войти
Работа в Москве
наверх
Создать резюме
Подбор персонала

Более 150 000 компаний ждут Ваше резюме

Войти Для работодателей
Работа в Москве
наверх
  1. Работа в Москве
  2. ⚫ Инженер ✔
  3. Вакансии в Москве

Стажер NLP Engineer (команда GigaChat Pretrain)

30 Ноября 2025

Сбербанк
Сбербанк

Город:

Москва

Занятость:

Полная занятость

Опыт:

Нет опыта

Откликнуться

Компания "Сбербанк"

Мы в GigaChat делаем core-технологию генеративной языковой модели: она пишет тексты, генерирует изображения, пишет код, отвечает на вопросы и ведёт диалоги.

Прошлой осенью мы выпустили сильную русскоязычную модель GigaChat MAX уровня GPT-4 (метрики — в статье на Habr). Зимой выложили в открытый доступ одну из наших MoE-моделей. И на этом не остановились — двигаемся дальше!

Сейчас у нас фокус в несколько направлений:

1. Исследования и эксперименты

— стабилизация и развитие архитектур (новые виды attention, улучшение тестового стенда изменений)

— методы улучшения обучения (оптимизация, лоссы и режимы вроде FIM/MTP, балансировка MoE)

— скейлинг-законы (для гиперпараметров, качества и стоимости)

— постоянный разбор свежих статей и идей индустрии

2. Инфраструктура и параллельные тренировки

5-D параллелизм, ускорение мультимодальных и гигантских MoE-моделей на больших кластерах.

3. Фреймворк распределённого обучения

Разработка GigaFSDP, эксперименты с FP8/mixed-precision, устойчивость и эффективность обучения на больших масштабах.

4. Низкоуровневые оптимизации

Оптимизация операций на уровне CUDA/triton ядер, улучшение производительности NCCL, профилирование и устранение узких мест.

5. Качество и метрики

Развитие оценки GigaChat: от международных олимпиадных задач до метрик, специфичных для русского языка.

Ищем NLP Engineer, с кем будем делать GigaChat умнее. Для экспериментов у нас — кластер с большим числом A100/H100.

Обязанности

* Доводить качество на русском до уровня ChatGPT и выше.

* Придумывать и проверять идеи, которые дают практический выигрыш.

* Помогать решать задачи внутренних клиентов Сбера — с прицелом на внешних пользователей.

* Следить за индустрией: читать статьи, быстро проверять гипотезы, делиться результатами.

Требования

* Уверенный Python и PyTorch.

* База по алгоритмам и математике (линейная алгебра, оптимизация, вероятности).

* Опыт обучения DL-моделей: от «просто моделей» до больших.

* Теоретическое понимание алгоритмов распределенного обучения.

* Представление о текущем ландшафте LLM и трендах.

Плюсом будет: опыт с распределённым обучением (DDP/FSDP/параллелизмы), CUDA/NCCL/профилирование, MoE/FP8, мультимодальные модели, построение метрик качества.

Даже если у тебя нет опыта с LLM, но ты много занимался NLP исследованиями или инженерными оптимизациями — не стесняйся откликнуться!

Условия

Формат и условия

* Удалённо

* Возможность оформления в акктеритованную IT-компанию.

* Годовая премия по итогам работы до 6 окладов.

* Регулярный пересмотр зарплат.

* Корпоративный спортзал и зоны отдыха.

* Более 400 программ СберУниверситета для роста.

* Программа адаптации и помощь руководителя на старте.

* Крупнейшее DS&AI community – более 600 DS банка, регулярный обмен знаниями, опытом и лучшими практиками, интерактивные лекции и мастер-классы от ведущих ВУЗов и экспертов технологических компаний, дайджест о самых последних разработках в области DS&AI и отчеты с крупнейших конференций мира, регулярные внутренние митапы.

* Расширенный ДМС, льготное страхование для семьи, корпоративная пенсионная программа.

* Ипотека для сотрудников по дисконтной программе.

* СберПрайм+ и скидки у партнёров.

* Бонус за рекомендации в команду.

Открыть контакты работодателя

Зарегистрируйтесь или войдите, чтобы открыть контакты работодателя

Прикрепите резюме для отклика

Загрузите файл с резюме
до 5 Mb .doc, .docx, .pdf

Создать профессиональное резюме

ОТПРАВИТЬ РЕЗЮМЕ

Уже с нами?
Войдите, чтобы отправить резюме

Похожие вакансии

09 Ноября

Стажер-разработчик( Koderline )

Москва

Компания "Koderline" Требования и навыки: Грамотная устная и письменная речь; Умение структурировано и чётко излагать свои мысли;...

Отправить резюме
подробнее

09 Ноября

Senior QA engineer (Java), ритейл

Москва

Компания "AWG" Мы в поиске QA engineer, на проект для крупного ритейлера. Проект направлен на создание отдельной подкоманды в периметре...

Отправить резюме
подробнее

09 Ноября

Стажер в отдел контент-маркетинга

Москва

от 50 000  руб.

Компания "Adlis" Мы – smm агентство, специализирующееся на нише стоматологии - adlis. Главная цель нашей команды - создавать контент...

Отправить резюме
подробнее

09 Ноября

Руководитель команды доходов проекта VK Cloud

Москва

Компания "Mail.ru Group" Портфель VK Tech включает в себя облачную платформу, продуктивити-сервисы, дата-сервисы и бизнес-приложения для...

Отправить резюме
подробнее

09 Ноября

ML-инженер / ML Engineer (с пониманием бэкенда)

Москва

Компания "ВкусВилл" Привет! ВкусВилл развивает внутренние ИИ-сервисы: поиск по базе знаний (RAG), умные ассистенты для сотрудников,...

Отправить резюме
подробнее
Больше похожих вакансий
Подпишитесь на похожие вакансии

Вакансия размещена в отрасли

Информационные технологии / IT / Интернет:
  • Программист / Разработчик,
  • Программист 1С,
  • Web программист / Разработчик
к поиску вакансий
Популярные специализации
  • Другое
  • Менеджер по продажам
  • Менеджер по работе с клиентами
  • Продавец-консультант
  • Продавец-кассир
  • Администратор
Инструменты соискателя
  • Разместить резюме
  • Найти работу
  • Поиск вакансий
  • Каталог вакансий
  • Соглашение по содействию в трудоустройстве
  • Защита персональных данных
  • Архивный каталог
  • Вакансии по профессиям
  • Поиск по городам
Инструменты работодателя
  • Разместить вакансию
  • Найти сотрудника
  • Поиск резюме
  • Каталог резюме
  • Тарифы
  • Информер с вакансиями
  • Резюме по профессиям
Больше всего ищут
  • Бармен
  • Брокер
  • Водитель такси
  • Корреспондент
  • Охранник
  • Переводчик

© 2007 - 2025 «Карьерист.ру»

  • О нас
  • Обратная связь