ML инженер (LLM Platform Engineer)( Сбербанк )
Город:
Москва
Занятость:
Полная занятость
Компания "Сбербанк"
Наша задача - создать Fabrique агентного роя (ASC AI Fabrique) - систему автоматического самовоспроизводящегося и самосовершенствующегося разработки, которая создает ИИ-агентов для оптимизации различных бизнес-процессов клиентских менеджеров. ASC AI Fabrique представляет собой рой специализированных ИИ-агентов, задача которых - выполнять полный SDLC (жизненный цикл разработки программного обеспечения) для создания других ИИ-агентов.
ASC AI Fabrique — это мета-генеративная фабрика цифровых сотрудников (ИИ-агентов), построенная на парадигме Agentic Swarm Coding. Система способна автономно проектировать, кодировать, тестировать и разворачивать ИИ-агентов по текстовому бизнес-описанию.
Обязанности
- развертывание и оптимизация LLM моделей на multi-GPU установках с tensor/pipeline/data parallelism
- организация MLOps-процессов и системная оценка качества моделей
- обеспечение production latency <2s>95% для инфраструктуры inference
- профилирование и оптимизация использования VRAM (CUDA OOM prevention)
- мониторинг GPU-производительности.
Требования
- Python (asyncio, multiprocessing, typing) Advanced уровня
- Bash/Shell scripting Advanced уровня для автоматизации развертывания
- практический опыт с vLLM, TensorRT-LLM, TGI для serving моделей
- опыт работы с квантизацией (AWQ, GPTQ, GGUF) для снижения требований к VRAM
- знание оптимизаций Flash Attention и Paged Attention
- навыки работы с PyTorch, JAX, ONNX для универсального развертывания
- опыт отладки GPU memory и понимание CUDA (Intermediate C++/CUDA).
Будет плюсом:
- опыт развертывания моделей на multi-GPU
- практика профилирования VRAM usage в production-средах
- опыт работы с моделями 480B+ параметров на кластерах GPU
- знание специфических GPU scheduling инструментов (Volcano, Kueue).
Условия
- комфортный современный офис рядом с м. Кутузовский проспект, формат работы - гибрид (3 дня офис, 2 удаленно)
- корпоративный спортзал и зоны отдыха
- более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
- расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
- бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
- вознаграждение за рекомендацию друзей в команду Сбера.
14 Мая
Инженер / техник по эксплуатации зданий ООО "КТО"
Москва
от 80 000 до 180 000 руб.
Вакансия компании ООО "КТО" Компания занимается комплексно техническим обслуживанием инженерных систем. Обязанности: - Осуществление...
21 Мая
Технический PM / Инженер-координатор проектов (Дмитровская)
Москва, м. Дмитровская
от 180 000 до 230 000 руб.
Мы — инженерная компания ВИАНТЕК. Разрабатываем сложные программно-аппаратные комплексы, системы автоматизации измерений, ПО для работы с...
22 Мая
Павловский Посад
от 100 000 руб.
Вакансия компании ОБЩЕСТВО С ОГРАНИЧЕННОЙ ОТВЕТСТВЕННОСТЬЮ "КОМБИНАТ ПОЖАРНЫХ РУКАВОВ" Наше предприятие занимается изготовлением пожарного...
27 Мая
Инженер по эксплуатации здания ООО "ЛИГА УПРАВЛЕНИЯ"
Химки
от 63 000 руб.
Вакансия компании ООО "ЛИГА УПРАВЛЕНИЯ" Управляющая компания Торгового центра "ЛИГА" г. Химки. Наша деятельность успешно охватывает техническую...
29 Мая
Инженер-конструктор схемотехники (Энергетическая)
Жуковский
от 160 000 руб.
Мы - современное опытное конструкторское бюро. С 2022 года разрабатываем отечественные программно-аппаратные комплексы в сфере FPV, VR/AR/MR, а...
Вакансия размещена в отрасли