• Войти
Работа в Москве
наверх
Создать резюме
Подбор персонала

Более 150 000 компаний ждут Ваше резюме

Войти Для работодателей
Работа в Москве
наверх
  1. Работа в Москве
  2. ⚫ Инженер ✔
  3. Вакансии в Москве

Senior MLOps\AI Platform Engineer

29 Марта 2026

ГНИВЦ
ГНИВЦ

Город:

Москва

Занятость:

Полная занятость

Откликнуться

Компания "ГНИВЦ"

it-компания gnivc- партнер государственных компаний и лидеров российского бизнеса, разработчик и системный интегратор крупнейших государственных информационных систем, а также коммерческих решений для налогового мониторинга.

  • Компания входит в ТОП-100 лучших работодателей страны и на 9-м месте в категории «IT-компании» 2025 года по рейтингу работодателей hh среди крупных компаний;
  • Мы в 25% лучших по уровню счастья среди компаний отрасли IT и России 2025 по версии Happy Job;
  • У нас есть ИИ-песочница - среда для экспериментов и реальных проектов на современных опенсорс-больших языковых моделях. Здесь можно применять ИИ для оптимизации своей работы, автоматизации процессов и реализации собственных идей от гипотезы до результата;
  • Являемся аккредитованной ИТ-компанией.

Ищем инженера с практическим опытом, который будет заниматься разработкой и эксплуатацией платформы инференса LLM в промышленной эксплуатации. Роль предполагает активную работу с инфраструктурой, GPU-нагрузкой, API-слоем и оптимизацией производительности моделей.

Основной фокус — стабильный и эффективный инференс, интеграция моделей в сервисы и развитие платформы ИИ в on-prem / изолированном контуре.

задачи:

  • Разворачивать и поддерживать сервисы инференса моделей (vLLM, llama.cpp, Triton и др.);

  • Настраивать и оптимизировать инференс LLM (пропускная способность, задержки, батчинг, KV-cache);

  • Работать с GPU-инфраструктурой (распределение, загрузка, диагностика, профилирование);

  • Разворачивать и сопровождать сервисы ИИ в Kubernetes (Helm, Stateful workloads, автомасштабирование);

  • Строить API-слой для моделей (OpenAI-совместимый API, потоковые ответы, маршрутизация);

  • Интегрировать модели в корпоративные системы через REST/gRPC;

  • Участвовать в построении RAG-систем (эмбеддинги, поиск, векторные базы данных);

  • Настраивать мониторинг (метрики, логи, трассировки, алерты);

  • Диагностировать и устранять проблемы в промышленной эксплуатации (узкие места, деградации, OOM, проблемы GPU);

  • Оптимизировать использование ресурсов (GPU/CPU/хранилище/сеть);

  • Работать с CI/CD пайплайнами для деплоя моделей и сервисов;

  • Плотно взаимодействовать с командой информационной безопасности;

  • Обеспечивать соблюдение требований и практик информационной безопасности при разработке и эксплуатации систем ИИ;

  • Разрабатывать и поддерживать документацию;

  • Взаимодействовать с командами Data Science, Backend и Platform Engineering.

мы от вас ждём:

  • 4+ года опыта в MLOps / DevOps / инфраструктурной разработке;
  • Практический опыт работы с Kubernetes;
  • Опыт работы с GPU (NVIDIA stack, nvidia-smi, CUDA);
  • Опыт запуска и эксплуатации ML/LLM моделей в промышленной эксплуатации;
  • Уверенное владение Python;
  • Понимание принципов работы инференса LLM (токены, контекст, задержки, батчинг);
  • Опыт работы с Linux на уровне диагностики и отладки;
  • Понимание сетевого взаимодействия (HTTP, TLS, прокси, балансировка);
  • Опыт работы с CI/CD;
  • Понимание и соблюдение базовых принципов и «гигиены» информационной безопасности;
  • Умение разбираться в логах и находить первопричины проблем.

Будем плюсом:

  • Опыт с vLLM / GPUStack / Triton / TensorRT-LLM;
  • Опыт работы с LiteLLM или аналогичными прокси/шлюзами;
  • Опыт построения RAG-систем (векторные БД, эмбеддинги);
  • Опыт работы с Milvus / Qdrant / pgvector;
  • Опыт оптимизации инференса (квантизация, параллелизм, шардинг);
  • Опыт работы с высоконагруженными системами;
  • Опыт работы в изолированных (air-gapped) средах;
  • Опыт настройки Prometheus / Grafana для ML-сервисов;
  • Понимание требований регуляторов (152-ФЗ, ГОСТ).

Стек:

  • Инфраструктура: Kubernetes, Docker, Helm;
  • Инференс: vLLM, llama.cpp, Triton, HuggingFace;
  • API / шлюзы: OpenAI-совместимый API, LiteLLM, Envoy / Nginx
  • RAG / данные: векторные БД (Milvus, Qdrant, pgvector), Kafka, S3/MinIO;
  • Мониторинг: Prometheus, Grafana, ELK;
  • CI/CD: GitLab CI/CD, Jenkins, ArgoCD;
  • Инфраструктура как код: Terraform, Ansible;
  • Языки: Python (обязательно), Bash, SQL.

мы предлагаем:

  • Возможность работы в офисе, по гибридному графику или полностью дистанционно на территории РФ;
  • Рабочий график: пятидневная рабочая неделя (Пн. – Чт. с 09:00 до 18:00, Пт. с 09:00 до 16:45);
  • Достойное вознаграждение: конкурентная заработная плата по результатам собеседования, а также премии за эффективную работу и достигнутые результаты;
  • Официальное трудоустройство: полное соблюдение требований ТК РФ, включая оплачиваемые отпуска (с дополнительной выплатой 50% от оклада после 11 месяцев работы в Компании) и выплату заработной платы дважды в месяц;
  • Заботу о здоровье:

Компенсация больничного листа продолжительностью до 7 дней с сохранением полной оплаты, эквивалентной рабочему дню.

Добровольное медицинское страхование (ДМС) по окончании испытательного срока, с широким перечнем ведущих медицинских учреждений, включая качественную стоматологию.

Возмещение до 50% затрат на занятия спортом.

  • Развитие и обучение:

Профессиональное обучение и сертификация за счет компании.

Организация внутренних и внешних митапов, хакатонов, конференций, семинаров и тренингов.

Партнерские программы по изучению иностранных языков и развитию профессиональных навыков от Skyeng и Skillbox.

Доступ к корпоративной библиотеке на платформе Alpina Digital.

  • Дополнительные выходные: возможность взять 5 дополнительных оплачиваемых выходных (ресурсных) дней в течение календарного года (с 1 января до 31 декабря) для сотрудников, проработавших в компании более 11 месяцев.

Открыть контакты работодателя

Зарегистрируйтесь или войдите, чтобы открыть контакты работодателя

Прикрепите резюме для отклика

Загрузите файл с резюме
до 5 Mb .doc, .docx, .pdf

Создать профессиональное резюме

ОТПРАВИТЬ РЕЗЮМЕ

Уже с нами?
Войдите, чтобы отправить резюме

Похожие вакансии

25 Марта

Senior Data Scientist (Data Management Platform)

Москва

Компания "Lamoda tech" Мы в поиске Senior Data Scientist в команду Advertising DMP (Data Management Platform) , который поможет нам...

Отправить резюме
подробнее

24 Марта

QA Manual Mobile Engineer

Москва

Компания "Performance Lab (Перфоманс Лаб)" Приветствуем тебя, дорогой соискатель! :) Перфоманс Лаб – эксперт в области тестирования и...

Отправить резюме
подробнее

24 Марта

Senior Android Developer

Москва

от 500 000  руб.

Компания "Гепард" Ищем Senior Android-разработчика, способного брать на себя ключевые технические решения, проектировать архитектуру мобильного...

Отправить резюме
подробнее

24 Марта

Руководитель IT проектов B2G (Senior)( Бюджетные и Финансовые Технологии )

Москва

Компания "Бюджетные и Финансовые Технологии" Приглашаем в команду Руководителя IT-проектов на проект: ГИС « Единая централизованная цифровая...

Отправить резюме
подробнее

25 Марта

Senior Data Scientist (LLM)

Москва

Компания "Lamoda tech" Мы в поиске Senior Data Scientist в команду, занимающуюся применением DL подходов в задачах Lamoda. Наша цель – с...

Отправить резюме
подробнее
Больше похожих вакансий
Подпишитесь на похожие вакансии

Вакансия размещена в отрасли

Информационные технологии / IT / Интернет:
  • Другое
к поиску вакансий
Популярные специализации
  • Другое
  • Менеджер по продажам
  • Менеджер по работе с клиентами
  • Продавец-консультант
  • Продавец-кассир
  • Администратор
Инструменты соискателя
  • Разместить резюме
  • Найти работу
  • Поиск вакансий
  • Каталог вакансий
  • Соглашение по содействию в трудоустройстве
  • Защита персональных данных
  • Архивный каталог
  • Вакансии по профессиям
  • Поиск по городам
Инструменты работодателя
  • Разместить вакансию
  • Найти сотрудника
  • Поиск резюме
  • Каталог резюме
  • Тарифы
  • Информер с вакансиями
  • Резюме по профессиям
Больше всего ищут
  • Бармен
  • Брокер
  • Водитель такси
  • Корреспондент
  • Охранник
  • Переводчик

© 2007 - 2026 «Карьерист.ру»

  • О нас
  • Обратная связь