Компания "ГНИВЦ"
it-компания gnivc- партнер государственных компаний и лидеров российского бизнеса, разработчик и системный интегратор крупнейших государственных информационных систем, а также коммерческих решений для налогового мониторинга.
Ищем инженера с практическим опытом, который будет заниматься разработкой и эксплуатацией платформы инференса LLM в промышленной эксплуатации. Роль предполагает активную работу с инфраструктурой, GPU-нагрузкой, API-слоем и оптимизацией производительности моделей.
Основной фокус — стабильный и эффективный инференс, интеграция моделей в сервисы и развитие платформы ИИ в on-prem / изолированном контуре.
задачи:
Разворачивать и поддерживать сервисы инференса моделей (vLLM, llama.cpp, Triton и др.);
Настраивать и оптимизировать инференс LLM (пропускная способность, задержки, батчинг, KV-cache);
Работать с GPU-инфраструктурой (распределение, загрузка, диагностика, профилирование);
Разворачивать и сопровождать сервисы ИИ в Kubernetes (Helm, Stateful workloads, автомасштабирование);
Строить API-слой для моделей (OpenAI-совместимый API, потоковые ответы, маршрутизация);
Интегрировать модели в корпоративные системы через REST/gRPC;
Участвовать в построении RAG-систем (эмбеддинги, поиск, векторные базы данных);
Настраивать мониторинг (метрики, логи, трассировки, алерты);
Диагностировать и устранять проблемы в промышленной эксплуатации (узкие места, деградации, OOM, проблемы GPU);
Оптимизировать использование ресурсов (GPU/CPU/хранилище/сеть);
Работать с CI/CD пайплайнами для деплоя моделей и сервисов;
Плотно взаимодействовать с командой информационной безопасности;
Обеспечивать соблюдение требований и практик информационной безопасности при разработке и эксплуатации систем ИИ;
Разрабатывать и поддерживать документацию;
Взаимодействовать с командами Data Science, Backend и Platform Engineering.
мы от вас ждём:
Будем плюсом:
Стек:
мы предлагаем:
Компенсация больничного листа продолжительностью до 7 дней с сохранением полной оплаты, эквивалентной рабочему дню.
Добровольное медицинское страхование (ДМС) по окончании испытательного срока, с широким перечнем ведущих медицинских учреждений, включая качественную стоматологию.
Возмещение до 50% затрат на занятия спортом.
Профессиональное обучение и сертификация за счет компании.
Организация внутренних и внешних митапов, хакатонов, конференций, семинаров и тренингов.
Партнерские программы по изучению иностранных языков и развитию профессиональных навыков от Skyeng и Skillbox.
Доступ к корпоративной библиотеке на платформе Alpina Digital.
25 Марта
Senior Data Scientist (Data Management Platform)
Москва
Компания "Lamoda tech" Мы в поиске Senior Data Scientist в команду Advertising DMP (Data Management Platform) , который поможет нам...
24 Марта
Руководитель IT проектов B2G (Senior)( Бюджетные и Финансовые Технологии )
Москва
Компания "Бюджетные и Финансовые Технологии" Приглашаем в команду Руководителя IT-проектов на проект: ГИС « Единая централизованная цифровая...
25 Марта
Москва
Компания "Lamoda tech" Мы в поиске Senior Data Scientist в команду, занимающуюся применением DL подходов в задачах Lamoda. Наша цель – с...
22 Марта
Full-stack QA Engineer( Альфа Капитал )
Москва
Компания "Альфа Капитал" Привет! Мы работаем на рынке инвестиций и занимаемся доверительным управлением. Входим в ТОП-5, в цифрах это: 1,5...
25 Марта
Москва
Компания "Тинькофф" Т-Банк — это амбициозные ИТ-проекты и высоконагруженные системы: от мобильного банка и облачного колл-центра до...
Вакансия размещена в отрасли