DevOps Engineer (+LLMOps/GPU)

10 Марта

от 280 000 до 450 000 руб.

Партнерские Вакансии

Город:

Москва

Занятость:

Полная занятость

Компания "Шарненкова Кристина Вячеславовна"

Привет! Мы — belkin.digital, консалтинг и разработка в области GenAI и AI-агентов. Наша команда разрабатывает AI-стратегии, строит агентов для автоматизации бизнес-процессов и обучает компании работать с ИИ. Сейчас мы в поиске DevOps Engineer (LLMOps/GPU). Тебе предстоит управлять инфраструктурой для LLM-проектов — GPU-кластерами и inference-серверами. А также обеспечивать надёжные, безопасные и экономичные операции для GenAI-приложений.

Работаем по методологии VibeEvolve: рутину берут на себя ИИ-агенты, а команда выступает архитекторами — проектирует процессы и управляет их работой. Это не будущее, которое мы планируем — это то, что строим прямо сейчас, и ищем тех, кто хочет быть частью этого.

Чем предстоит заниматься:

  • Проектировать и управлять GPU-инфраструктурой для LLM
  • Настраивать и поддерживать CI/CD пайплайны
  • Управлять контейнеризацией и оркестрацией (Docker, Kubernetes с GPU)
  • Деплоить и масштабировать LLM inference (vLLM, TGI, Triton)
  • Настраивать мониторинг, алертинг и логирование LLM-сервисов
  • Оптимизировать GPU-утилизацию и затраты
  • Обеспечивать security hardening и комплаенс
Мы ждем от тебя:
  • Опыт 3+ года DevOps/SRE
  • Знание российских облачных платформ (Yandex Cloud, VK Cloud, SberCloud) или on-premise (VMware, OpenStack, Proxmox)
  • Владение Infrastructure as Code (Terraform, Ansible)
  • Владение Docker и Kubernetes (с поддержкой GPU)
  • Знание CI/CD инструментов (GitLab CI, GitHub Actions)
  • Владение Prometheus, Grafana, ELK
  • Уверенное администрирование Linux
  • Опыт управления GPU-инфраструктурой (NVIDIA, CUDA, GPU scheduling)
  • Уверенную работа в Cursor / Claude Code с использованием AI-агентов

Будет плюсом:

  • Знание LLMOps-инструментов: vLLM, Text Generation Inference (TGI), Triton Inference Server
  • Опыт работы с model serving и autoscaling
  • Навыки оптимизации inference (batching, quantization)
  • Понимание FinOps для GPU-инфраструктуры
Похожие вакансии

03 Марта

Senior MLOps Engineer( WILDBERRIES )

Москва

Компания "WILDBERRIES" Мы — ML команда финансовых продуктов Wildberries. Создаем масштабные end-to-end ML решения и развиваем высоконагруженную...

Отправить резюме подробнее

03 Марта

AQA Engineer (автоматизация, TypeScript/JavaScript)

Москва

Компания "ITFB Group" ITFB —российская аккредитованная IT компания. У нас более 100 клиентов, занимающих лидирующие позиции в своих отраслях,...

Отправить резюме подробнее

03 Марта

Data Engineer/Дата-инженер

Москва

Компания "ZOLLA" Компания Zolla – крупная федеральная сеть магазинов мужской и женской одежды в связи с расширением отдела ищет себе в...

Отправить резюме подробнее

03 Марта

Senior Data Engineer

Москва

Компания "TUI Russia & CIS" Чем предстоит заниматься: Настройка инфраструктуры Разработка первых пайплайнов для интеграции с источниками...

Отправить резюме подробнее

04 Марта

QA Engineer (Manual + Automation, KYC / ID Verification / Biometrics)

Москва

Компания "Сальникова Ксения Григорьевна" B2B-платформа для KYC/IDV с продакшен-трафиком: document verification, OCR/KIE, biometric verification...

Отправить резюме подробнее

Вакансия размещена в отрасли

Информационные технологии / IT / Интернет: