DevOps Engineer (+LLMOps/GPU) (в архиве)

24 Апреля

от 280 000 до 450 000 руб.

Партнерские Вакансии

Город:

Москва

Занятость:

Полная занятость

Компания "Шарненкова Кристина Вячеславовна"

Привет! Мы — belkin.digital, консалтинг и разработка в области GenAI и AI-агентов. Наша команда разрабатывает AI-стратегии, строит агентов для автоматизации бизнес-процессов и обучает компании работать с ИИ. Сейчас мы в поиске DevOps Engineer (LLMOps/GPU). Тебе предстоит управлять инфраструктурой для LLM-проектов — GPU-кластерами и inference-серверами. А также обеспечивать надёжные, безопасные и экономичные операции для GenAI-приложений.

Работаем по методологии VibeEvolve: рутину берут на себя ИИ-агенты, а команда выступает архитекторами — проектирует процессы и управляет их работой. Это не будущее, которое мы планируем — это то, что строим прямо сейчас, и ищем тех, кто хочет быть частью этого.

Чем предстоит заниматься:

  • Проектировать и управлять GPU-инфраструктурой для LLM
  • Настраивать и поддерживать CI/CD пайплайны
  • Управлять контейнеризацией и оркестрацией (Docker, Kubernetes с GPU)
  • Деплоить и масштабировать LLM inference (vLLM, TGI, Triton)
  • Настраивать мониторинг, алертинг и логирование LLM-сервисов
  • Оптимизировать GPU-утилизацию и затраты
  • Обеспечивать security hardening и комплаенс
Мы ждем от тебя:
  • Опыт 3+ года DevOps/SRE
  • Знание российских облачных платформ (Yandex Cloud, VK Cloud, SberCloud) или on-premise (VMware, OpenStack, Proxmox)
  • Владение Infrastructure as Code (Terraform, Ansible)
  • Владение Docker и Kubernetes (с поддержкой GPU)
  • Знание CI/CD инструментов (GitLab CI, GitHub Actions)
  • Владение Prometheus, Grafana, ELK
  • Уверенное администрирование Linux
  • Опыт управления GPU-инфраструктурой (NVIDIA, CUDA, GPU scheduling)
  • Уверенную работа в Cursor / Claude Code с использованием AI-агентов

Будет плюсом:

  • Знание LLMOps-инструментов: vLLM, Text Generation Inference (TGI), Triton Inference Server
  • Опыт работы с model serving и autoscaling
  • Навыки оптимизации inference (batching, quantization)
  • Понимание FinOps для GPU-инфраструктуры
Похожие вакансии

30 Мая

MLOps Engineer/DevOps-инженер

Москва

Компания "Aston" Aston — аккредитованная аутсорсинговая IT-компания, работающая с 2007 года. Наш штат насчитывает 2500+ специалистов. Мы...

Отправить резюме подробнее

30 Мая

DevOps инженер (стажер)

Москва

от 70 000 руб.

Компания "Aston" Кто сказал, что нужен опыт? Мы ценим твой потенциал! Мы — российская аккредитованная ИТ-компания, обладатель премии...

Отправить резюме подробнее

30 Мая

Data Engineer (BI & DWH)

Москва

Компания "Сбербанк" Мы — команда, отвечающая за риск-отчётность для топ-менеджмента банка. Мы не просто строим отчёты, а создаём техническую...

Отправить резюме подробнее

30 Мая

Deep Learning Engineer

Москва

Компания "KTS" Привет! Мы IT-компания KTS , которая делает B2B-продукты для крупных компаний: — автоматизируем сложные бизнес-процессы —...

Отправить резюме подробнее

30 Мая

SRE Engineer (Security Operation Center)( UserGate )

Москва

Компания "UserGate" О нас 24 часа в сутки мы детектируем атаки и с максимальной скоростью разрабатываем и публикуем рекомендации по защите...

Отправить резюме подробнее

Вакансия размещена в отрасли

Информационные технологии / IT / Интернет: