ML Engineer (LLM, AI Agents)

01 Апреля

Партнерские Вакансии

Город:

Москва

Занятость:

Полная занятость

Компания "Excdev"


Стек проекта
Бэкенд:
Python, FastAPI, SQLAlchemy, asyncpg, PostgreSQL, Alembic
ML / AI:
GUI-OWL (UI-TARS), GPT-5-mini, Claude (Anthropic Computer Use API), vLLM, OpenAI-совместимые API
Агенты:
собственные CUA-пайплайны (GUI-Owl, UI-TARS agent loop, Anthropic computer-use)
Инфраструктура:
Docker, Docker Compose, S3 (логи и скриншоты), VNC, управление виртуальными машинами через Docker API

Обязанности:
  • Развивать и оптимизировать CUA-агентов: повышать accuracy прохождения сценариев, уменьшать количество шагов, улучшать обработку edge-кейсов (капчи, нестандартные UI, динамический контент).

  • Проектировать и внедрять новые агентные пайплайны (multi-agent, judge-based архитектуры).

  • Работать с vision-language моделями (UI-TARS, Claude Vision): подбор, fine-tuning, prompt engineering, оценка качества.

  • Интегрировать и деплоить LLM-сервисы (vLLM, OpenAI API, Anthropic API), оптимизировать инференс (tensor parallelism, batching).

  • Участвовать в масштабировании системы: увеличение количества одновременно обрабатываемых задач, параллелизация задач, управление ресурсами виртуальных машин.

  • Работать с данными: парсинг, структурирование результатов, интеграция с PostgreSQL и S3.


Требования:

Обязательно:
  • Опыт работы с LLM в продакшн-окружении (prompt engineering, function calling, structured output).

  • Опыт построения AI-агентов (LangChain / LangGraph / ReAct / Tools).

  • Понимание архитектуры и принципов работы CUA / GUI-агентов (Anthropic Computer Use, UI-TARS или аналоги).

  • Уверенное владение Python (asyncio, FastAPI или аналогичные фреймворки).

  • Опыт работы с Docker (сборка образов, docker-compose, управление контейнерами).

  • Умение читать и воспроизводить результаты ML-research (статьи, бенчмарки, open-source модели).

Будет плюсом:

  • Опыт деплоя и оптимизации LLM-инференса (vLLM, TGI, tensor parallelism).

  • Опыт fine-tuning vision-language моделей.

  • Знакомство с multi-agent системами и оркестрацией агентов.

  • Опыт работы с Anthropic API (в т.ч. Computer Use).

  • Понимание веб-автоматизации (Selenium, Playwright, pyautogui).

  • Опыт работы с PostgreSQL, SQLAlchemy, Alembic.

Условия:
  • Работа над R&D-проектом в области AI-агентов и LLM-систем.

  • Современный стек: Python, LLM-сервисы, vision-language модели, агентные архитектуры.

  • Возможность работать с передовыми решениями в области Computer Use Agents.

  • Удаленный формат работы ​​​​​​​из любого города или страны
  • График работы 5/2
  • Отпуск - 28 календарных дней.
Похожие вакансии

22 Марта

Full-stack QA Engineer( Альфа Капитал )

Москва

Компания "Альфа Капитал" Привет! Мы работаем на рынке инвестиций и занимаемся доверительным управлением. Входим в ТОП-5, в цифрах это: 1,5...

Отправить резюме подробнее

23 Марта

QA - engineer (ММБ)

Москва

Компания "СберЛизинг" СберЛизинг – лизинговая компания экосистемы Сбера, один из лидеров рынка России. Наша команда создаёт технологичные...

Отправить резюме подробнее

24 Марта

Разработчик инфраструктуры ML в Яндекс Плюс

Москва

Компания "Яндекс" Яндекс Плюс — это единая подписка на сервисы Яндекса, которая даёт доступ к музыке, фильмам, подкастам, книгам, играм,...

Отправить резюме подробнее

24 Марта

Инженер по управляемым базам данных (Managed Database Engineer)

Москва

Компания "Яндекс" Команда Yandex Cloud непрерывно расширяет количество доступных сервисов и совершенствует свои продукты. Одновременно...

Отправить резюме подробнее

24 Марта

Middle ML-инженер в персонализацию CRM-коммуникаций

Москва

Компания "Яндекс" Яндекс Маркет — маркетплейс, который помогает пользователям находить и выбирать персонально релевантные товары. Мы уже...

Отправить резюме подробнее

Вакансия размещена в отрасли

Информационные технологии / IT / Интернет: