Техлид по ИИ-агентам / Lead Agent Engineer (Python/LLM/RAG)
03 Мая 2026
Город:
Москва
Занятость:
Полная занятость
Компания "Техноинтеллект"
Ищем лидера, который строил ИИ-агентов и возьмёт на себя процесс реализации ИИ агентов как своими силами, так и с привлечением команды: агенты + RAG + MCP + интеграции, качество/стоимость, безопасность и наблюдаемость.
Используем low-code/но-код подходы для оркестрации.
Архитектура (фокус роли)
-
E2E-дизайн платформы: графы агентов, маршрутизация моделей, хранение состояния, масштабирование, отказоустойчивость.
-
Проектирование MCP: набор инструментов/политик доступа, границы ответственности, версионирование и повторное использование.
-
API-контракты и версии (агенты, коннекторы), жизненный цикл промтов/агентов (PromptOps), канареечные выпуски и откаты.
-
Observability и SLO: метрики/логи/трейсы, алерты, бюджет latency/стоимости, capacity planning.
-
Безопасность и приватность: доступы (RBAC/ABAC), маскирование PII, аудит операций.
-
Governance знаний: источники, таксономии, свежесть и версионирование базы знаний.
Чем предстоит заниматься
-
Разработка ИИ-агентов: проектирование графов/инструментов, управление диалоговым состоянием, строгие структурированные ответы.
-
RAG-слой: пайплайн знаний (парсинг → чанкинг → эмбеддинги → векторный поиск), настройка top-k и базового reranking.
-
MCP: разработка MCP-серверов/инструментов для безопасного доступа агентов к данным и действиям.
-
Интеграции с CRM с помощью MCP.
-
Качество, стоимость и SLO: метрики (точность/faithfulness, latency p50/p95, стоимость запроса), кэш/дедуп и роутинг по сложности.
-
Гардрейлы: защита от prompt-injection, allow-list инструментов, лимиты контекста, политика «не знаю» + эскалация, валидация JSON перед записью в CRM.
-
Инфра-минимум: контейнеризация (Docker), простая CI/CD, централизованное логирование и метрики.
-
Построение и развитие команды. Прямое участие в формирование команды, управление командой
Требования
-
Опыт построения ИИ-агентов — от 2 лет (любой стек; опыт на low-/no-code платформах желателен).
-
5+ лет серверной разработки на Python (желательно FastAPI/asyncio), уверенный SQL.
-
Практика LLM/RAG: эмбеддинги, retrieval, настройка контекста, few/zero-shot, работа со строгими схемами ответов.
-
Опыт проектирования MCP-инструментов/серверов или аналогичных плагин-/tool-серверов для агентов.
-
Понимание observability (логи/трейсы/метрики), умение держать SLO и бюджет стоимости.
-
Базовая безопасность данных: доступы, приватность, аудит.
Будет плюсом
-
Развёртывание LLM локально (CPU/GPU, контейнеры), настройка инференса и маршрутизации моделей.
-
Опыт с Langflow или аналогичными low-code оркестраторами.
-
Rerank/NER/классификация для разгрузки LLM.
-
Менторинг небольшой команды.
Формат и стек
Удалённо/гибрид — обсуждаемо.
Стек: Python, FastAPI/asyncio, SQL, Docker, CI/CD; LLM/RAG, embeddings, JSON-Schema; MCP; мониторинг (метрики/логи/трейсы).
Зарегистрируйтесь или войдите, чтобы открыть контакты работодателя
Прикрепите резюме для отклика
Уже с нами?
Войдите, чтобы отправить резюме
01 Мая
Руководитель команды разработки (Team Lead Python)( X5 Tech )
Москва
Компания "X5 Tech" X5 Group - лидер офлайн- и онлайн-рынка продуктов питания. Мы у прав ляем портфелем брендов сетевых магазинов «Пятёрочка»,...
01 Мая
Senior ML Engineer/Data Scientist (команда Чековой аналитики)
Москва
Компания "X5 Tech" X5 Group — российская розничная торговая компания, управляющая продуктовыми торговыми сетями «Пятёрочка», «Перекрёсток» и...
28 Апреля
Java TeamLead / Engineering Manager (Uzum Market)
Москва
Компания "«UZUM TECHNOLOGIES»." Чем предстоит заниматься: Формирование стратегии и роадмапа — вы влияете не только на код, но и на бизнес...
30 Апреля
Москва
Компания "Займиго МФК" Кого ищем: Team Lead PHP со знанием golang. Опыт работы: от 4-6-ти лет. Формат работы:...
29 Апреля
Инженер-программист инфраструктуры автопилота (Python)
Москва
Компания "Эвокарго" Evocargo создает транспорт будущего. Мы проектируем, конструируем и собираем автономные электро-грузовики,...
Вакансия размещена в отрасли