AI Engineer( ФосАгро )
11 Декабря 2025
Город:
Москва
Занятость:
Полная занятость
Компания "ФосАгро"
Обязанности:- Разработка production NLP/LLM-решений: поиск, классификация, извлечение, суммаризация, Q&A/ассистенты.
- Проектирование агентских и неагентских LLM-пайплайнов: tool/function calling, маршрутизация, контракты инструментов, обработка ошибок, управление контекстом/состоянием.
- Реализация knowledge Q&A / RAG: подготовка данных, индекс/поиск, эмбеддинги, reranking, grounding/цитирование, контроль качества.
- Интеграция в корпоративную среду: сервисы и API, внутренние API/БД, очереди/воркеры, фоновые задачи.
- Эксплуатация и улучшение: логи/метрики/трейсы, диагностика, регрессии качества/производительности.
- Оптимизация инференса: latency/throughput, лимиты/контекст, кэширование/батчинг, квантование.
- Опционально: адаптация под домен (PEFT/LoRA/QLoRA) с оценкой
- Образование: высшее техническое / ИТ.
- Опыт: 3–5 лет разработки и поддержки production-сервисов в области NLP/LLM.
- LLM в проде: понимание токенизации/контекста и ограничений, типовых failure-modes; понимание, когда уместна адаптация модели (PEFT/LoRA/QLoRA) и как оценивать влияние на качество/производительность.
- RAG / knowledge Q&A: практический опыт построения решений на базе корпоративных данных: эмбеддинги, retrieval (векторный/гибридный), reranking, grounding/цитирование, контроль качества.
- Инструменты LLM: HuggingFace + LangChain/LlamaIndex (или аналоги); опыт построения agentic/non-agentic пайплайнов с tool/function calling (контракты инструментов, устойчивость вызовов).
- Backend и интеграции: сильный Python; сервисы и API (FastAPI или аналоги), очереди/воркеры/фоновые задачи, интеграции с внутренними системами; тесты и сопровождение.
- Production/observability: логи/метрики/трейсы (Grafana/Prometheus или аналоги), диагностика инцидентов и деградаций качества/производительности.
- Инфраструктура: Linux/CLI; Kubernetes на уровне чтения манифестов/логов и участия в диагностике.
Будет Плюсом:
- Langfuse или аналоги (on-prem): трассировка/метрики/eval.
- LiteLLM или аналоги: gateway/router, маршрутизация, лимиты.
- OpenWebUI или аналоги: интеграция с retrieval/RAG и логированием.
- Workflow orchestration: Temporal / Airflow / Prefect / Dagster / Argo; принципы идемпотентности, ретраев/таймаутов, зависимостей шагов, long-running процессов, сигналов/HITL, наблюдаемости выполнения.
- MCP (Model Context Protocol): подключение инструментов по протоколу, контракт инструментов, безопасность/изоляция, наблюдаемость вызовов.
- Self-hosted inference/serving: vLLM / TGI / Triton или аналоги; оптимизации GPU-инференса.
- Удалённый формат работы
- Официальное оформление по ТкРФ, белая ЗП по результатам технического собеседования;
- График работы 5/2 с 8:30 до 17:30 по Москве;
- Премии за эффективную работу и достижение результатов;
- Различные программы обучения для прокачки профессиональных скиллов;
- ДМС программа
Зарегистрируйтесь или войдите, чтобы открыть контакты работодателя
Прикрепите резюме для отклика
Уже с нами?
Войдите, чтобы отправить резюме
25 Декабря
Senior/Staff Java Engineer в Uzum Market (Старший Разработчик)
Москва
Компания "«UZUM TECHNOLOGIES»." Чем предстоит заниматься: Придумывать и реализовывать архитектурные решения: вы предлагаете технические...
25 Декабря
QA Automation Engineer( Aston )
Москва
Компания "Aston" Aston — аккредитованная аутсорсинговая IT-компания, работающая с 2007 года. Наш штат насчитывает 3400+ специалистов. Мы...
26 Декабря
Data Engineer Middle( Альфа-Банк )
Москва
Компания "Альфа-Банк" Обязанности: • Реализация высоконагруженных конвейеров обработки данных для обеспечения надежной и бесперебойной...
26 Декабря
Senior Python Developer (AI Platform)
Москва
Компания "Альфа-Банк" Платформа для проектирования и запуска AI-агентов и LLM-сценариев в контуре банка. Решаем задачи автоматизации...
26 Декабря
Manual QA Engineer ПО( Оксиджен Софтвер )
Москва
Компания "Оксиджен Софтвер" Привет, дорогой соискатель и надеемся, что в скором коллега ;) Наша компания сейчас находится в поисках не только...
Вакансия размещена в отрасли