AI Engineer (LLM)
21 Марта 2026
Город:
Москва
Занятость:
Полная занятость
Компания "Неофлекс"
ОДИН ИЗ ЛУЧШИХ РАБОТОДАТЕЛЕЙ РОССИИ
Мы – Neoflex. Аккредитованная IT компания. За 20 лет работы мы создали 12+ готовых решений для бизнеса, так же занимаемся заказной разработкой программного обеспечения.
Приветствуем на странице нашей компании и благодарим за интерес к вакансии. Будем рады оказаться полезны друг другу.
Мы ищем ведущего инженера, который станет одним из технических лидеров нашей LLM-команды, будет формировать архитектурные решения, выбирать стэк, задавать стандарты разработки и подходы к оценке качества, помогать команде выводить сложные AI-системы в продакшн и развивать их.
Стек проекта: Python, PyTorch, Transformers, LangChain/LangGraph, Milvus/Weaviate/FAISS/etc, ONNX/Triton/TensorRT/vLLM, LangFuse, FastAPI/Flask/Django, REST/gRPC, Airflow/Dagster, Docker, Kubernetes, GitLab CI, SQL.
Чем предстоит заниматься:
• проектированием, разработкой и внедрением решений на основе LLM для различных бизнес-задач (от простых knowledge ботов, до платформ оркестрации агентов);
• взаимодействовать с командами разработки, domain-экспертами и аналитиками;
• обеспечивать качество и надёжность систем: дизайн метрик, создание бенчмарков и regression-тестов, A/B-тесты, мониторинг, guardrails и observability;
• оптимизировать производительность и стоимости инференса;
• курировать R&D-прототипы, участвовать в митапах и хакатонах (по желанию), заниматься менторством коллег и развитие экспертизы команды.
Что мы ждём от вас (must-have):
• 2+ лет коммерческого опыта в AI/ML-инженерии/ backend-разработке, из них 1+ лет в NLP/LLM или GenAI-проектах;
• уверенное владение Python, SQL и Git с глубоким понимание принципов разработки ПО;
• опыт разработки и поддержки REST-сервисов (FastAPI, Flask, Django);
• опыт внедрения в промышленную эксплуатацию решений на базе LLM;
• опыт построения надежных систем оценки качества AI-решений: от подготовки данных до автоматизированных проверок и A/B-экспериментов;
• умение работать с облаками (Yandex Cloud и т.п.) и инфраструктурой для развертывания сервисов (Docker, Kubernetes).
Будет плюсом:
• опыт построения AI-платформ, фреймворков или SDK;
• навыки обучения с нуля, дообучения, оптимизации или кастомизации инференса LLM-моделей;
• опыт работы с мультимодальными и речевыми моделями (VLM, ASR, TTS);
• вклад в open-source, публикации (Q1), выступления на конференциях (A/A+);
• объяснять сложные вещи простым языком для нетехнических стейкхолдеров.
Что ты приобретёшь, присоединившись к нам:
- достойную оплату труда + компенсационные, стимулирующие и мотивационные выплаты, бонусы за участие в реферальной программе;
- работа в команде профессионалов готовых делиться экспертизой;
- официальное трудоустройство по ТК РФ, аккредитация IT, расширенный социальный пакет:
✔️ страховка ДМС (с 3-го месяца работы, стоматология, возможность подключения родственников, теле медицина, полис ВЗР),
✔️ сотрудникам со стажем в Neoflex более 3 месяцев при предоставлении листка нетрудоспособности устанавливается доплата до полного заработка за период болезни,
✔️ обучение детей сотрудников ИТ специальностям,
✔️ компенсация затрат на фитнес и занятия английским языком;
- обеспечиваем техникой для работы (ноутбук, наушники, мышь);
- профессиональное развитие - в Учебном Центре (курсы по работе с большими данными, видео лекции, тренажеры, карьерный коучинг, лекции, тренинги, конференции, участие в митапах);
- возможность пройти проф.сертификацию;
- прозрачную систему карьерного развития Performance Review;
- персонального наставника с первого дня работы;
- насыщенную корпоративную жизнь: яркие корпоративы, праздники для детей сотрудников, корпоративные спортивные мероприятия, мотивационные награждения;
- комфортную атмосферу в филиалах компании в городах: Москва, Санкт-Петербург, Нижний Новгород, Пенза, Воронеж, Саратов, Самара, Краснодар где есть лаунж и фотозоны, вендинги в кухнях, пространство для медитаций и другие секретные места, о которых знают только наши сотрудники.
- удалённый формат работы на территории России.
Здесь мечты превращаются в реальность. Мы будем рады, если ты станешь частью нашей команды! Откликайся ;)
Зарегистрируйтесь или войдите, чтобы открыть контакты работодателя
Прикрепите резюме для отклика
Уже с нами?
Войдите, чтобы отправить резюме
22 Марта
Full-stack QA Engineer( Альфа Капитал )
Москва
Компания "Альфа Капитал" Привет! Мы работаем на рынке инвестиций и занимаемся доверительным управлением. Входим в ТОП-5, в цифрах это: 1,5...
23 Марта
Москва
Компания "СберЛизинг" СберЛизинг – лизинговая компания экосистемы Сбера, один из лидеров рынка России. Наша команда создаёт технологичные...
24 Марта
Инженер по управляемым базам данных (Managed Database Engineer)
Москва
Компания "Яндекс" Команда Yandex Cloud непрерывно расширяет количество доступных сервисов и совершенствует свои продукты. Одновременно...
24 Марта
Разработчик инфраструктуры RL-обучения LLM
Москва
Компания "Яндекс" О вакансии Мы создаём инфраструктуру для обучения и дообучения больших языковых (LLM) и визуально-языковых (VLM) моделей,...
24 Марта
Москва
до 575 000 руб.
Компания "iSpring" Senior Full Stack QA Engineer (с потенциалом тимлида) iSpring — международная продуктовая IT‑компания. Мы создаём...
Вакансия размещена в отрасли