ML-инженер( НТЦ Вулкан )
15 Марта 2026
Город:
Москва
Занятость:
Полная занятость
Компания "НТЦ Вулкан"
Обязанности:- разработка приложений с использованием LLM (агентные и RAG системы, системы обработки текстов);
- разработка способов оценивания качества работы LLM приложений;
- оптимизация инференса;
- построение web-интерфейсов для MVP и PoC.
Стек:
- разработка: Python 3.10+, FastAPI (+ сопутствующие инструменты), Docker;
- базовый инструментарий: PyTorch, инструменты экосистемы HuggingFace, pandas, scikit-learn, matplotlib;.
- языковые модели: энкодерные и декодерные языковые модели, инференс на vLLM, transformers, Llama.cpp (+ollama);
- хранилища: Elasticsearch, mongo, pgvecto-rs, HellixDB;
- интерфейсы: streamlit, gradio;
- MLOps: DVC.
- уверенное знание Python;
- знание основ работы с Linux (shell, файловая система, процессы);
- математическая подготовка: математическая статистика (оценка параметров, их характеристики, доверительные интервалы, бутстрап), основы машинного обучения (регрессоры, классификаторы, деревья, метрики, EDA);
- базовое понимание работы LLM: понимание архитектуры, работа с внутренним состоянием, понимание принципов инференса (KV кэш, стратегии декодирования, структурированный вывод);
- опыт построения языковых моделей: SFT, DPO + RL, LoRA, контрастное обучение, метрики качества;
- опыт работы с RAG системами: понимание принципов функционирования, опыт участие в разработке;
- агентные системы: понимание архитектур и их проблем;
- способы замера качества LLM-приложений: метрики поиска данных, LLM-as-a-judge, сбор и разметка данных для специализированных бенчмарков, принципы работы общих бенчмарков.
Будет плюсом:
- опыт проектирования RAG и агентных систем, наличие опыта работы с LLM фреймворками, такими как Flowise, n8n (low code) или LlamaIndex, Langchain, CrewAI (python);
- опыт работы в других областях ML, таких как обработка аудио (TTS, STT, атрибуция), работа с изображениями (детекция объектов с Yolo, подготовка и разметка датасетов в CVAT), работа с мультимодальными LLM;
- опыт в оптимизации инференса: квантизация, дистиляция, использование эффективных фреймворков (TRT, SGLang), спекулятивный декодинг, continuous batching.
Зарегистрируйтесь или войдите, чтобы открыть контакты работодателя
Прикрепите резюме для отклика
Уже с нами?
Войдите, чтобы отправить резюме
16 Марта
Ведущий инженер-технолог( Спектрум, Группа компаний )
Москва
Компания "Спектрум, Группа компаний" Группа компаний «Спектрум» — динамичная инжиниринговая компания, предлагающая технологичные решения для...
16 Марта
Старший инженер-технолог (радиоэлектронной аппаратуры)( НПО Прибор )
Москва
от 122 000 до 148 000 руб.
Компания "НПО Прибор" Обязанности: Проверка КД изделий РЭА на технологичность, разработка ТД сборки и монтажа РЭА в САПР ТП Вертикаль,...
16 Марта
Инженер по автоматизации тестирования (авто + ручное)
Москва
Компания "Performance Lab (Перфоманс Лаб)" Перфоманс Лаб — эксперт в области тестирования и обеспечения качества с 2008 года. Мы тестируем...
16 Марта
Москва
Компания "Performance Lab (Перфоманс Лаб)" Приветствуем тебя, дорогой соискатель! Перфоманс Лаб – эксперт в области тестирования и...
16 Марта
Москва
Компания "Федеральная сеть книжных магазинов Читай-город" Читай-технологии - аккредитованная IT-компания. Мы делаем самую технологичную сеть...
Вакансия размещена в отрасли