ML-инженер( НТЦ Вулкан )

15 Марта

Партнерские Вакансии

Город:

Москва

Занятость:

Полная занятость

Компания "НТЦ Вулкан"

Обязанности:
  • разработка приложений с использованием LLM (агентные и RAG системы, системы обработки текстов);
  • разработка способов оценивания качества работы LLM приложений;
  • оптимизация инференса;
  • построение web-интерфейсов для MVP и PoC.

Стек:

  • разработка: Python 3.10+, FastAPI (+ сопутствующие инструменты), Docker;
  • базовый инструментарий: PyTorch, инструменты экосистемы HuggingFace, pandas, scikit-learn, matplotlib;.
  • языковые модели: энкодерные и декодерные языковые модели, инференс на vLLM, transformers, Llama.cpp (+ollama);
  • хранилища: Elasticsearch, mongo, pgvecto-rs, HellixDB;
  • интерфейсы: streamlit, gradio;
  • MLOps: DVC.
Требования:
  • уверенное знание Python;
  • знание основ работы с Linux (shell, файловая система, процессы);
  • математическая подготовка: математическая статистика (оценка параметров, их характеристики, доверительные интервалы, бутстрап), основы машинного обучения (регрессоры, классификаторы, деревья, метрики, EDA);
  • базовое понимание работы LLM: понимание архитектуры, работа с внутренним состоянием, понимание принципов инференса (KV кэш, стратегии декодирования, структурированный вывод);
  • опыт построения языковых моделей: SFT, DPO + RL, LoRA, контрастное обучение, метрики качества;
  • опыт работы с RAG системами: понимание принципов функционирования, опыт участие в разработке;
  • агентные системы: понимание архитектур и их проблем;
  • способы замера качества LLM-приложений: метрики поиска данных, LLM-as-a-judge, сбор и разметка данных для специализированных бенчмарков, принципы работы общих бенчмарков.

Будет плюсом:

  • опыт проектирования RAG и агентных систем, наличие опыта работы с LLM фреймворками, такими как Flowise, n8n (low code) или LlamaIndex, Langchain, CrewAI (python);
  • опыт работы в других областях ML, таких как обработка аудио (TTS, STT, атрибуция), работа с изображениями (детекция объектов с Yolo, подготовка и разметка датасетов в CVAT), работа с мультимодальными LLM;
  • опыт в оптимизации инференса: квантизация, дистиляция, использование эффективных фреймворков (TRT, SGLang), спекулятивный декодинг, continuous batching.
Похожие вакансии

16 Марта

Ведущий инженер-технолог( Спектрум, Группа компаний )

Москва

Компания "Спектрум, Группа компаний" Группа компаний «Спектрум» — динамичная инжиниринговая компания, предлагающая технологичные решения для...

Отправить резюме подробнее

16 Марта

Старший инженер-технолог (радиоэлектронной аппаратуры)( НПО Прибор )

Москва

от 122 000 до 148 000 руб.

Компания "НПО Прибор" Обязанности: Проверка КД изделий РЭА на технологичность, разработка ТД сборки и монтажа РЭА в САПР ТП Вертикаль,...

Отправить резюме подробнее

16 Марта

Инженер по автоматизации тестирования (авто + ручное)

Москва

Компания "Performance Lab (Перфоманс Лаб)" Перфоманс Лаб — эксперт в области тестирования и обеспечения качества с 2008 года. Мы тестируем...

Отправить резюме подробнее

16 Марта

Инженер по тестированию С#

Москва

Компания "Performance Lab (Перфоманс Лаб)" Приветствуем тебя, дорогой соискатель! Перфоманс Лаб – эксперт в области тестирования и...

Отправить резюме подробнее

16 Марта

Data Scientist / ML-инженер

Москва

Компания "Федеральная сеть книжных магазинов Читай-город" Читай-технологии - аккредитованная IT-компания. Мы делаем самую технологичную сеть...

Отправить резюме подробнее

Вакансия размещена в отрасли

Информационные технологии / IT / Интернет: