ML-engineer (NLP, LLM) (мидл уровень)
Город:
Москва
Занятость:
Полная занятость
Компания "Клауд Солюшенс"
Cloud X — ИТ-компания, предоставляющая услуги облачных вычислений на базе собственной инфраструктуры: облачной платформы CX Platform и гипермасштабируемых центров обработки данных CX Data Centers с нулевым углеродным следом. Компания предлагает более 40 сервисов, предоставляемых по моделям IaaS, PaaS и SaaS, среди которых: базовая инфраструктура, ИИ, машинное обучение, интеграционные сервисы, Интернет вещей, большие данные, сетевые функции и кибербезопасность. Облако Cloud X внесено в реестр отечественного программного обеспечения Министерства цифрового развития, связи и массовых коммуникаций Российской Федерации. Инвестором компании выступает En+ Group.
Приглашаем middle Deep Learning NLP/LLM инженера. Проект — AI-платформа уровня Vertex AI/Azure AI: сервисы инференса, пайплайны, RAG-системы и прикладные ассистенты.
Стек: Python3.10+, Docker, Linux, Pytorch, Transformers, LangChain, FastAPI
Вам предстоит участвовать в исследованиях и разработке решений на базе современных языковых моделей: от подготовки данных и дообучения моделей, до внедрения в продукт вместе с backend-командой.
Обязанности:
- анализ научных материалов и воспроизведение ключевых результатов; проверка гипотез
- подготовка и обработка данных
- дообучение и настройка LLM/transformer-моделей под прикладные задачи (SFT, LoRA/QLoRA, prompt engineering), построение и валидация ключевых элементов RAG-систем
- Построение и поддержка обучающих/инференсных пайплайнов
- Профилирование и оптимизация инференса моделей: пакетная обработка, кеширование
- Интеграция моделей и пайплайнов в backend-сервисы (API, очереди, хранилища), контейнеризация (Docker) и базовая эксплуатация (CI/CD)
- Документирование решений и результатов экспериментов; поддержка воспроизводимости
- Оконченное высшее образование в области информатики/математики/программной инженерии или смежных дисциплин (или эквивалентный практический опыт)
- Коммерческий опыт в ML/NLP 3 или более лет,
- Опыт обучения и дообучения языковых моделей, в том числе с применением методов обучения с подкреплением, включая современные методы оптимизации (PPO, GRPO)
- Уверенный Python; практический опыт PyTorch (желательно) и/или TensorFlow
- Практический опыт работы с transformer-моделями и библиотеками экосистемы (Hugging Face Transformers, tokenizers и т.п.)
- Опыт построения RAG/agentic-пайплайнов (LangChain, LlamaIndex или аналоги)
- Навыки подготовки данных и оценки качества моделей: метрики, валидация, анализ ошибок
- Понимание современных подходов к LLM и прикладным системам: RAG, embeddings, reranking, инструменты дообучения (adapters/LoRA/QloRA)
- Опыт интеграции ML-моделей в приложения: REST/gRPC API (или аналог), работа с логированием/метриками
- Базовое понимание инфраструктуры: Docker, основы Kubernetes, CI/CD; понимание взаимодействия с Kafka/Redis/PostgreSQL будет плюсом
- Умение работать в команде, принимать обратную связь, самостоятельно доводить задачи до результата
Преимуществом будет:
- Опыт и/или понимание подходов RAG на графах знаний: извлечение сущностей и связей, построение/обновление графа, multi-hop поиск и формирование контекста на основе подграфов
- Базовый опыт распределенного обучения (DDP/DeepSpeed/FSDP) или оптимизации под GPU (AMP, gradient checkpointing)
- Опыт в смежных задачах: CV, ASR, мультимодальные модели
- Реализация проектов федерального масштаба (Облако и сеть облачных дата-центров, которым нет аналогов в России) в составе крупного международного промышленного холдинга En+.
- Оформление в штат, IT-аккредитация.
- Офис в 10-15 минутах пешком от м.Ул 1905 г, бизнес-квартал "Трехгорная мануфактура"
- Гибридный график работы (3 дня офис/2 дома), гибкое начало дня (с 8.00-10.30)
- "Белая" рыночная зп (зависит от опыта) и годовой бонус.
- Широкий соц. пакет: ДМС после испытательного срока (с возможностью включения членов семьи), компенсация питания, обучение на профильных курсах за счет компании, корпоративный английский язык, корпоративный университет холдинга, скидки BestBenefits.
- Материальная помощь по случаю важных событий в жизни.
- Performance review, индивидуальные планы развития.
- У нас нет жесткого дресс-кода.
- Отсутствие бюрократии, быстрое принятие решений.
15 Мая
Москва
Компания "Лаборатория Касперского" О нас: Мы ищем опытного DevOps Engineer'а в проект платформы противодействия комплексным угрозам и...
14 Мая
Специалист по безопасной разработке приложений (Application security engineer)
Москва
Компания "SberTech" SberTech приглашает в свою команду Application Security Эксперта/специалиста в отдел безопасности разработки...
15 Мая
Senior DevOps engineer( Positive Technologies )
Москва
Компания "Positive Technologies" Кто мы Positive Technologies — вендор продуктов и услуг в области кибербезопасности. Более 20 лет наша...
20 Мая
Ведущий ML-разработчик, Computer Vision
Москва
Компания "КНС ГРУПП" О продукте: Наш продукт — это симбиоз высоких технологий: AI-модели и компьютерное зрение, статистика и...
22 Мая
Москва
Компания "UserGate" О нас 24 часа в сутки мы детектируем атаки и с максимальной скоростью разрабатываем и публикуем рекомендации по защите...
Вакансия размещена в отрасли