RL+NLP Разработчик
06 Июня 2026
от 160 000 до 200 000 руб.
Город:
Москва
Занятость:
Полная занятость
Компания "МФТИ ГУ"
Обязанности:- Разработка и исследование методов асинхронного обучения с подкреплением для улучшения качества reasoning-моделей
- Эволюция подходов на основе SAC и PPO/GRPO для устойчивого обучения в условиях задержек между стратегиями, устаревших траекторий и разреженных вознаграждений
- Создание прототипов и проведение экспериментов по curriculum learning для ускорения освоения сложных математических и программных задач
- Анализ влияния low-bit представлений (FP8, INT8) на устойчивость и качество обучения
- Разработка исследовательских пайплайнов и участие в создании фреймворка для асинхронного обучения больших моделей
- Поддержка рабочего кода, регулярная валидация результатов, проведение сравнительных экспериментов.
- Обязательное наличие оконченного высшего технического образования
- Уверенные знания статистики, дискретных структур, теории алгоритмов, аналитической геометрии
- Уверенное владение языком Python, а также опыт работы с фреймворком PyTorch
- Навыки разработки под Linux (Ubuntu) и опыт использование Docker в реальных проектах
- Опыт применения RL для обучения языковых или reasoning-моделей
- Понимание архитектуры и механизмов обучения больших языковых моделей
- Свободное владение техническим английским языком.
- работа в ведущем техническом вузе страны, в городе Долгопрудный (рядом со станцией Новодачная МЦД-1 или 15 минут от метро Алтуфьево, Ховрино, Физтех);
- оформление в соответствии с ТК РФ;
- возможность бесплатного посещения бассейна и тренажерного зала;
- в соответствии с ТК РФ работники сферы образования обязаны предоставить справку о наличии (отсутствии) судимости и (или) факта уголовного преследования, срок изготовления которой может быть до 30 дней, просим заранее позаботиться о её получении.
Зарегистрируйтесь или войдите, чтобы открыть контакты работодателя
Прикрепите резюме для отклика
Уже с нами?
Войдите, чтобы отправить резюме
30 Мая
Ведущий разработчик Go (senior)
Москва
Компания "HOLODILNIK.RU" Обязанности: Поддержка и разработка нового функционала сайта создание новых интеграций с интернет витринами и...
30 Мая
Москва
Компания "IBS" Мы — команда специалистов по ML и AI, которые создают интеллектуальные решения для кредитования жилой недвижимости. Наш продукт...
30 Мая
Стажёр в команду NLP / RL (GigaChat)
Москва
Компания "Сбербанк" Мы создаём передовую языковую модель, которая умеет писать тексты, генерировать изображения, решать сложные задачи и вести...
30 Мая
LLM-инженер / Разработчик AI Агентов (Команда Школы архитекторов)
Москва
Компания "Сбербанк" Команда Школы архитекторов в поиске эксперта в области LLM для организации полного цикла работы над агентом, предоставляющим...
30 Мая
FullStack Разработчик (С++, Qt)
Москва
Компания "Star-Staff" Ищу FullStack Разработчика (С++, Qt) в компанию, которая разрабатывает и внедряет комплексные системы обеспечения...
Вакансия размещена в отрасли