RL+NLP Разработчик

11 Июня

от 160 000 до 200 000 руб.

Партнерские Вакансии

Город:

Москва

Занятость:

Полная занятость

Компания "МФТИ ГУ"

Обязанности:
  • Разработка и исследование методов асинхронного обучения с подкреплением для улучшения качества reasoning-моделей
  • Эволюция подходов на основе SAC и PPO/GRPO для устойчивого обучения в условиях задержек между стратегиями, устаревших траекторий и разреженных вознаграждений
  • Создание прототипов и проведение экспериментов по curriculum learning для ускорения освоения сложных математических и программных задач
  • Анализ влияния low-bit представлений (FP8, INT8) на устойчивость и качество обучения
  • Разработка исследовательских пайплайнов и участие в создании фреймворка для асинхронного обучения больших моделей
  • Поддержка рабочего кода, регулярная валидация результатов, проведение сравнительных экспериментов.
Требования:
  • Обязательное наличие оконченного высшего технического образования
  • Уверенные знания статистики, дискретных структур, теории алгоритмов, аналитической геометрии
  • Уверенное владение языком Python, а также опыт работы с фреймворком PyTorch
  • Навыки разработки под Linux (Ubuntu) и опыт использование Docker в реальных проектах
  • Опыт применения RL для обучения языковых или reasoning-моделей
  • Понимание архитектуры и механизмов обучения больших языковых моделей
  • Свободное владение техническим английским языком.
Условия:
  • работа в ведущем техническом вузе страны, в городе Долгопрудный (рядом со станцией Новодачная МЦД-1 или 15 минут от метро Алтуфьево, Ховрино, Физтех);
  • оформление в соответствии с ТК РФ;
  • возможность бесплатного посещения бассейна и тренажерного зала;
  • в соответствии с ТК РФ работники сферы образования обязаны предоставить справку о наличии (отсутствии) судимости и (или) факта уголовного преследования, срок изготовления которой может быть до 30 дней, просим заранее позаботиться о её получении.
Похожие вакансии

30 Мая

Ведущий разработчик Go (senior)

Москва

Компания "HOLODILNIK.RU" Обязанности: Поддержка и разработка нового функционала сайта создание новых интеграций с интернет витринами и...

Отправить резюме подробнее

30 Мая

Python-разработчик

Москва

Компания "IBS" Мы — команда специалистов по ML и AI, которые создают интеллектуальные решения для кредитования жилой недвижимости. Наш продукт...

Отправить резюме подробнее

30 Мая

Стажёр в команду NLP / RL (GigaChat)

Москва

Компания "Сбербанк" Мы создаём передовую языковую модель, которая умеет писать тексты, генерировать изображения, решать сложные задачи и вести...

Отправить резюме подробнее

30 Мая

LLM-инженер / Разработчик AI Агентов (Команда Школы архитекторов)

Москва

Компания "Сбербанк" Команда Школы архитекторов в поиске эксперта в области LLM для организации полного цикла работы над агентом, предоставляющим...

Отправить резюме подробнее

30 Мая

FullStack Разработчик (С++, Qt)

Москва

Компания "Star-Staff" Ищу FullStack Разработчика (С++, Qt) в компанию, которая разрабатывает и внедряет комплексные системы обеспечения...

Отправить резюме подробнее

Вакансия размещена в отрасли

Информационные технологии / IT / Интернет: