RL+NLP Разработчик

07 Марта

от 160 000 до 200 000 руб.

Партнерские Вакансии

Город:

Москва

Занятость:

Полная занятость

Компания "МФТИ ГУ"

Обязанности:
  • Разработка и исследование методов асинхронного обучения с подкреплением для улучшения качества reasoning-моделей
  • Эволюция подходов на основе SAC и PPO/GRPO для устойчивого обучения в условиях задержек между стратегиями, устаревших траекторий и разреженных вознаграждений
  • Создание прототипов и проведение экспериментов по curriculum learning для ускорения освоения сложных математических и программных задач
  • Анализ влияния low-bit представлений (FP8, INT8) на устойчивость и качество обучения
  • Разработка исследовательских пайплайнов и участие в создании фреймворка для асинхронного обучения больших моделей
  • Поддержка рабочего кода, регулярная валидация результатов, проведение сравнительных экспериментов.
Требования:
  • Обязательное наличие оконченного высшего технического образования
  • Уверенные знания статистики, дискретных структур, теории алгоритмов, аналитической геометрии
  • Уверенное владение языком Python, а также опыт работы с фреймворком PyTorch
  • Навыки разработки под Linux (Ubuntu) и опыт использование Docker в реальных проектах
  • Опыт применения RL для обучения языковых или reasoning-моделей
  • Понимание архитектуры и механизмов обучения больших языковых моделей
  • Свободное владение техническим английским языком.
Условия:
  • работа в ведущем техническом вузе страны, в городе Долгопрудный (рядом со станцией Новодачная МЦД-1 или 15 минут от метро Алтуфьево, Ховрино, Физтех);
  • оформление в соответствии с ТК РФ;
  • возможность бесплатного посещения бассейна и тренажерного зала;
  • в соответствии с ТК РФ работники сферы образования обязаны предоставить справку о наличии (отсутствии) судимости и (или) факта уголовного преследования, срок изготовления которой может быть до 30 дней, просим заранее позаботиться о её получении.
Похожие вакансии

03 Марта

Senior backend разработчик/Team Lead

Москва

Компания "Университет СИНЕРГИЯ" В процессе работы необходимо Лидировать Backend направление разработки Участвовать в реализации...

Отправить резюме подробнее

03 Марта

Ведущий разработчик C++( КОНЦЕРН РТИ СИСТЕМЫ )

Москва

Компания "КОНЦЕРН РТИ СИСТЕМЫ" Обязанности: участие в CustDev под кураторством архитектора систем (оценка технической реализуемости...

Отправить резюме подробнее

03 Марта

Frontend-разработчик (стажёр) в Авито

Москва

Компания "FutureToday" Начни карьеру в компании, продуктами которой пользуются миллионы! Получай знания от наставника, экспертов, поддержку...

Отправить резюме подробнее

03 Марта

Python-разработчик (fullstack)

Москва

Компания "РТ Лабс" РТЛабс создаёт и развивает масштабные цифровые сервисы Госуслуг — портал, мобильные приложения, социально значимые услуги,...

Отправить резюме подробнее

03 Марта

Flutter-разработчик( Finstar Financial Group )

Москва

Компания "Finstar Financial Group" Мы ищем опытного специалиста в команду разработки мобильного приложения финтех-платформы цифрового банкинга....

Отправить резюме подробнее

Вакансия размещена в отрасли

Информационные технологии / IT / Интернет: