RL+NLP Разработчик

27 Марта

от 160 000 до 200 000 руб.

Партнерские Вакансии

Город:

Москва

Занятость:

Полная занятость

Компания "МФТИ ГУ"

Обязанности:
  • Разработка и исследование методов асинхронного обучения с подкреплением для улучшения качества reasoning-моделей
  • Эволюция подходов на основе SAC и PPO/GRPO для устойчивого обучения в условиях задержек между стратегиями, устаревших траекторий и разреженных вознаграждений
  • Создание прототипов и проведение экспериментов по curriculum learning для ускорения освоения сложных математических и программных задач
  • Анализ влияния low-bit представлений (FP8, INT8) на устойчивость и качество обучения
  • Разработка исследовательских пайплайнов и участие в создании фреймворка для асинхронного обучения больших моделей
  • Поддержка рабочего кода, регулярная валидация результатов, проведение сравнительных экспериментов.
Требования:
  • Обязательное наличие оконченного высшего технического образования
  • Уверенные знания статистики, дискретных структур, теории алгоритмов, аналитической геометрии
  • Уверенное владение языком Python, а также опыт работы с фреймворком PyTorch
  • Навыки разработки под Linux (Ubuntu) и опыт использование Docker в реальных проектах
  • Опыт применения RL для обучения языковых или reasoning-моделей
  • Понимание архитектуры и механизмов обучения больших языковых моделей
  • Свободное владение техническим английским языком.
Условия:
  • работа в ведущем техническом вузе страны, в городе Долгопрудный (рядом со станцией Новодачная МЦД-1 или 15 минут от метро Алтуфьево, Ховрино, Физтех);
  • оформление в соответствии с ТК РФ;
  • возможность бесплатного посещения бассейна и тренажерного зала;
  • в соответствии с ТК РФ работники сферы образования обязаны предоставить справку о наличии (отсутствии) судимости и (или) факта уголовного преследования, срок изготовления которой может быть до 30 дней, просим заранее позаботиться о её получении.
Похожие вакансии

22 Марта

Технолог-разработчик (хлебобулочные изделия)

Москва

Компания "Х5 Поддержка бизнеса" Мы являемся динамичной и инновационной компанией, которая стремится к успеху и лидерству в своей отрасли....

Отправить резюме подробнее

24 Марта

Разработчик сервиса агрегации LTE (General Components)

Москва

Компания "SberAutoTech" О команде: Софт автономного автомобиля - это большое число сложно взаимодействующих компонентов, ограниченных...

Отправить резюме подробнее

25 Марта

Консультант-Разработчик 1С: Зарплата и управление персоналом (ЗУП КОРП 3.1)

Москва

Компания "Алкогольный холдинг «Руст»" Мы ищем опытного разработчика 1С для поддержки и развития ключевой системы учета кадров и расчета зарплаты...

Отправить резюме подробнее

26 Марта

Python-разработчик (фитнес-клуб)

Москва

от 80 000 руб.

Компания "Поколение" Мы — современный фитнес-клуб, который активно растёт и внедряет цифровые технологии для своих клиентов и команды. Наша...

Отправить резюме подробнее

25 Марта

IOS Разработчик/developer

Москва

Компания "СБЕРКОРУС" СберТаргет - сервис для размещения рекламы в интернете без опыта и специальных знаний. Ориентирован на микро и малый...

Отправить резюме подробнее

Вакансия размещена в отрасли

Информационные технологии / IT / Интернет: