RL+NLP Разработчик

05 Января

от 160 000 до 200 000 руб.

Партнерские Вакансии

Город:

Москва

Занятость:

Полная занятость

Компания "МФТИ ГУ"

Обязанности:
  • Разработка и исследование методов асинхронного обучения с подкреплением для улучшения качества reasoning-моделей
  • Эволюция подходов на основе SAC и PPO/GRPO для устойчивого обучения в условиях задержек между стратегиями, устаревших траекторий и разреженных вознаграждений
  • Создание прототипов и проведение экспериментов по curriculum learning для ускорения освоения сложных математических и программных задач
  • Анализ влияния low-bit представлений (FP8, INT8) на устойчивость и качество обучения
  • Разработка исследовательских пайплайнов и участие в создании фреймворка для асинхронного обучения больших моделей
  • Поддержка рабочего кода, регулярная валидация результатов, проведение сравнительных экспериментов.
Требования:
  • Обязательное наличие оконченного высшего технического образования
  • Уверенные знания статистики, дискретных структур, теории алгоритмов, аналитической геометрии
  • Уверенное владение языком Python, а также опыт работы с фреймворком PyTorch
  • Навыки разработки под Linux (Ubuntu) и опыт использование Docker в реальных проектах
  • Опыт применения RL для обучения языковых или reasoning-моделей
  • Понимание архитектуры и механизмов обучения больших языковых моделей
  • Свободное владение техническим английским языком.
Условия:
  • работа в ведущем техническом вузе страны, в городе Долгопрудный (рядом со станцией Новодачная МЦД-1 или 15 минут от метро Алтуфьево, Ховрино, Физтех);
  • оформление в соответствии с ТК РФ;
  • возможность бесплатного посещения бассейна и тренажерного зала;
  • в соответствии с ТК РФ работники сферы образования обязаны предоставить справку о наличии (отсутствии) судимости и (или) факта уголовного преследования, срок изготовления которой может быть до 30 дней, просим заранее позаботиться о её получении.
Похожие вакансии

29 Декабря

Разработчик 1C:ERP, ERPУХ

Москва

Компания "Фармстандарт" Обязанности: Разработка в программных продуктов 1C Разработка интеграций между 1С системами Требования:...

Отправить резюме подробнее

29 Декабря

Fullstack-разработчик (Астра Облако)

Москва

Компания "РусБИТех-Астра" Мы Группа Астра – один из лидеров российской IT-индустрии, ведущий производитель программного обеспечения, в том числе...

Отправить резюме подробнее

30 Декабря

Full-Stack разработчик (проектная работа)

Москва

Компания "MP Rating" Full-Stack разработчик (проектная работа + последующее сотрудничество) О проекте Мы создаём B2B-платформу для...

Отправить резюме подробнее

30 Декабря

Разработчик ЦФТ (Ведущий инженер-программист ЦФТ-Банк, ЦФТ-Ритейл)

Москва

Компания "Азиатско-Тихоокеанский Банк" Азиатско-Тихоокеанский Банк" - опорный банк Дальнего Востока, уверенно растущий в TOP-30 по всем...

Отправить резюме подробнее

30 Декабря

Разработчик RPA (в офис)

Москва

до 150 000 руб.

Компания "Alta Personnel" Обязанности: Участие в интервью с бизнес-пользователями для сбора требований к автоматизации. Помощь в анализе...

Отправить резюме подробнее

Вакансия размещена в отрасли

Информационные технологии / IT / Интернет: