Data Scientist в области языковых моделей (Junior)
29 Ноября 2024
от 190 000 руб.
Город:
Москва
Занятость:
Полная занятость
Компания "ИНИТИ"
Мы, команда компании «ИНИТИ», предлагаем специалистам по профилю «Data Scientist в области языковых моделей (Junior)» присоединиться к числу своих сотрудников.
Компания состоит в реестре российских аккредитованных IT-компаний, что в числе прочего подразумевает под собой отсрочку от призыва на военную службу, а также льготную ипотеку.
Обязанности:
- Сбор, предобработка и анализ текстовых данных для обучения моделей.
- Помощь в дообучении языковых моделей (LLM) под специфические задачи компании.
- Разработка пайплайнов для подготовки текстовых данных, включая очистку, токенизацию и создание пользовательских токенов.
- Проведение экспериментов с различными моделями и конфигурациями для повышения качества.
- Создание отчетов о результатах экспериментов.
Требования:
- Опыт работы с текстовыми данными, включая предобработку
- Уверенные знания Python, библиотек для работы с данными (pandas, numpy, matplotlib) и библиотек для обработки текста (transformers, Hugging Face).
- Базовые знания методов машинного обучения
- Знания классических и современных методов работы с текстовыми данными (например, TF-IDF, embeddings и т.п.).
- Опыт работы с крупными текстовыми датасетами.
Приветствуется:
- Опыт работы с языковыми моделями GPT, BERT или их аналогами.
- Навыки разработки в распределенных системах обработки данных.
- Знание современных подходов к обучению LLM.
- оформление по ТК
- удаленный режим работы
- график работы (09:00-18:00) (сб, вс - выходные)
- возможно согласование рабочего графика (смещение рабочего дня, перенос рабочего дня на выходной)
- дополнительная неделя отпуска
- испытательный срок 1-3 мес
- начальный уровень з/п определяется, исходя из результатов собеседования
Зарегистрируйтесь или войдите, чтобы открыть контакты работодателя
Прикрепите резюме для отклика
Уже с нами?
Войдите, чтобы отправить резюме
26 Ноября
Москва
Компания "ARK" Наш партнер - крупная FMCG компания открывает позицию Data Analyst Предстоящие задачи: Обязанности: Подготовка...
26 Ноября
Junior Backend разработчик РНР (Laravel)
Москва
Компания "Студия Юрина" Делаем IT входит в ТОП-2 разработчиков ERP и BI - решений в России и СНГ по версии Рейтинга Рунета. Клиентами Делаем...
26 Ноября
Москва
Компания "ГУП Московский социальный регистр" Департамент информационных технологий Москвы создает и развивает цифровые проекты, которые делают...
26 Ноября
Москва
Компания "МЦСТ" Задачи на проекте: Создание собственного deb-дистрибутива под e2k (процессоры семейства Эльбрус); Сборка\отладка...
26 Ноября
Москва
Компания "Ковалев Эрик Рашидович" «100балльный репетитор» — это образовательная платформа, где мы готовим учеников к успешной сдаче экзаменов...
Вакансия размещена в отрасли