Data Scientist NLP Middle/Middle+( Лаборатория Наносемантика )
09 Октября 2024
от 180 000 руб.
Город:
Москва
Занятость:
Полная занятость
Компания "Лаборатория Наносемантика"
«Наносемантика» — ведущий разработчик технологий искусственного интеллекта.
Мы являемся крупнейшим игроком российского рынка ИИ-решений.
Наши компетенции: нейронные сети, голосовые роботы и системы анализа больших данных.
Мы разрабатываем гибридные решения, использующие как нейросетевые архитектуры, так и классические алгоритмы машинного обучения и анализа данных.
В свою дружную команду мы приглашаем специалиста Data Scientist NLP (уровня Middle/Middle+):
Чем предстоит заниматься:
- -Разработкой и внедрением решений на основе трансформеров для задач типа Text Classification, Token Classification, Text Generation и классических алгоритмов машинного обучения;
- Регулярным код-ревью 1–2 джунов и ситуационным наставничеством;
- Развертыванием моделей машинного обучения в виде сервисов с использованием FastAPI, Docker и инструментов Model Serving;
- Презентацией промежуточных результатов коллегам и заказчикам;
- Поиском решений инженерных и исследовательских задач в ходе проектов;
- Построением и отладкой пайплайнов извлечения и предобработки данных, обучения и инференса моделей;
- Выполнением необходимых интеграций с внешними сервисами;
- Разбором статей и реализацией архитектур нейронных сетей, функций потерь и оптимизаторов.
Мы ожидаем:
- Опыт работы: 2+ лет;
- Подтвержденный опыт решения задач NLP;
- Культура организации воспроизводимых экспериментов;
- Свободное владение Python 3 и навык писать читаемый код;
- Практический опыт работы с FastAPI, Docker, Git;
- Уверенное понимание процессов развертывания моделей;
- Отличные коммуникативные навыки и умение работать в команде;
- Хорошая математическая база и алгоритмы;
- Опыт работы с PyTorch (также плюсом будет TensorFlow/Keras);
- Понимание работы механизма внимания, энкодеров/декодеров, sequence2sequence моделей и хорошее представление о нейросетевых архитектурах BERT, GPT, T5;
- Понимание и опыт практического применения алгоритмов машинного обучения (sklearn, xgboost и пр.);
- Базовые навыки работы с библиотеками для обработки текстов (nltk, pymystem, pymorphy, spacy, natasha);
- Опыт автоматизации обучения моделей с помощью Apache Airflow.
Будет плюсом:
- Опыт работы с индустриальными системами аннотирования данных и сопровождения группы разметки;
- Опыт использования Explainable AI на табличных и текстовых данных;
- Подкованность в русскоязычных датасетах, знание их особенностей и недостатков;
- Опыт квантизации моделей;
- GitLab CI/CD и k8s;
- Участие в соревнованиях по машинному обучению.
Мы предлагаем: - Профессиональный рост и развитие через обучение и поддержку со стороны команды;
- Возможность работать с высококвалифицированными специалистами;
- Возможность осваивать новые технологии и повышать уровень своих навыков;
- Адекватное руководство, отсутствие бюрократии;
- Оформление по ТК РФ с первого рабочего дня;
- Полностью официальная заработная плата: оклад по результатам собеседования;
- ДМС для сотрудников (включая бизнес стоматологию);
- Испытательный срок - 3 месяца;
- Соблюдение норм ТК РФ.
Что ждёт интересного:
- Молодой коллектив, интересная и динамичная работа;
- Возможность получения льгот (компания имеет it-аккредитацию);
- Возможности для профессионального и карьерного роста;
- Возможность посещения профильных мероприятий - конференции и прохождение курсов, необходимые сотруднику для развития.
Зарегистрируйтесь или войдите, чтобы открыть контакты работодателя
Прикрепите резюме для отклика
Уже с нами?
Войдите, чтобы отправить резюме
05 Октября
Data Engineering & Data Architecture Manager (DWH Manager) / Руководитель разработки и архитектуры
Москва
Компания "АстраЗенека" Компания «АстраЗенека» верит в потенциал своих сотрудников и стремится развивать их скрытые таланты. Станьте частью...
05 Октября
Middle-разработчик (C/C++) для БПЛА
Москва
от 150 000 руб.
Компания "СКИФ-Проект" ITSpace — компания, специализирующаяся на обеспечении квалифицированными кадрами любым удобным способом для заказчика и...
08 Октября
Middle System analyst [CRM Siebel]
Москва
Компания "МТС" МТС Digital – единый центр технологического развития экосистемы МТС. У нас работает больше 8000 сотрудников по 18 направлениям...
10 Октября
Chief Data Officer / CDO в online кинотеатр KION( МТС )
Москва
Компания "МТС" KION — онлайн-кинотеатр, которым пользуются миллионы людей на разных устройствах (смартфоны, планшеты, ПК, Smart TV, приставки,...
06 Октября
Java-разработчик (middle)+react
Москва
Компания "Colvir Software Solutions" Чем будешь заниматься: Разработкой и поддержкой веб-приложения Таsk Tracker на базе Java и ReactJS;...
Вакансия размещена в отрасли