Data Scientist (Deep Learning / RecSys)

13 Февраля

Партнерские Вакансии

Город:

Москва

Занятость:

Полная занятость

Компания "Lamoda tech"

Мы в поиске Data Scientist в команду, занимающуюся применением DL подходов в задачах Lamoda. Наша цель – с помощью глубокого обучения научиться понимать стиль, сходство, атрибуты одежды, а также предпочтения миллионов пользователей. Помимо этого мы активно развиваем применения LLM в различных задачах Lamoda от клиентских продуктов до поддержки и умного поиска по внутренним системам.

Чем предстоит заниматься:

  • Улучшение моделей подбора образов (комплектов товаров, complete the look) на основе данных различных модальностей: визуальной сочетаемости по фотографии, атрибутам и текстовому описанию товаров. Генерация образов на основе текстового запроса пользователя.
  • Построение новых кандидатных движков для подбора образов (в том числе с использованием LLM/VLM)
  • Персонализация образов (в т.ч. моделями 2-го уровня) и адаптация моделей подбора образов под гардероб пользователя
  • Построение моделей скоринга и оценка качества подбираемых образов
  • Разработка retrieval алгоритмов в различных задачах: визуальный поиск, поиск релеватного документа, поиск подходящего товара/образа

Мы ожидаем:

  • Опыт работы в ML / Deep Learning от 3 лет
  • Владение Python и умение писать сложные SQL-запросы, опыт работы с Hadoop, Spark, Airflow, Docker
  • Опыт применения Deep Learning в задачах Computer Vision, NLP с фокусом на metric learning;
  • Опыт вывода ML-моделей в прод для решения бизнес-задач
  • Знания математической статистики, теории вероятности, алгоритмов и структур данных
  • Опыт работы с рекомендательными системами (как плюс)

Как мы работаем:

  • Пишем на Python 3.6+ и PySpark 3.0;

  • Для ресерча доступны два сервера (80 cores, 650Gb RAM), на которых развернут JupyrerHub и есть доступ к Hadoop-кластеру;

  • Код с логикой ML-пайплайнов упаковываем в Docker и выкатываем, используя CI/CD-инструменты с запуском code style проверок и тестов;

  • Используем Airflow для управления ML-пайплайнами и запуском их по расписанию;

  • В командах есть культура code review как для изменений по части продакшен-пайплайнов, так и для ресерч-задач;

  • Регулярно проводим командные брейнштормы с целью генерации новых идей по развитию наших data-driven продуктов;

  • В компании внедрена культура принятия решений на основании данных и все изменения тестируем через АБ-эксперименты.

Похожие вакансии

10 Февраля

Стажер Data Engineer

Москва

Компания "Tele2" Что нужно делать: Поддерживать процессы для продуктовых команд. Принимать участие в разработке продуктов на основе...

Отправить резюме подробнее

10 Февраля

Data Scientist( Росгосстрах )

Москва

Компания "Росгосстрах" Мы ищем специалиста, который отвечает за полный цикл жизни AI-решений . От разработки архитектуры и экспериментов до...

Отправить резюме подробнее

10 Февраля

Team Lead (Python\Data)

Москва

Компания "Тинькофф" Мы - команда надежности данных! Мы внедряем практики SRE в данных и помогаем дата-инженерам и аналитикам эффективно работать...

Отправить резюме подробнее

11 Февраля

Data Analyst( Лига Цифровой Экономики )

Москва

Компания "Лига Цифровой Экономики" Проект крупной копании в телеком секторе! Команда проекта создает Automation of Sales B2B - это...

Отправить резюме подробнее

10 Февраля

Data Engineer( Дата Дженерейшн )

Москва

от 250 000 до 300 000 руб.

Компания "Дата Дженерейшн" Обязанности: Выполнение роли разработчика корпоративного аналитического Хранилища данных и роли технического...

Отправить резюме подробнее

Вакансия размещена в отрасли

Информационные технологии / IT / Интернет: