Data Scientist( SberAutoTech )

28 Марта

Партнерские Вакансии

Город:

Москва

Занятость:

Полная занятость

Компания "SberAutoTech"

Мы создаем технологии автономного вождения. У нас накоплены петабайты данных с проездов, которые нужно превратить в полезный датасет для обучения. Твоя задача — не просто сидеть в Jupyter, а провести анализ и реализовать пайплайны для тегирования сложных дорожных ситуаций.

Чем предстоит заниматься:

  • Разработка пайплайнов и эвристик: разработка пайплайнов с использованием методов математической статистики, ML/DL, CV, LLM/VLM и программирования (Python, SQL) для тегирования данных;
  • Пайплайны обработки данных: Оборачивание разработанных алгоритмов обработки в воспроизводимые пайплайны для массовой обработки исторических и новых данных (Dagster);
  • Работа с данными: Организация эффективного чтения/записи результатов в S3, версионирование экспериментов и датасетов через ClearML.

Что мы ждем от кандидата:

Python & ML Core & CV:

  • Отличное знание Python, PyTorch;
  • База по Computer Vision (детектирование, сегментация, трекинг объектов).

Работа с данными:

  • Опыт обработки больших объёмов данных: pandas, numpy, Scikit-learn, XGBoost, SQL или аналоги;
  • Опыт использования библиотек визуализации (Matplotlib, Seaborn);
  • Умение работать с Docker.

Инструментарий:

  • Опыт работы с системами трекинга экспериментов (ClearML / MLFlow);
  • Опыт работы с оркестраторами: Dagster;
  • JupyterHub, как среда для прототипирования.

Будет плюсом:

  • ML: Понимание архитектур трансформеров и опыт работы с LLM / VLM (CLIP, LLaVA, GPT-4V API или open-source аналоги);
  • Опыт в Autonomous Driving: Понимание сенсорики (Lidar, Radar, Camera) и специфики данных (rosbag, pcap и т.д.);
  • Data Engineering: Опыт работы с Spark для препроцессинга данных, ClickHouse/Metabase для поиска и записи данных.
Похожие вакансии

25 Марта

Владелец продукта (Data / BI / DWH)

Москва

Компания "МАГНИТ, Розничная сеть" Мы ищем владельца продукта, который будет отвечать за развитие data-продукта (BI/DWH), формирование его...

Отправить резюме подробнее

25 Марта

Senior Data Scientist в Хаб Юридических Лиц( Альфа-Банк )

Москва

Компания "Альфа-Банк" Обязанности: Главное направление работы Хаба ЮЛ в Альфа-банке – покрытие модельными решениями всех процессов работы с...

Отправить резюме подробнее

25 Марта

Стажер Data Engineer( Tele2 )

Москва

Компания "Tele2" Что нужно делать: Поддерживать процессы для продуктовых команд. Принимать участие в разработке продуктов на основе...

Отправить резюме подробнее

25 Марта

Middle Data Scientist( Adviva )

Москва

Компания "Adviva" Обязанности Создание, внедрение и поддержка существующих моделей для персонализации различных аспектов продукта...

Отправить резюме подробнее

25 Марта

Стажёр - Data Engineer, группа продуктов товародвижения, Ozon Tech

Москва

Компания "Ozon" Тебе предстоит: Автоматизировать процессы извлечения, преобразования и загрузки данных из различных источников;...

Отправить резюме подробнее

Вакансия размещена в отрасли

Информационные технологии / IT / Интернет: