Data Intern
03 Января 2026
до 65 000 руб.
Город:
Москва
Занятость:
Полная занятость
Опыт:
Нет опыта
Компания "ТехВилл"
ТехВилл – IT-компания и партнёр ВкусВилл по развитию цифровых решений.
Мы отвечаем за разработку мобильных и web- приложений, автоматизацию бизнес-процессов, искусственный интеллект, devops, инфобез ВкусВилла.
Нашими решениями пользуется свыше 1 000 000 клиентов и сотрудников ВкусВилла.
На данный момент мы ищем Стажера, который будет работать с продуктом «ВкусВилл», в направлении робототехники.Ключевые задачи:
- Сбор датасетов: поиск, подбор и систематизация изображений и видео-потоков с камер наших роботов, включая работу с открытыми источниками и внутренними базами данных.
-
Разметка данных: точная и аккуратная разметка данных для ключевых задач 2D компьютерного зрения.
- Детекция объектов (Object Detection): Обведение объектов (люди, погрузчики, паллеты, коробки) с помощью bounding boxes.
- Семантическая сегментация (Semantic Segmentation).
- Пиксельная разметка областей изображения (проезжая зона, пешеходная зона, препятствия).
- Классификация изображений (Image Classification).
- Присвоение тегов и категорий сценам и объектам.
Контроль качества:
- Проверка и верификация уже размеченных данных на предмет согласованности, полноты и ошибок.
Автоматизация процессов:
- Написание простых скриптов на Python или Shell для автоматизации рутинных задач: переименование файлов, фильтрация изображений, пакетная обработка данных, конвертация форматов аннотаций (JSON, COCO, YOLO).
-
Анализ и очистка данных: выявление и устранение нерелевантных, поврежденных данных и артефактов съемки (блики, размытие) для повышения качества датасетов.
- Ведение документации: описание процесса разметки, создание гайдов и поддержание документации по датасетам в актуальном состоянии.
Наш стек технологий:
-
Языки и инструменты разметки: Python 3.x, Bash (Shell Scripting), CVAT, Label Studio, Roboflow.
- Библиотеки для работы с данными: OpenCV, Pillow (PIL), pandas, numpy.
- Форматы данных: JSON (COCO), YOLO, Pascal VOC.
- Операционная система: Linux (Ubuntu).
Мы ожидаем, что вы:
-
Обучаетесь на старших курсах или выпуск по специальности Компьютерные науки, Прикладная математика, Data Science или смежным направлениям.
- Понимаете основы 2D Computer Vision (что такое изображение, цветовые пространства, фильтры, ключевые задачи: детекция, сегментация).
-
Имеете базовые навыки программирования на Python и готовы развивать их для автоматизации работы с данными.
-
Внимательны к деталям до педантичности и понимаете, что качество данных напрямую влияет на работу робота.
-
Усидчивы и нацелены на результат, готовы к кропотливой, но крайне важной работе.
-
Имеете базовое понимание ОС Linux и работу в командной строке.
-
Умеете работать с системой контроля версий Git.
Будет огромным плюсом:
- Опыт написания скриптов на Python для обработки изображений (с использованием OpenCV, PIL).
-
Знакомство с инструментами для разметки данных, такими как CVAT или Label Studio.
- Понимание форматов аннотаций для компьютерного зрения (JSON/COCO, YOLO).
- Личные учебные проекты, связанные с обработкой изображений или анализом данных.
- Работу в аккредитованной IT-компании.
- Гибрид; На ключевых этапах проекта требуется работа на месте. Ожидается готовность к периодическим визитам.
- Оформление по ученическому договору на 3 месяца, с последующим продлением.
Зарегистрируйтесь или войдите, чтобы открыть контакты работодателя
Прикрепите резюме для отклика
Уже с нами?
Войдите, чтобы отправить резюме
26 Декабря
Стажер в отдел стратегического планирования / Strategy Intern
Москва
Компания "dentsu" Мы — коммуникационная группа Okkam . Наша специализация — услуги в области маркетинга, рекламы и консалтинга. В России мы уже...
27 Декабря
Москва
Компания "Lamoda tech" Мы в поиске Инженера по работе с большими данными в команду дата-инжиниринга, который будет участвовать в ключевых...
28 Декабря
Москва
Компания "WILDBERRIES" Объединённая компания Wildberries и Russ — это международная технологическая компания, образованная в результате...
29 Декабря
Specialist, Data Science, Data Engineering / Инженер данных информационных бизнес-систем
Москва
Компания "Мон’дэлис Русь" Обязанности: Сбор информации по текущим ELT/ETL процессам Проектирование и разработка ELT/ETL процессов...
30 Декабря
Data Engineer (Баланс Продавцов)
Москва
Компания "WILDBERRIES" Объединённая компания Wildberries и Russ — это международная технологическая компания, образованная в результате...
Вакансия размещена в отрасли