Data engineer DWH в Маркет
11 Января 2026
Город:
Москва
Занятость:
Полная занятость
Компания "Яндекс"
Яндекс Маркет — один из крупнейших мультикатегорийных маркетплейсов, которым ежедневно пользуются миллионы людей. Наши команды помогают покупателям приобретать товары не выходя из дома и получать заказы по всей стране, а партнёрам — развивать свой бизнес, повышая продажи и привлекая новых клиентов.
Мы команда инженеров данных, и продукт нашей команды — Data WareHouse (хранилище данных), которое мы строим для нужд бизнес-подразделений. Нашими пользователями являются как руководители Маркета, которым нужна отчётность для принятия решений, так и эксперты в области глубокого анализа данных. Можно утверждать, что все бизнес-подразделения Маркета являются потребителями поставляемых нами данных.
Технологически ядро хранилища построено на системах хранения данных YTsaurus и СlickHouse. Разработка процессов ETL идёт на собственном фреймворке, который создан внутри Яндекса.
Наше хранилище данных сейчас одно из самых крупных в России — порядка 30 петабайт — и с учётом темпов роста бизнеса оно будет самым большим. Стоит отметить, что к нему предъявляются высокие требования по надёжности, что ставит перед нашей командой далеко не тривиальные задачи, для которых нет готовых решений.
Какие задачи вас ждут
- вести разработку ETL-процессов поставки данных;
- выявлять неэффективность в существующих процессах и оптимизировать их;
- проектировать структуру хранения данных;
- участвовать в развитии фреймворка поставки данных;
- погружаться в данные одной из прикладных бизнес-областей и становиться в них экспертом;
- сопровождать разработанные процессы ETL.
Мы ждём, что вы
- уверенно знаете Python на уровне написания собственного фреймворка и SQL на уровне оптимизации запросов;
- знаете основные алгоритмы и структуры данных, особенно используемые в области работы с большими данными.
Будет плюсом, если вы
- проектировали DWH: слои, модели хранения данных, процессы ETL;
- понимаете принципы работы хотя бы одной технологии распределенной обработки данных: Hadoop, ClickHouse;
- имеете опыт промышленной разработки на одном из языков высокого уровня: Java или C++;
- умеете работать в командной строке систем Unix-like: Linux, macOS.
Зарегистрируйтесь или войдите, чтобы открыть контакты работодателя
Прикрепите резюме для отклика
Уже с нами?
Войдите, чтобы отправить резюме
29 Декабря
DevOps Engineer / Site Reliability Engineer (SRE)
Москва
Компания "Kameleoon" О нас Мы - международная IT-компания с офисами в Париже, США и Германии. Наш продукт - платформа для персонализации и...
29 Декабря
Москва
Компания "MIXIT" Бренд MIXIT - российская косметическая компания, концепт истинной красоты, экспертизы и инноваций. Мы разрабатываем только...
14 Декабря
Data Engineer (Корпоративное хранилище данных)
Москва
от 300 000 до 400 000 руб.
Компания "Финансовый Дом «Солид»" Обязанности: Разработка, запуск и поддержка ETL/ELT-пайплайнов с использованием Apache Airflow: загрузка...
14 Декабря
Москва
Компания "Градус" Обязанности: Проектирование, разработка и поддержка ETL/ELT-процессов для сбора, трансформации и загрузки данных из...
14 Декабря
Automation QA Engineer (Mobile)
Москва
Компания "SSP SOFTWARE" Привет! Мы ищем в команду Automation QA Engineer Mobile (Senior ) на проект в сфере ритейл. ⠀ Ищем специалиста...
Вакансия размещена в отрасли