Python разработчик платформы DWH Маркета( Яндекс )
Город:
Москва
Занятость:
Полная занятость
Компания "Яндекс"
Яндекс Маркет — один из крупнейших мультикатегорийных маркетплейсов, которым ежедневно пользуются миллионы людей. Наши команды помогают покупателям приобретать товары не выходя из дома и получать заказы по всей стране, а партнёрам — развивать свой бизнес, повышая продажи и привлекая новых клиентов.
Команда платформы хранилища и аналитики разрабатывает инструменты для поставки, обработки и анализа больших данных. Наши пользователи — инженеры данных и аналитики. Технологически ядро хранилища построено на системах хранения данных YTsaurus, СlickHouse. Процессы ETL мы разрабатываем на собственном фреймворке Яндекса.
Наше хранилище — одно из самых крупных в России (порядка 35 петабайт), а с учётом темпов роста бизнеса оно будет самым крупным. Высокие требования по надёжности хранилища ставят перед нашей командой далеко не тривиальные задачи, для которых нет готовых решений.
Какие задачи вас ждут
Построение систем поставки данных
Вы будете строить отказоустойчивые и масштабируемые системы поставки данных, способные обрабатывать терабайты в сутки.
Работа с технологиями
Вам предстоит внедрять LLM для улучшения эффективности разработки хранилища и анализа, развивать фреймворк поставки и обработки данных, чтобы экономить время инженера данных, а также упрощать стек для аналитиков.
Повышение эффективности
Вам нужно будет повышать эффективность платформы, используя новые подходы и технологии: потоковую аналитику, поставку real-time и новые способы агрегации данных.
Мы ждём, что вы
- Работали бэкенд-разработчиком с интеграциями и нагрузкой
- Уверенно знаете Python, можете написать собственный фреймворк
- Имеете опыт работы с заказчиками (сбор требований, ведение проектов)
Будет плюсом, если вы
- Разрабатывали на С++, Java
- Пользовались хотя бы одним MPP-хранилищем (Greenplum, ClickHouse, Vertica, Teradata и т. д.)
- Взаимодействовали с LLM, знаете, что такое Agent, MCP
- Знаете слои DWH, модели хранения данных, процессы ETL
- Знакомы с основными структурами данных и алгоритмами (особенно для работы с большими данными)
- Понимаете принципы работы хотя бы одной технологии распределённой обработки данных (Spark, Spark Streaming, Flink, MapReduce, ClickHouse, Greenplum)
- Отлично знаете PostgreSQL с точки зрения разработчика
18 Ноября
Lead Frontend разработчик (Typescript+React)
Москва
Компания "LADA Цифра" LADA Цифра - уникальный микс талантливых людей, которые приняли вызов создать цифровое будущее в автомобильной индустрии....
18 Ноября
Разработчик С# (Middle)( Правительство Москвы )
Москва
Компания "Правительство Москвы" Работа в Правительстве Москвы — это возможность делать наш город современнее и удобнее. Если ты тоже...
18 Ноября
Москва
Компания "X5foodtech" Технологии с которыми работаем: классический ML (xbeat, PyTorch и т.д.), time-series. Чем предстоит заниматься:...
18 Ноября
Frontend-разработчик (React)( SDT LLC )
Москва
от 170 000 до 230 000 руб.
Компания "SDT LLC" Просим обратить внимание: техническое интервью проводится в очной форме! Чем предстоит заниматься: Разработкой...
18 Ноября
Backend-разработчик( ФЛАУВАУ )
Москва
Компания "ФЛАУВАУ" Привет! Я Ира, тимлид команды доставки товаров в Flowwow. Мы занимаемся всеми задачами в рамках направления — от небольших...
Вакансия размещена в отрасли