Senior data engineer (команда Data lake)
06 Декабря 2024
Город:
Москва
Занятость:
Полная занятость
Компания "Самокат (ООО Умное пространство)"
В команде Data Engineering уже более 30 профессионалов
Мы создаем хранилища данных и инструменты для их анализа и использования в аналитике, BI, ML. В связи с ростом компании и новыми задачами, мы ищем инженера в группу разработки и развития транспортировки данных. Между собой мы называем команду "Research & development" или просто RnD. Команда занимается исследованием и внедрением новых технологий, созданием инструментов для работы с данными, разрабатывает стандарты. Наш фокус на Data Lake: загрузка данных из источников (API, Kafka, CDC, PostgreSQL, MySQL и другие), трансформация данных в табличный вид, разработка инструментов по транспортировке данных между аналитическими СУБД (Greenplum, ClickHouse) и S3.
Чем будем заниматься:
- развивать существующее CDC-решение на базе Debezium и Spark Streaming: улучшать мониторинг, автоматизировать то, что делается вручную;
- разрабатывать, оптимизировать и мониторить ETL-процессы на основе технологий Airflow, Greenplum, ClickHouse, используя Python и Spark (Scala);
- участвовать в исследованиях и принимать решения по использованию новых инструментов для обработки данных в компании;
- развивать практику использования Trino в компании;
- участвовать в разработке интеграции Trino с каталогом метаданных Datahub.
Мы ждём от кандидата:
- понимание принципов организации хранилищ данных, работы колоночных БД;
- уверенное знание SQL, Python;
- готовность изучать Spark (Scala);
- стремление обосновывать и документировать появляющиеся решения;
- опыт работы с MPP системами;
- понимание принципов CI/CD.
Будет плюсом, если ты
- программировал на Scala / Java;
- знаешь фреймворк Apache Spark, Apache Airflow;
- умеешь оптимизировать вычисления в MPP системах;
- работал с форматами iceberg, parquet, protobuf, avro;
- использовал Trino / Greenplum / ClickHouse;
- знаком с Kafka Connect.
Что интересного у нас есть:
- ДМС с первого месяца работы в компании;
- предоставляем множество корпоративных бонусных программ;
- работаем удаленно: в Москве есть большой и красивый офис — welcome;
- выдаем технику для работы на твой выбор;
- помогаем интеллектуально и физически развиваться (электронная библиотека, книжный клуб, футбол);
- уделяем большое внимание обучению сотрудников, поэтому в нашей knowledge base ты найдёшь много интересных курсов, книг и записей конференций, а также у нас есть выделенный бюджет на образование.
А ещё:
- мы сами участвуем в конференциях, как спикеры;
- проводим внутренние митапы;
- не боимся экспериментировать с новыми решениями и технологиями :)
Зарегистрируйтесь или войдите, чтобы открыть контакты работодателя
Прикрепите резюме для отклика
Уже с нами?
Войдите, чтобы отправить резюме
05 Декабря
Data Engineer( БУРГЕР КИНГ РОССИЯ )
Москва
Компания "БУРГЕР КИНГ РОССИЯ" Компания BURGER KING® приглашает в команду Data Engineer. Присоединяйся к нам на вакансию в офис: с тебя –...
05 Декабря
Senior Frontend developer( Сбербанк )
Москва
Компания "Сбербанк" Мы - команда «Управление обеспечением», которая внедряет новые продукты и оптимизирует существующие для бизнеса Департамента...
05 Декабря
Москва
Компания "ИК СИБИНТЕК" Обязанности: Анализ данных для моделирования (подготовка, обработка, анализ качества); Проработка архитектуры...
05 Декабря
QA Engineer / Тестировщик ПО (Manual+Auto)
Москва
от 120 000 до 200 000 руб.
Компания "ИНТЕЛЛЕКТУАЛЬНЫЕ СИСТЕМЫ" Ищем амбициозного специалиста по тестированию на постоянную работу в успешный IT-проект. Мы разрабатываем...
05 Декабря
Python developer (Middle/Senior)( Умскул )
Москва
Компания "Умскул" «Умскул» — самая крупная онлайн-школа подготовки к ЕГЭ и ОГЭ, которая входит в топ-10 EdTech-компаний в России, а также...
Вакансия размещена в отрасли