Senior data engineer (команда Data lake)

06 Декабря

Партнерские Вакансии

Город:

Москва

Занятость:

Полная занятость

Компания "Самокат (ООО Умное пространство)"

В команде Data Engineering уже более 30 профессионалов

Мы создаем хранилища данных и инструменты для их анализа и использования в аналитике, BI, ML. В связи с ростом компании и новыми задачами, мы ищем инженера в группу разработки и развития транспортировки данных. Между собой мы называем команду "Research & development" или просто RnD. Команда занимается исследованием и внедрением новых технологий, созданием инструментов для работы с данными, разрабатывает стандарты. Наш фокус на Data Lake: загрузка данных из источников (API, Kafka, CDC, PostgreSQL, MySQL и другие), трансформация данных в табличный вид, разработка инструментов по транспортировке данных между аналитическими СУБД (Greenplum, ClickHouse) и S3.

Чем будем заниматься:

  • развивать существующее CDC-решение на базе Debezium и Spark Streaming: улучшать мониторинг, автоматизировать то, что делается вручную;
  • разрабатывать, оптимизировать и мониторить ETL-процессы на основе технологий Airflow, Greenplum, ClickHouse, используя Python и Spark (Scala);
  • участвовать в исследованиях и принимать решения по использованию новых инструментов для обработки данных в компании;
  • развивать практику использования Trino в компании;
  • участвовать в разработке интеграции Trino с каталогом метаданных Datahub.

Мы ждём от кандидата:

  • понимание принципов организации хранилищ данных, работы колоночных БД;
  • уверенное знание SQL, Python;
  • готовность изучать Spark (Scala);
  • стремление обосновывать и документировать появляющиеся решения;
  • опыт работы с MPP системами;
  • понимание принципов CI/CD.

Будет плюсом, если ты

  • программировал на Scala / Java;
  • знаешь фреймворк Apache Spark, Apache Airflow;
  • умеешь оптимизировать вычисления в MPP системах;
  • работал с форматами iceberg, parquet, protobuf, avro;
  • использовал Trino / Greenplum / ClickHouse;
  • знаком с Kafka Connect.

Что интересного у нас есть:

  • ДМС с первого месяца работы в компании;
  • предоставляем множество корпоративных бонусных программ;
  • работаем удаленно: в Москве есть большой и красивый офис — welcome;
  • выдаем технику для работы на твой выбор;
  • помогаем интеллектуально и физически развиваться (электронная библиотека, книжный клуб, футбол);
  • уделяем большое внимание обучению сотрудников, поэтому в нашей knowledge base ты найдёшь много интересных курсов, книг и записей конференций, а также у нас есть выделенный бюджет на образование.

А ещё:

  • мы сами участвуем в конференциях, как спикеры;
  • проводим внутренние митапы;
  • не боимся экспериментировать с новыми решениями и технологиями :)
Похожие вакансии

05 Декабря

Data Engineer( БУРГЕР КИНГ РОССИЯ )

Москва

Компания "БУРГЕР КИНГ РОССИЯ" Компания BURGER KING® приглашает в команду Data Engineer. Присоединяйся к нам на вакансию в офис: с тебя –...

Отправить резюме подробнее

05 Декабря

Senior Frontend developer( Сбербанк )

Москва

Компания "Сбербанк" Мы - команда «Управление обеспечением», которая внедряет новые продукты и оптимизирует существующие для бизнеса Департамента...

Отправить резюме подробнее

05 Декабря

Data Scientist( ИК СИБИНТЕК )

Москва

Компания "ИК СИБИНТЕК" Обязанности: Анализ данных для моделирования (подготовка, обработка, анализ качества); Проработка архитектуры...

Отправить резюме подробнее

05 Декабря

QA Engineer / Тестировщик ПО (Manual+Auto)

Москва

от 120 000 до 200 000 руб.

Компания "ИНТЕЛЛЕКТУАЛЬНЫЕ СИСТЕМЫ" Ищем амбициозного специалиста по тестированию на постоянную работу в успешный IT-проект. Мы разрабатываем...

Отправить резюме подробнее

05 Декабря

Python developer (Middle/Senior)( Умскул )

Москва

Компания "Умскул" «Умскул» — самая крупная онлайн-школа подготовки к ЕГЭ и ОГЭ, которая входит в топ-10 EdTech-компаний в России, а также...

Отправить резюме подробнее

Вакансия размещена в отрасли

Информационные технологии / IT / Интернет: