Data engineer (команда Data lake)
10 Ноября 2024
Город:
Москва
Занятость:
Полная занятость
Компания "Самокат (ООО Умное пространство)"
В команде Data Engineering уже более 30 профессионалов
Мы создаем хранилища данных и инструменты для их анализа и использования в аналитике, BI, ML. В связи с ростом компании и новыми задачами, мы ищем инженера в группу разработки и развития транспортировки данных. Между собой мы называем команду "Research & development" или просто RnD. Команда занимается исследованием и внедрением новых технологий, созданием инструментов для работы с данными, разрабатывает стандарты. наш фокус на Data Lake: загрузка данных из источников (API, Kafka, CDC, PostgreSQL, MySQL и другие), трансформация данных в табличный вид, разработка инструментов по транспортировке данных между аналитическими СУБД (Greenplum, ClickHouse) и S3.
Чем будем заниматься:
-
дорабатывать Kafka Connect для задачи загрузки данных в Data Lake;
-
разрабатывать, оптимизировать и мониторить ETL-процессы на основе технологий Airflow, S3, Greenplum, ClickHouse, используя Python и Spark (Scala);
-
подключать новые источники к Trino;
-
создавать инструменты для упрощения ETL разработки;
-
развивать существующее CDC-решение на базе Debezium и Spark Streaming: улучшать мониторинг, автоматизировать то, что делается вручную;
-
развивать практику использования Trino в компании;
-
участвовать в разборах инцидентов по сервисам команды.
⭐️ Мы ждём от кандидата:
-
понимание принципов организации хранилищ данных, работы колоночных СУБД;
-
уверенное знание SQL, Python;
-
готовность изучать Spark (Scala);
-
стремление обосновывать и документировать появляющиеся решения.
Будет плюсом, если ты:
-
программировал на Scala / Java;
-
знаешь фреймворки Apache Spark, Apache Airflow;
-
работал с форматами iceberg, parquet, protobuf, avro;
-
использовал Trino / Greenplum / ClickHouse;
-
знаком с Kafka Connect.
Что интересного у нас есть:
-
ДМС с первого месяца работы в компании;
-
IT-ипотека и ипотека для сотрудников экосистемы Сбербанка;
-
предоставляем множество корпоративных бонусных программ;
-
работаем удаленно. В Москве есть большой и красивый офис, поэтому если ты из этого города или будешь проездом — welcome;
-
выдаем технику для работы на твой выбор;
-
помогаем интеллектуально и физически развиваться (электронная библиотека, книжный клуб, футбол);
-
уделяем большое внимание обучению сотрудников, поэтому в нашей knowledge base ты найдёшь много интересных курсов, книг и записей конференций, а также у нас есть выделенный бюджет на образование.
А ещё:
-
мы сами участвуем в конференциях, как спикеры;
-
пишем статьи на хабр;
-
проводим внутренние митапы и дискуссионные клубы;
-
не боимся экспериментировать с новыми решениями и технологиями;
-
заботимся о сотрудниках: в компании есть команда счастья и корпоративные психологи для разговоров по душам.
Зарегистрируйтесь или войдите, чтобы открыть контакты работодателя
Прикрепите резюме для отклика
Уже с нами?
Войдите, чтобы отправить резюме
04 Ноября
Руководитель команды C/C++/Golang разработчиков (Endpoint Linux)( Xello )
Москва
Компания "Xello" Xello – IT-компания, прошедшая путь от стартапа до одного из ключевых игроков на рынке информационной безопасности. Мы создаём...
04 Ноября
Middle+/Senior DevOps Engineer for Crypto project
Москва
Компания "Пэйлер" Payler — это лондонский Fintech-стартап, который разрабатывает финансовые решения для малого и среднего бизнеса по всему...
04 Ноября
DevOps Engineer( Metaratings )
Москва
Компания "Metaratings" Задачи: Разработка и внедрение скриптов и инструментов для автоматизации сборки, тестирования, развертывания и...
04 Ноября
Data Engineer (оптимизация)( Тера Интегро )
Москва
Компания "Тера Интегро" Обязанности: Развитие и поддержка хранилищ на основе Greenplum\ClickHouse. Анализ кода ПО и запросов бизнес...
03 Ноября
Москва
до 350 000 руб.
Компания "evrone.ru" Команда Evrone занимается продуктовой разработкой стартапов и помогает в цифровой трансформации бизнеса в России, США и...
Вакансия размещена в отрасли