ETL разработчик/Data engineer

23 Ноября

от 300 000 руб.

Партнерские Вакансии

Город:

Москва

Занятость:

Полная занятость

Компания "Тарасова Ольга Сергеевна"

Современная российская IT компания, специализирующаяся на внедрении инструментов для повышения эффективности бизнес-процессов ищет будущего коллегу - ETL разработчика уровня Middle+ и выше.

Нам есть что тебе предложить - уникальный проект, в котором предстоит работать, не имеющий аналогов в своей нише.

Оставляй свой отклик, оперативно свяжемся и обсудим детали!

Условия:

  • З/п до 350 000 на руки (готовы обсуждать) - зависит от уровня специалиста;
  • Формат работы: удаленка, 5/2 с гибким началом и окончанием рабочего дня;
  • Официальное трудоустройство по ТК РФ c первого дня;
  • Аккредитованная IT компания (льготная ипотека, отсрочка от призыва и бронь от мобилизации);
  • Дополнительные условия: ДМС;
  • Ежегодная индексация заработной платы.

Задачи:

  • Совместная работа с DBA-архитектором на проектах;
  • Организация ETL-процессов выгрузки данных Apache Hudi таблиц из S3 в ODS-слой на Greenplum;
  • Разработка трансформации данных ODS-слоя в DDS-слой;
  • Имплементация различных CDC-методов (инкрементальный JOIN с двумя наборами данных, вычисление хэша с последующим diff);
  • Разработка plpgsql-функций или аналогичной логики на Spark для трансформации данных, на основе логики существующего Python/T-SQL кода (MSSQL);
  • Разработка ad-hoc аналитических запросов под PostgreSQL/Greenplum;
  • Разработка DataQuality-тестов на скриптовом ETL (Pyhon, Java или Scala);
  • Работа с AirFlow-операторами, разработка DAGs;
  • Мониторинг и поиск проблемных мест при эксплуатации ADB (Greenplum).

Требования:

  • Понимание различий PostgreSQL & Greenplum;
  • Понимание механизма работы QE/QD (query executor & query dispatcher), и как исполняется SQL-запрос в Greenplum-кластере, включая планы запросов (redistribute, broadcast, gather motions);
  • Понимание механизма дистрибьюции данных на сегмент-инстансах Greenplum, и как исправлять перекосы данных (skews);
  • Понимание разницы механизмов работы Heap & AOP (append-optimzed) таблиц в Greenplum, включая понимание “ограничений” колоночного формата хранения данных;
  • Понимание различий между логическими моделями: звезды, снежинки и DataVault.
  • Опыт на аналогичной должности от 4 лет;
  • Опыт с технологическим стеком: Greenplum, PXF, gpfdist, AirFlow, Spark, Scala обязателен.
Похожие вакансии

05 Декабря

Ассистент специалиста-разработчика косметики

ЛМС

от 85 000 до 95 000 руб.

Компания "БИГ" Условия: Оформление по ТК РФ с первого рабочего дня; Полностью "белая" заработная плата, стабильные выплаты два раза в...

Отправить резюме подробнее

05 Декабря

Специалист-разработчик косметики

ЛМС

от 95 000 до 110 000 руб.

Компания "БИГ" Условия: Оформление по ТК РФ с первого рабочего дня; Полностью "белая" заработная плата, стабильные выплаты два раза в...

Отправить резюме подробнее

05 Декабря

Инженер-разработчик ПЛИС( Институт космических исследований РАН )

Москва

от 120 000 руб.

Компания "Институт космических исследований РАН" Институт космических исследований Российской академии наук (ИКИ РАН) – ведущий академический...

Отправить резюме подробнее

05 Декабря

Data Engineer( БУРГЕР КИНГ РОССИЯ )

Москва

Компания "БУРГЕР КИНГ РОССИЯ" Компания BURGER KING® приглашает в команду Data Engineer. Присоединяйся к нам на вакансию в офис: с тебя –...

Отправить резюме подробнее

05 Декабря

Разработчик Hadoop

Москва

Компания "Неофлекс" СТЕК: Hadoop, Hive, Spark, Hue, Jupyter. ЧЕМ ТЫ БУДЕШЬ ЗАНИМАТЬСЯ: Определение источников, выявление проблем с...

Отправить резюме подробнее

Вакансия размещена в отрасли

Информационные технологии / IT / Интернет: