Компания "USETECH"
Юзтех – группа аккредитованных ИТ-компаний полного цикла разработки с многолетней экспертизой в передовых технологиях: DWH, BigData, AI/ML, Blockchain, BI, предиктивная аналитика, цифровые двойники производства и рисков.
ГК Юзтех является технологическим партнёром таких компаний, как Mail.ru, 2Gis, НЛМК, Еврохим, Go Invest, Альфа-Банк, Сбер, ВТБ, МКБ, Самолет Девелопмент, Х5 Group, Газпромнефть, Лемана Про, Ситилинк, Ланит, IBS. Также, ГК разрабатывает собственные IT-продукты (Usebus, Octopus, Тил Эйчар) и флагманские проекты, которыми пользуется 70% населения страны.
Задачи:
Анализ существующих решений и витрин данных.
Миграция витрин данных со стека Hadoop (Hive, Oozie, Spark 2.4, Impala) на стек Apache Iceberg + Spark 3.5 + Apache Airflow.
Реализация недостающих реплик для витрин данных с источников с использованием готовых кодогенераторов.
Переработка существующих решений на целевом стеке, в отдельных случаях — разработка решений с нуля по шаблонам.
Построение и развитие витрин данных, участие в их тестировании и валидации.
Наполнение и актуализация технической документации по разработанным решениям.
Взаимодействие с командами разработки и аналитики в рамках проработки и внедрения решений.
Уверенные знания SQL и Python.
Опыт работы с Apache Spark.
Практический опыт работы с хранилищами данных на базе Hadoop / S3 / S3-compatible storage.
Обязательное знание и опыт работы с Apache Iceberg (таблицы, версии, schema evolution, partitioning).
Опыт использования Apache Airflow для оркестрации и управления пайплайнами.
Понимание форматов хранения данных, в том числе Parquet.
Опыт работы с инструментами командной разработки: Git, CI/CD, трекерами задач и документацией (Jira, Confluence или аналоги).
Навыки работы с форматами данных JSON, XML.
Опыт системного анализа и тестирования data-решений.
Базовое понимание работы реляционных СУБД.
Базовые знания Kafka и принципов потоковой передачи данных.
Мы предлагаем:
21 Апреля
QA Automation Engineer Java (AQA Java)
Москва
Компания "Ростелеком" Компания Research & Development Partners (RDP) - ведущий российский производитель сетевого программного обеспечения....
21 Апреля
Москва
Компания "МТС" МГТС — основной телекоммуникационный партнер Города Москвы и часть экосистемы МТС. Проектируем, строим и эксплуатируем...
21 Апреля
Владелец продукта (BI, Big Data, Data management)
Москва
Компания "Криптонит" Основные задачи: Управление продуктом "Источники данных" Формирование RoadMap продукта, документирование общей...
21 Апреля
Senior Go Developer for Parsers
Москва
Компания "Ostrovok.ru" Команда Parsers занимается всем циклом обработки данных о ценах конкурентов - от задач на парсинг до финальных топиков...
22 Апреля
IT Data Asset Intern / Стажер-менеджер по управлению данными
Москва
от 100 000 руб.
Компания "Procter & Gamble" НАЙМ В ООО «ПРОКТЕР ЭНД ГЭМБЛ ДИСТРИБЬЮТОРСКАЯ КОМПАНИЯ» НА СРОЧНЫЙ ТРУДОВОЙ ДОГОВОР Во время твоей...
Вакансия размещена в отрасли