Data Engineer (Al) (в архиве)

26 Декабря

Партнерские Вакансии

Город:

Москва

Занятость:

Полная занятость

Компания "РУССДРАГМЕТ"

Мы ищем опытного специалиста для создания единой корпоративной платформы данных в рамках ИИ-трансформации компании. Задача — инвентаризировать, консолидировать и организовать управление данными для обеспечения ИИ-решений качественной информацией.

Обязанности:

Инвентаризация и аудит данных:

  • Проведение комплексной инвентаризации данных компании из различных источников
  • Анализ и документирование существующих источников данных, форматов и систем хранения
  • Оценка качества, полноты и актуальности данных
  • Выявление критических данных для ИИ-решений и бизнес-процессов

    Проектирование и построение хранилища данных:
  • Разработка архитектуры единого корпоративного хранилища данных
  • Проектирование схем данных и моделей для различных доменов (геология, проектирование, строительство, финансы)
  • Создание и оптимизация ETL/ELT пайплайнов для миграции и загрузки данных
  • Обеспечение масштабируемости и производительности хранилища

    Миграция данных:
  • Планирование и выполнение миграции данных из разрозненных источников
  • Разработка скриптов и процессов для трансформации и очистки данных
  • Валидация корректности миграции и целостности данных
  • Минимизация рисков потери данных при переносе

    Управление качеством данных:
  • Разработка и внедрение процессов контроля качества данных
  • Создание правил валидации и мониторинга качества
  • Автоматизация процессов очистки и обогащения данных

    Управление доступом и безопасность:
  • Проектирование и реализация системы управления доступом к данным
  • Настройка ролевых моделей и политик безопасности
  • Обеспечение соответствия требованиям по защите персональных и конфиденциальных данных
  • Аудит и мониторинг доступа к данным

    Data Governance:
  • Участие в разработке политик и стандартов управления данными
  • Создание каталога данных и метаданных
  • Документирование процессов и процедур работы с данными
  • Взаимодействие с владельцами данных и бизнес-подразделениями
Требования:


Обязательные навыки:

  • Python/SQL — уверенное владение для разработки ETL-процессов и работы с данными
  • Реляционные БД: опыт работы с PostgreSQL, MySQL или MS SQL Server
  • NoSQL базы данных: практический опыт работы с MongoDB, Cassandra, Redis или аналогами
  • ETL/ELT инструменты: практический опыт с Apache Airflow, dbt, Pentaho или аналогами
  • Системы очередей: опыт работы с Kafka, RabbitMQ или аналогами
  • Хранилища данных: понимание принципов построения DWH, опыт работы с ClickHouse, Greenplum или аналогами
  • Работа с большими объемами данных: опыт обработки и трансформации больших датасетов
  • Версионирование: Git для управления кодом и конфигурациями
  • Понимание принципов нормализации и моделирования данных

    Желательные навыки:
  • Знание принципов Data Governance и Data Quality Management
  • Знание Docker, Kubernetes для контейнеризации решений
  • Знание инструментов каталогизации данных (Apache Atlas, DataHub, Amundsen)
  • Понимание принципов построения Data Lake и Data Mesh
  • Опыт работы с векторными БД для ИИ-решений (Qdrant, Milvus, PGVector)

Будет преимуществом:

  • Опыт построения корпоративных хранилищ данных с нуля
  • Сертификации по работе с БД
  • Опыт работы в строительной, горнодобывающей или инжиниринговой отрасли
  • Знание специфики работы с геологическими, проектными и техническими данными
  • Опыт внедрения Data Governance фреймворков (DAMA-DMBOK, DCAM)
  • Вклад в open-source проекты в области data engineering

Условия:
  • Офис находится : г. Москва, наб. Пресненская, д.10 (Москва-Сити);

  • График работы: пятидневная рабочая неделя с понедельника по пятницу , выходные: суббота, воскресенье;

  • Период испытательного срока: 3 месяца;

  • ДМС;

  • Годовой бонус;

  • Профессиональное обучение и развитие;

  • Возможность реализовать свой потенциал и построить карьеру.

  • Конкурентоспособный уровень заработной платы.

  • Участие в интересных и масштабных проектах.

Похожие вакансии

29 Декабря

Стажер (Data Engineer)( X5 Tech )

Москва

Компания "X5 Tech" X5 Group — российская розничная торговая компания, управляющая продуктовыми торговыми сетями «Пятёрочка», «Перекрёсток» и...

Отправить резюме подробнее

29 Декабря

DevOps Engineer / Site Reliability Engineer (SRE)

Москва

Компания "Kameleoon" О нас Мы - международная IT-компания с офисами в Париже, США и Германии. Наш продукт - платформа для персонализации и...

Отправить резюме подробнее

29 Декабря

Data Engineer( MIXIT )

Москва

Компания "MIXIT" Бренд MIXIT - российская косметическая компания, концепт истинной красоты, экспертизы и инноваций. Мы разрабатываем только...

Отправить резюме подробнее

30 Декабря

Data Analyst( Мазитов Валерий Дмитриевич )

Москва

от 120 000 до 180 000 руб.

Компания "Мазитов Валерий Дмитриевич" В связи с ростом команды мы ищем аналитика-разработчика, который усилит внутреннюю аналитику платёжного...

Отправить резюме подробнее

30 Декабря

Senior Fullstack QA Engineer (Uzum Tezkor)

Москва

Компания "«UZUM TECHNOLOGIES»." Почему Uzum? Большие возможности — нам всего 3 года, но мы уже лидеры рынка в стране. Если вы устали...

Отправить резюме подробнее

Вакансия размещена в отрасли

Информационные технологии / IT / Интернет: