Data Engineer (Al) (в архиве)

26 Декабря

Партнерские Вакансии

Город:

Москва

Занятость:

Полная занятость

Компания "РУССДРАГМЕТ"

Мы ищем опытного специалиста для создания единой корпоративной платформы данных в рамках ИИ-трансформации компании. Задача — инвентаризировать, консолидировать и организовать управление данными для обеспечения ИИ-решений качественной информацией.

Обязанности:

Инвентаризация и аудит данных:

  • Проведение комплексной инвентаризации данных компании из различных источников
  • Анализ и документирование существующих источников данных, форматов и систем хранения
  • Оценка качества, полноты и актуальности данных
  • Выявление критических данных для ИИ-решений и бизнес-процессов

    Проектирование и построение хранилища данных:
  • Разработка архитектуры единого корпоративного хранилища данных
  • Проектирование схем данных и моделей для различных доменов (геология, проектирование, строительство, финансы)
  • Создание и оптимизация ETL/ELT пайплайнов для миграции и загрузки данных
  • Обеспечение масштабируемости и производительности хранилища

    Миграция данных:
  • Планирование и выполнение миграции данных из разрозненных источников
  • Разработка скриптов и процессов для трансформации и очистки данных
  • Валидация корректности миграции и целостности данных
  • Минимизация рисков потери данных при переносе

    Управление качеством данных:
  • Разработка и внедрение процессов контроля качества данных
  • Создание правил валидации и мониторинга качества
  • Автоматизация процессов очистки и обогащения данных

    Управление доступом и безопасность:
  • Проектирование и реализация системы управления доступом к данным
  • Настройка ролевых моделей и политик безопасности
  • Обеспечение соответствия требованиям по защите персональных и конфиденциальных данных
  • Аудит и мониторинг доступа к данным

    Data Governance:
  • Участие в разработке политик и стандартов управления данными
  • Создание каталога данных и метаданных
  • Документирование процессов и процедур работы с данными
  • Взаимодействие с владельцами данных и бизнес-подразделениями
Требования:


Обязательные навыки:

  • Python/SQL — уверенное владение для разработки ETL-процессов и работы с данными
  • Реляционные БД: опыт работы с PostgreSQL, MySQL или MS SQL Server
  • NoSQL базы данных: практический опыт работы с MongoDB, Cassandra, Redis или аналогами
  • ETL/ELT инструменты: практический опыт с Apache Airflow, dbt, Pentaho или аналогами
  • Системы очередей: опыт работы с Kafka, RabbitMQ или аналогами
  • Хранилища данных: понимание принципов построения DWH, опыт работы с ClickHouse, Greenplum или аналогами
  • Работа с большими объемами данных: опыт обработки и трансформации больших датасетов
  • Версионирование: Git для управления кодом и конфигурациями
  • Понимание принципов нормализации и моделирования данных

    Желательные навыки:
  • Знание принципов Data Governance и Data Quality Management
  • Знание Docker, Kubernetes для контейнеризации решений
  • Знание инструментов каталогизации данных (Apache Atlas, DataHub, Amundsen)
  • Понимание принципов построения Data Lake и Data Mesh
  • Опыт работы с векторными БД для ИИ-решений (Qdrant, Milvus, PGVector)

Будет преимуществом:

  • Опыт построения корпоративных хранилищ данных с нуля
  • Сертификации по работе с БД
  • Опыт работы в строительной, горнодобывающей или инжиниринговой отрасли
  • Знание специфики работы с геологическими, проектными и техническими данными
  • Опыт внедрения Data Governance фреймворков (DAMA-DMBOK, DCAM)
  • Вклад в open-source проекты в области data engineering

Условия:
  • Офис находится : г. Москва, наб. Пресненская, д.10 (Москва-Сити);

  • График работы: пятидневная рабочая неделя с понедельника по пятницу , выходные: суббота, воскресенье;

  • Период испытательного срока: 3 месяца;

  • ДМС;

  • Годовой бонус;

  • Профессиональное обучение и развитие;

  • Возможность реализовать свой потенциал и построить карьеру.

  • Конкурентоспособный уровень заработной платы.

  • Участие в интересных и масштабных проектах.

Похожие вакансии

03 Февраля

Data Scientist / ML-инженер( Медиалогия )

Москва

Компания "Медиалогия" Медиалогия занимается разработкой продуктов по сбору и анализу данных из СМИ и соцмедиа. Мы разрабатываем...

Отправить резюме подробнее

03 Февраля

Data Engineer( Ozon )

Москва

Компания "Ozon" Нужен Data Engineer, который сможет взять на себя часть непрофильной для аналитиков работы по автоматизации отчётов, превращению...

Отправить резюме подробнее

03 Февраля

Аналитик данных/Data Analyst( РСХБ-Интех )

Москва

Компания "РСХБ-Интех" НАША КОМАНДА отвечает за создание и развитие персонализированной коммуникации с клиентами банка через цифровые каналы. Мы...

Отправить резюме подробнее

04 Февраля

Инженер по тестированию (Data Platform и ML)

Москва

Компания "МегаФон 1440" Чем предстоит заниматься: Проведение функционального тестирования нового функционала и регрессионного тестирования...

Отправить резюме подробнее

04 Февраля

AI/ML engineer( JFoRecruitment )

Москва

от 200 000 до 300 000 руб.

Компания "JFoRecruitment" Мы – JFoRecruitment , IT-рекрутинговое агентство, специализирующееся на поиске высококвалифицированных специалистов и...

Отправить резюме подробнее

Вакансия размещена в отрасли

Информационные технологии / IT / Интернет: