Стажёр Data Engineer в команду инфраструктуры маркетинга
Описание
Савченко Данила Валериевич
+7 (903) 8056019
danilasavcenko5@ gmail . com
Проживает: Москва
Желаемая должность
Стажёр Data Engineer / Data Engineer Intern
Тип занятости: стажировка, частичная занятость
Формат работы: на месте работодателя, удалённо, гибрид
Опыт работы
НИТУ МИСИС
Проектная
деятельность HH-dbt-dwh — аналитическое хранилище по вакансиям и
навыкам
Учебный DWH-проект для анализа вакансий и навыков на рынке Data Engineering. Цель
проекта — пройти базовый цикл построения хранилища: загрузка raw-данных в PostgreSQL,
тран сформации через dbt, разделение моделей по слоям и подготовка аналитических
витрин.
• Загрузил 400k+ строк raw-данных о вакансиях в PostgreSQL через Python загрузчик.
• Собрал dbt-проект из 7 моделей: staging, intermediate и 4 аналитические mart
таблицы.
• Реализовал staging-слой с очисткой полей и дедупликацией вакансий по
vacancy_id .
• Построил intermediate-слой для переиспользуемой бизнес-логики: парсинг
skills/professional roles и нормализация навыков.
• Подготовил витрины для анализа популярных навыков, навыков по уровню опыта,
Data Engineer/Backend вакансий и зарплатных вилок.
• Настроил 13 dbt data tests: not_null , unique , проверка уникальности пары vacancy_id
+ skill и проверки ключевых mart метрик.
• Описал локальный запуск через Docker Compose, dbt run , dbt test и генерацию dbt
документации.
Стек: Python, SQL, PostgreSQL, dbt Core, dbt-postgres, Docker Compose, pandas.
Turbofan-DE-pipeline — пайплайн обработки телеметрии
двигателей
Учебный end-to-end Data Engineering проект для симуляции и обработки телеметрии
турбореактивных двигателей: генерация событий, доставка через Kafka, хранение raw
данных и агрегатов в ClickHouse, оркестрация через Airflow и мониторинг через
Prometheus/Grafana.
Реализовал Python producer, который генерирует телеметрию для 3 двигателей с
частотой 1 событие/сек.
Настроил Kafka кластер из 3 брокеров и topic raw_data с replication factor 3.
Написал Python consumer для чтения событий из Kafka и батчевой загрузки в
ClickHouse по 10 записей .
Поднял инфраструктуру через Docker Compose: Kafka, ClickHouse, Airflow,
PostgreSQL, Prometheus и Grafana.
Спроектировал 2 ClickHouse-таблицы: raw_data для сырых событий и main_stats
для агрегатов.
Описал локальный запуск проекта через .env , Docker Compose, producer/consumer и
веб-интерфейсы Airflow/Grafana/Kafka UI .
Настроил Airflow DAG для расчёта 5-минутных агрегатов по двигателям.
Стек: Python, Apache Kafka, ClickHouse, Apache Airflow, PostgreSQL, Docker Compose,
Prometheus, Grafana.
Хакатон True Tech Hack 2026 — локальный AI/RAG-сервис для
генерации Lua кода
Участвовал в хакатоне True Tech Hack 2026, кейс — локальный AI-агент для генерации Lua-
кода под платформу MWS Octapi от МТС .
В команде из двух человек отвечал за data/backend часть: подготовку корпуса
примеров кода, RAG pipeline и API-слой .
Собрал корпус реальных примеров Lua-кода, подготовил данные для retrieval и
загрузил векторное представление в ChromaDB .
Написал FastAPI-микросервисы planner, generator и validator для разделения этапов
планирования, генерации и проверки кода .
Подготовил Docker Compose-инфраструктуру с GPU-поддержкой, init-контейнерами
и healthcheck'ами .
Стек: Python, FastAPI, ChromaDB, RAG, Docker Compose, local LLM, Lua.
Образование
Высшее
2029 – год выпуска
Национальный исследовательский технологический
университет «МИСИС», Москва
Институт компьютерных наук, Информационные сети и технологии
Навыки
Знание языков
Русский — Родной
Английский — B 2
Навыки
Python SQL PostgreSQL ClickHouse dbt Apache Airflow Apache Kafka Docker Docker
Compose
Linux Git pandas DWH GitLab ETL/ELT Data Engineering Bash OLAP
OLTP
Дополнительная информация
Обо мне
TG : @ Flipixcool
Р азвиваюсь в направлении Data Engineering. Основной фокус — Python, SQL, ETL/ELT
пайплайны, хранилища данных и оркестрация. В учебных проектах реализую полный цикл
работы с данными: загрузка raw данных, трансформации, построение DWH слоёв, витрин,
базовая оркестрация и мониторинг. Ищу стажировку Data Engineer, где смогу развиваться
на реальных задачах и применять Python/SQL в production подходах.
26 октября, 2016
Наталья
Город
Москва
Возраст
38 лет (17 мая 1988)
26 октября, 2016
Григорий
Город
Москва
Возраст
53 года (29 декабря 1969)
28 октября, 2016
Мадия
Город
Москва
Возраст
55 лет ( 5 июня 1971)