Junior Data Science Engineer (NLP)
Описание
ДМИТРИЙ САВЕЛКО
Контакты: +7(996)426-50-91 || dima.savelko@gmail.com
Россия, г.Москва
GitHub: https://github.com/ditengm
LinkedIn: https://www.linkedin.com/in/dmitriysavelko/
Английский язык: Pre-Intermediate - B1
ОБРАЗОВАНИЕ Российский технологический университет МИРЭА
Направление программы: Прикладная информатика
Профиль программы: Управление данными
НАВЫКИ Programming languages
Python, SQL, C++, JavaScript, PHP
Python libraries Pandas, PyTorch, Matplotlib, Numpy, AutoML,
Scikit-learn, CatBoost, XGBoost, BeautifulSoup, Requests
Tools LaTeX, Git, Microsoft Office, Linux
Relevant Courses Линейная алгебра, Структуры и алгоритмы обработки данных
Основы статистики, Основы баз данных, ООП
ОПЫТ Support at Karpov.Courses
Май 2022 - Сейчас
· Помогаю группе студентов с Python (FastAPI, SQLAlchemy, Pydentic, ООП, Структуры Данных), после чего
они успешно увеличил score на 11% и выполнили проект на эту тему. Ежедневно объяснял студентам основы
машинного обучения (Линейная регрессия, регуляризация и мультиколлинеарность, градиентный бустинг,
классификация), что позволило им набрать наивысший балл в заданиях. Также совместно с студентами
проводил A/B тестирование и использовал статистические методы для их подтверждения.
Хакатоны по Data Science Сентябрь 2021 - Октябрь 2022
· Принял участие в 5 хакатонах, в которых попадал в финал и становился победителем. Работал с: - Проводил
EDA данных, строил метрики, а также изучал предметную область для улучшения качества модели для
генерации фич, что позволило улучшить качество моделей - Разрабатывал и обучал модели машинного
обучения, а также создавал нейронные сети, а также модифицировал готовые сетки для решения задач
классификации, кластеризации, регрессии, синтеза речи, NLP. - Проводил статический анализ данных для
подтверждения гипотез, проводил A/B тестирования для нахождения лучшей лучшей модели.
ДОСТИЖЕНИЯ Хакатон
”Zakupki.Hackaton ” Октябрь 2022
2 место из 67
· Нужно было сделать анализ рынка для поставщика, который вводит описание интересующего его товара.
· Почистил датасет, провёл лемматизацию данных (pymystem3), сделал эмбеддинги на основе TF-IDF и
посчитал косинус угла между векторами, с помощью которых и выводил товары-аналоги.
· Построил графики и провёл аналитику на основе полученных данных
Хакатон ”DeepFake ”от Наносемантики Апрель 2022
2 место из 30
· Сформировал Pipeline из фреймворка Real-Time-Voice-Cloning, использующий модель SV2TTS, и фреймо-
врка wav2lip.
· С помощью Real-Time-Voice-Cloning синтезировал голос Байдена, а с помощью wav2lip создал видеоролик
с лицом Байдена, говорящий синтезированный текст.
Хакатон ”Что найдёт Сервер? ”от Северстали Март 2022
Финалист (Капитан команды)
· Провёл предобработку данных с помощью Pandas, что позволило найти фичи, увеличив score на 7%, а
также их анализ, визуализируя при помощи Matplotlib и Seaborn.
· Применил модели машинного обучения CatBoost, AutoML, бэггинг и стэкинг, сравнил их и получил наи-
лучший score.
· Применил алгоритм SARIMA для временных рядов.
26 октября, 2016
Наталья
Город
Москва
Возраст
37 лет (17 мая 1988)
26 октября, 2016
Григорий
Город
Москва
Возраст
53 года (29 декабря 1969)
28 октября, 2016
Мадия
Город
Москва
Возраст
54 года ( 5 июня 1971)