Junior Data Science Engineer (NLP)
Описание
ДМИТРИЙ САВЕЛКО
Контакты: +7(996)426-50-91 || dima.savelko@gmail.com
Россия, г.Москва
GitHub: https://github.com/ditengm
LinkedIn: https://www.linkedin.com/in/dmitriysavelko/
Английский язык: Pre-Intermediate - B1
ОБРАЗОВАНИЕ Российский технологический университет МИРЭА
Направление программы: Прикладная информатика
Профиль программы: Управление данными
НАВЫКИ Programming languages
Python, SQL, C++, JavaScript, PHP
Python libraries Pandas, PyTorch, Matplotlib, Numpy, AutoML,
Scikit-learn, CatBoost, XGBoost, BeautifulSoup, Requests
Tools LaTeX, Git, Microsoft Office, Linux
Relevant Courses Линейная алгебра, Структуры и алгоритмы обработки данных
Основы статистики, Основы баз данных, ООП
ОПЫТ Support at Karpov.Courses
Май 2022 - Сейчас
· Помогаю группе студентов с Python (FastAPI, SQLAlchemy, Pydentic, ООП, Структуры Данных), после чего
они успешно увеличил score на 11% и выполнили проект на эту тему. Ежедневно объяснял студентам основы
машинного обучения (Линейная регрессия, регуляризация и мультиколлинеарность, градиентный бустинг,
классификация), что позволило им набрать наивысший балл в заданиях. Также совместно с студентами
проводил A/B тестирование и использовал статистические методы для их подтверждения.
Хакатоны по Data Science Сентябрь 2021 - Октябрь 2022
· Принял участие в 5 хакатонах, в которых попадал в финал и становился победителем. Работал с: - Проводил
EDA данных, строил метрики, а также изучал предметную область для улучшения качества модели для
генерации фич, что позволило улучшить качество моделей - Разрабатывал и обучал модели машинного
обучения, а также создавал нейронные сети, а также модифицировал готовые сетки для решения задач
классификации, кластеризации, регрессии, синтеза речи, NLP. - Проводил статический анализ данных для
подтверждения гипотез, проводил A/B тестирования для нахождения лучшей лучшей модели.
ДОСТИЖЕНИЯ Хакатон
”Zakupki.Hackaton ” Октябрь 2022
2 место из 67
· Нужно было сделать анализ рынка для поставщика, который вводит описание интересующего его товара.
· Почистил датасет, провёл лемматизацию данных (pymystem3), сделал эмбеддинги на основе TF-IDF и
посчитал косинус угла между векторами, с помощью которых и выводил товары-аналоги.
· Построил графики и провёл аналитику на основе полученных данных
Хакатон ”DeepFake ”от Наносемантики Апрель 2022
2 место из 30
· Сформировал Pipeline из фреймворка Real-Time-Voice-Cloning, использующий модель SV2TTS, и фреймо-
врка wav2lip.
· С помощью Real-Time-Voice-Cloning синтезировал голос Байдена, а с помощью wav2lip создал видеоролик
с лицом Байдена, говорящий синтезированный текст.
Хакатон ”Что найдёт Сервер? ”от Северстали Март 2022
Финалист (Капитан команды)
· Провёл предобработку данных с помощью Pandas, что позволило найти фичи, увеличив score на 7%, а
также их анализ, визуализируя при помощи Matplotlib и Seaborn.
· Применил модели машинного обучения CatBoost, AutoML, бэггинг и стэкинг, сравнил их и получил наи-
лучший score.
· Применил алгоритм SARIMA для временных рядов.
3 августа, 2016
Ирина
Город
Москва
Возраст
61 год (26 ноября 1964)
8 апреля, 2019
Валерий
Город
Москва
Возраст
65 лет (11 декабря 1960)
28 июля, 2016
Игорь
Город
Москва
Возраст
56 лет (21 мая 1969)