TL Data Scientist
до 459 000 руб.
Город:
Москва
Занятость:
Полная занятость
Опыт:
Более 6 лет
Компания "Платформа ОФД"
Платформа ОФД - аккредитованная IT-компания, крупнейший в России оператор фискальных данных. Мы анализируем рынок российского ритейла на данных из магазинных чеков. Из плохо структурированной информации создаём аналитические решения для производителей, крупных ритейлеров, финансовых организаций, маркетинговых агенств. У нас много данных: каждый 3-й чек, пробиваемый в России, находится на наших серверах. Мы принимаем 60 млн чеков в день, имеем 5 млрд SKU в базе.
Чем предстоит заниматься:
- Руководить отделом из 2 команд: аналитики и DS. Также доступен ресурс асессоров
- Рабочие активности в рамках задач: декомпозиция, планирование, оценка, груминг, приемка
- Найм, контроль подбора, онбординг. Мотивация и развитие сотрудников
- Обеспечение команды необходимыми ресурсами
- Координировать работу со смежными подразделениями (DE, Продуктовые команды, Техническая эксплуатация) как в роли исполнителя, так и в роли заказчика
- Развивать целевую систему классификации и атрибуции чековых наименований как продукт: архитектура решения, модели, витрины, деплой
- Лидировать разработку решений на базе ML-алгоритмов для продуктовых команд, ориентируясь на масштабируемые решения
- Лидировать разработку решений на базе LLM с целью покрытия процессов компании AI-агентами в рамках соответствующей инициативы
- Развивать методологию компании в части валидации, мониторинга разработанных отделом решений, интеграции в промышленный контур и mlops в целом
- Развивать методологию в части синхронизации бизнес-метрик качества разрабатываемых решений и модельных метрик. Достигать целевых метрик, критически подходить к разработанным отделом решениям
Оценивать стоимость и ресурсы разработки, отталкиваясь от окупаемости
Что у нас есть:
- Команда из 3 DS и 5 Аналитиков в стадии расширения
- On-premise GPU-серверы в ведении DS-команды на базе NVIDIA H200
- Hadoop-серверы для работы с данными в ведении DE-команды
- JupyterLab / любая IDE для ресерча и разработок, AirFlow для деплоя, MLFlow для логирования экспериментов
- Оформление по ТК РФ, полностью белая заработная плата
- ДМС (поликлиника, стоматология, госпитализация, скорая и телемедицина)
- График работы гибридный: офис 1 раз в неделю по пятницам. Гибкое время начала рабочего дня
- Офис близко от метро Спортивная/ МЦК Лужники
Требования к кандидату:
- Опыт лидирования / руководства командами в AI-ML в качестве лида или pm – от 2 лет
- Опыт самостоятельной разработки ML-моделей, в частности в области nlp – от 3 лет
- Опыт реализации масштабируемых core-решений на базе ml-моделей в компании
- Глубокие технические навыки в части реализации ML-моделей: pytorch, архитектура трансформеров, fine-tuning LLM, понимание принципов деплоя ml-моделей
- Глубокие аналитические навыки и знания математической статистики для критической оценки производимых решений
Наш стек:
Jupyterhub/PyCharm, python, стандартный python стек (pandas, numpy, sklearn, matplolib), fastext, torch, BERT, HuggingFace, MlFlow
Hadoop, Spark, Hive, PostgreSQL, ClickHouse, Zeppelin/IntelliJ, AirFlow, ElasticSearch, Apache Superset
GitLab, k8s, Docker, Jira, Confluence
20 Мая
Аналитик данных (Data analyst)
Москва
Компания "Красное & Белое, розничная сеть" Для решение разнообразных и интересных задач в команду Аналитического отдела требуются новые...
21 Мая
Senior Data Scientist/ML Engineer в направление RecSys
Москва
Компания "X5 Tech" X5 Group — российская розничная торговая компания, управляющая продуктовыми торговыми сетями «Пятёрочка», «Перекрёсток» и...
21 Мая
Data analyst / Аналитик данных( X5 Tech )
Москва
Компания "X5 Tech" X5 Group — российская розничная торговая компания, управляющая продуктовыми торговыми сетями «Пятёрочка», «Перекрёсток» и...
21 Мая
Senior Data Scientist (NLP) в Автоматизацию коммуникаций
Москва
Компания "WILDBERRIES" Wildberries – это крупнейший маркетплейс России с миллионами пользователей и миллиардами оборота, работающий на рынке 19...
15 Мая
Senior Data Engineer в команду Customer Data Platform
Москва
Компания "2ГИС" О проекте 2GIS CDP – это внутренняя Customer Data Platform, лежащая в основе стратегии развития всего 2ГИС на ближайшие...
Вакансия размещена в отрасли