Lead Data Scientist( Сбербанк )

29 Ноября

Партнерские Вакансии

Город:

Москва

Занятость:

Полная занятость

Опыт:

Более 6 лет

Компания "Сбербанк"

Наша команда занимается созданием инструментов и решений для внутренней безопасности на базе AI: разработка и развитие AI-агентов, запуск локальных инстансов LLM и их файнтюнинг.

Наши планы имеют широкий спектр - начиная от разработки DL-моделей для скоринга, поведенческого моделирования и заканчивая AI-агентами.

Сейчас мы ищем опытного Team Lead DS, обладающего глубокими знаниями в разработке AI-решений и опытом руководства командой специалистов в сфере анализа данных и машинного обучения (ML).

Обязанности

  • Разработка и реализация обучение DL-моделей классификации, кластеризации, прогнозирования, построение ансамблей моделей.
  • Визуализация и интерпретации предикта моделей
  • Разработка AI-агентов и мультиагентских систем, создание Retrieval Augmented Generation (RAG), Function Calling и пр.
  • Управление проектированием и разработкой высоконагруженных мультиагентных систем.
  • Управление жизненным циклом ML-моделей: проектирование, обучение, деплоймент, мониторинг производительности и оптимизацию процессов (MLOps).
  • Дообучение и адаптация больших языковых моделей (LLM) под специфику бизнеса: файнтюнинг, применение подходов PEFT (LoRA, QLoRA, AdaLoRA), SFT.
  • Подготовка и внедрение механизмов мониторинга качества моделей, улучшение метрик их эффективности.
  • Поддержка действующих ML-моделей, их постоянное совершенствование и настройка на основе изменения внешних факторов и потребностей бизнеса.
  • Управление DS-командой, взаимодействие с владельцами продуктов и другими командами

Требования

  • Опыт работы в области машинного обучения от 5 лет.
  • Опыт работы с Deep Learning в CV, NLP, RL и других областях. Глубокие знания архитектур DL-нейронных сетей: CNN (ResNet, EfficientNet), RNN/LSTM/GRU, Transformers (BERT, GPT, ViT), GAN, Diffusion Models.
  • Владение различными методами обучения нейронных сетей: Incremental learning, Self-Supervised Learning, Contrastive Learning и т.п.
  • Экспертное понимание алгоритмов оптимизации (SGD с Momentum, Adam, AdamW, RMSProp, LAMB и пр.), знание продвинутых стратегий обучения: Learning Rate Scheduling (Cosine Annealing, Cyclical LR, Warmup), Gradient Clipping, Mixed Precision Training (FP16/BF16).
  • Опыт работы с методами нормализации: Batch Normalization, Layer Normalization, Group Normalization, RMSNorm, AdaLN.
  • Свободное владение PyTorch на уровне тензоров, самостоятельная реализация NLP-моделей, Трансформеров, Аттеншен-слоев и подобного через тензоры, а не только использование готовых библиотек с HuggingFace.
  • Свободное владение классическим ML: линейная/логистическая регрессия, SVM, Random Forest, Gradient Boosting (XGBoost/LightGBM), k-NN, Naive Bayes, PCA, k-means, DBSCAN, GMM, HMM.
  • Опыт успешного создания и развертывания AI-агентов с использование фреймвороков GigaChain, LangChain или аналогичных инструментариях.
  • Экспертные знания техник Prompt Engineering, структурированных выходов и использования, вызова инструментов (Function Calling).
  • Практический опыт в реализации Retrieval Augmented Generation (RAG) и понимание преимуществ данного метода.
  • Обучение и файнтюнинг NLP моделей (SSL, SFT, PEFT): BERT, RoBERTa, XLNet, LLaMA), в том числе и самостоятельная разработка обучения на PyTorch.
  • Опыт настройки и эксплуатации локальных инсталляций LLM и понимание различий между ними (LLaMA, Qwen, DeepSeek и др.).
  • Навык командной работы и способность эффективно взаимодействовать с кросс-функциональными группами разработчиков, аналитиков и инженеров.
  • Владение инструментами CI/CD, облачными инфраструктурами и контейнеризацией приложений
  • Преимуществом будет знание и опыт работы в рамках фреймворка Scrum.
  • Высокая продуктивность и умение быстро осваивать новые направления и подходы.
  • Способность брать ответственность за принятые решения и стремление к постоянному развитию профессиональных навыков.

Используемые технологии:

  • Backend: Python, Spring Framework (IoC/DI, beans), Hibernate, REST
  • Data: Postgres, Hadoop, ElasticSearch, Ignite
  • ETL: Spark, Scala, Python, AirFlow, Zeppelin, Kafka
  • CI/CD: Docker, OpenShift/K8s, Jenkins, Ansible, Nexus, BitBucket

Условия

  • Гибридный формат работы (Кутузовский проспект 32)
  • Официальное оформление по Трудовому кодексу РФ.
  • Полностью белая зарплата плюс ежегодная премия.
  • Возможность профессионального роста и корпоративного обучения.
  • Корпоративное медицинское страхование и дополнительные льготы сотрудникам.
  • Программы поддержки здоровья семьи сотрудника.
  • Дополнительные выплаты в экстренных жизненных ситуациях.
  • Привилегированные условия кредитования.
  • Специальные скидки и акции от партнёров компании (спортивные занятия, страховка, путешествия).
Похожие вакансии

02 Декабря

Data Scientist (Sberspace)

Москва

Компания "SberTech" Команда Sberspace ищет Data Scientist для работы над проектом по созданию поискового AI-ассистента, который поможет...

Отправить резюме подробнее

02 Декабря

Middle Data Scientist (команда Персонализации коммуникаций от потребности клиента)

Москва

Компания "Сбербанк" Наша команда исследует инновационный подход к работе с клиентами. Это поиск знания о жизненных ситуациях и потребностях...

Отправить резюме подробнее

02 Декабря

Middle Computer vision engineer( Сбербанк )

Москва

Компания "Сбербанк" Находимся в поиске разработчика в команду компьютерного зрения. Команда занимается обучением моделей для безопасного отдыха...

Отправить резюме подробнее

02 Декабря

Data аналитик( Сбербанк )

Москва

Компания "Сбербанк" Мы – команда Дирекции инжиниринговых услуг. Наша команда занимается банковским сопровождением инвестиционных проектов и...

Отправить резюме подробнее

29 Ноября

Middle/Senior Data Scientist (Time series)

Москва

Компания "Сбербанк" Команда ценообразования для Кредитов ЮЛ. Проекты: Индивидуальные модели эластичности клиентов к ставке по вкладам (...

Отправить резюме подробнее

Вакансия размещена в отрасли

Банки / Инвестиции / Лизинг: