Data Scientist (SberWorks)
28 Апреля 2026
Город:
Москва
Занятость:
Полная занятость
Компания "SberTech"
Мы – быстроразвивающаяся и очень дружная команда, которая занимается обеспечением безопасности данных в группе компаний Сбер.
В частности, сканированием баз данных на наличие персональных данных с применением комбинированного подхода из ML-моделей и стандартных программных средств, обезличиванием этих данных и подтверждением безопасного статуса исследуемой базы данных.
Наши задачи:
- Решаем вопросы определения чувствительных данных, ищем закономерности в структурах данных, проверяем гипотезы
- Готовим данные для всех этапов обучения моделей (в т.ч. LLM);
- Организуем всю разметку для своих моделей
- Проводим различные эксперименты для обучения моделей
- Проектируем и реализуем новые решения на базе ML/LLM для решения поставленных задач.
Обязанности:
- выстраивание стратегии по DS-части продуктов, развитие архитектуры ML-модели продуктов
- определение требований к перечню, объему и качеству данных, необходимых для решения бизнес-задач
- тестирование, анализ и ранжирование сильных и слабых сторон различных моделей и конкретного решения
- оценка как полученное решение достигает поставленных целей
- участие в разработке решения на основе GigaChat, LLAMA2
- организация процесса мониторинга качества LLM
- взаимодействие с другими участниками команды для совместной работы (проверки гипотез, исследований, внедрения)
- внедрение успешных гипотез/моделей в промышленную эксплуатацию
- следить за последними исследованиями и инновациями в области языковых моделей и применять их на практике.
Требования:
- опыт работы в области DS от 3-х лет
- знания в области теории вероятностей, статистики, оптимизации, численных методов
- хорошие навыки программирования, знание Python, SQL
- свободное владение основными DS библиотеками на Python, опыт применения алгоритмов машинного обучения, понимание их преимуществ, недостатков и ограничений
- знание методов классического NLP, навыки Prompt Engineering
- опыт работы с LLM-моделями (LLama, ChatGPT, GigaChat) и библиотеками LLM разработки LangChain, GigaChain
- уметь адаптировать в in-house формате доступные на рынке open source LLM-модели под задачи компании.
Мы предлагаем:
- гибридный формат работы(
- годовой бонус и ежегодный пересмотр зарплаты
- статус аккредитованной ИТ-компании со всеми преимуществами
- расширенный ДМС с первого дня и льготное страхование для семьи
- корпоративный университет Сбера, внутренняя образовательная платформа, участие в IT-конференциях
- офис с видом на набережную, зонами отдыха и спортзалом
- 90 дней удаленной работы
- льготная ипотека в Сбере, подписка СберПрайм+, скидки от партнеров и сервисов группы компаний.
Зарегистрируйтесь или войдите, чтобы открыть контакты работодателя
Прикрепите резюме для отклика
Уже с нами?
Войдите, чтобы отправить резюме
28 Апреля
Junior/Middle Data Scientist (Classic ML / LLM)( Сбербанк )
Москва
Компания "Сбербанк" Наша команда занимается независимой оценкой и контролем за моделями и AI-решениям Банка — от классических моделей и NLP до...
28 Апреля
Full-stack data specialist/Full-stack аналитик
Москва
Компания "Новый Ай Ти Проект" В нашу команду мы ищем Full-stack data specialist/ Full-stack аналитик Чем вы будете заниматься: Поддержка и...
28 Апреля
Data/Business analyst( Finstar Financial Group )
Москва
Компания "Finstar Financial Group" Finstar Financial Group – крупный международный холдинг, включающий в себя компании по всему миру. Наша...
28 Апреля
Senior Data Scientist (Центр розничного риск-моделирования)
Москва
Компания "Сбербанк" В Центр розничного риск-моделирования (Блока Риски) требуется Руководитель направления по исследованию данных Вы будете...
28 Апреля
Senior Data Engineer / ML Engineer (GigaChat)
Москва
Компания "Сбербанк" Наша команда отвечает за качество моделей Text-to-speech в GigaChat – той части нейросети, которая занимается звуком....
Вакансия размещена в отрасли