Data Scientist (NLP|LLM)
21 Апреля 2026
Город:
Москва
Занятость:
Полная занятость
Компания "СберЗдоровье"
СберЗдоровье - аккредитованная IT-компания, крупнейшая в России Digital Health платформа, объединяющая различные сервисы цифровой медицины.
Сервис начал свою работу в 2012 году под брендом DocDoc. Мы помогли миллионам людей получить помощь и продолжаем повышать качество медицинских услуг.
Об IT в цифрах:
3 бизнес-направления;
20+ команд;
380+ IT специалистов (devops, AQA, web/mobile devs, backend devs, аналитики, архитекторы и др.) из 40+ городов.
Чтобы эти цифры стали выше, а наши пользователи — счастливей, мы ищем NLP|LLM Data Scientist в команду медицинского AI
Что будешь делать?
- Проектировать и поддерживать полный цикл улучшения медицинских LLM: сбор, очистка, версионирование данных, обучение и дообучение (SFT, preference-tuning, DPO/ORPO, instruction tuning).
- Строить датасеты и контуры разметки: схемы и гайдлайны, контроль согласованности, генерация синтетических данных, self-training, анализ ошибок и bias.
- Разрабатывать LLM-based пайплайны и агентов для медицинских задач: RAG по клиническим рекомендациям и справочникам, tool-calling, маршрутизация, multi-step workflows, оркестрация (LangGraph и мультиагентные фреймворки), guardrails.
- Создавать и развивать систему оценивания: тест-наборы и бенчмарки, автоматические метрики и LLM-as-a-judge там, где уместно, экспертная валидация с врачами, red-teaming, регрессионные прогоны, A/B тестирование в проде.
- Проводить исследовательские итерации: формулировать гипотезы, ставить эксперименты, делать ablation-исследования, документировать результаты, готовить научные статьи и доводить материалы до публикации.
Необходимые технические навыки:
- 3+ лет в NLP/ML, уверенный Python: типизация, тестирование, профилирование, аккуратный продакшн-код.
- Практический опыт обучения и дообучения трансформеров: PyTorch + HuggingFace, понимание Accelerate, DeepSpeed или аналогов.
- Опыт построения data-pipelines и воспроизводимых экспериментов: датасеты, версии, конфиги, трекинг (MLflow или ClearML), умение делать корректные сравнения.
- Понимание LLM-систем: retrieval, tool-calling, агенты, деградации качества, галлюцинации, ограничения продакшна.
- Навыки оценки качества: метрики, бенчмарки, error analysis, ablations, работа с разметкой и экспертной валидацией.
Будет плюсом
- Опыт в медицине или биомеде: клинические тексты, ICD-10, клин. рекомендации, понимание доменных рисков.
- Опыт alignment: preference data, RLHF, DPO, safety eval, hallucination mitigation.
- Практика продакшн-инференса: vLLM, оптимизация стоимости и задержки, Docker, K8s, мониторинг, трассировка.
- Опыт с retrieval-стеком: hybrid search, rerankers, FAISS, Elastic, pgvector, продуманноеchunking, grounding.
Что мы можем предложить:
- Сильную команду профессионалов, увлеченных своим делом;
-
Возможность развития в команде ведущей MedTech-компании России;
-
Уютный офис в Сити с панорамным видом на город, гибридный формат работы;
-
Корпоративную технику;
- Медицинскую программу, включающую телемедицинские консультации, очные приёмы в клиниках, психологов, стоматологию, лабораторные и инструментальные диагностики;
- Оплачиваемые курсы английского языка;
- Поддерживаем активный образ жизни — выбирай виды спорта по душе (корпоративные занятия сквошем, бегом, футболом в Москве и компенсация твоего спортивного абонемента);
- СберУниверситет и оплату профильного обучения и курсов.
Зарегистрируйтесь или войдите, чтобы открыть контакты работодателя
Прикрепите резюме для отклика
Уже с нами?
Войдите, чтобы отправить резюме
09 Апреля
Москва
Компания "Спортлевел" Привет, мы Спортлевел! IT компания в области SportTech, мы разрабатываем и предоставляем передовые спортивные технологии...
09 Апреля
Senior Data Scientist( Группа компаний С7 )
Москва
Компания "Группа компаний С7" S7 TechLab – IT компания, реализующая инновационные IT продукты для подразделений группы компаний S7. Собственная...
09 Апреля
Москва
Компания "SSP SOFTWARE" Привет! Мы ищем в команду Data-аналитика (Middle+/Senior ). ⠀ Для нас привлекательны следующие знания и опыт:...
09 Апреля
Data Engineer (Kandinsky)( Сбербанк )
Москва
Компания "Сбербанк" Ищем талантливых специалистов в команду Управления базовых моделей Kandinsky. Kandinsky — линейка моделей для генерации...
09 Апреля
Москва
Компания "Сбербанк" Мы — команда, создающая инновационные решения на базе больших языковых моделей (LLM) для трансформации процессов работы с...
Вакансия размещена в отрасли