Data Scientist в ML-сервисы Yandex Cloud
09 Февраля 2026
Город:
Москва
Занятость:
Полная занятость
Компания "Яндекс"
Наша команда разрабатывает ML-сервисы Yandex SpeechKit, OCR и Vision, Translate, YandexGPT, Alice AI и инструменты, которые помогают специалистам по Data Science обучать нейросетевые модели на десятках терабайт данных и сотнях GPU, контролировать эксплуатацию этих моделей в облаке и в контуре клиента.
Помимо этих базовых ML-технологий, мы сами разрабатываем и продукты поверх них. Например, Realtime API (для speech-to-speech голосовых помощников), AI Search (платформу для построения раг-решений), SpeechSense (платформу речевой аналитики).
Мы ищем специалиста по Data Science и аналитике.
Какие задачи вас ждут:
- Анализировать пользовательский опыт и строить метрики и процессы оценки качества ML-сервисов и продуктов
Чтобы улучшать качество наших моделей и продуктов, понимать их сильные и слабые места и приоритизировать планы разработки новой функциональности, необходима качественная и количественная аналитика. Без метрик и приборов, которые покажут, куда необходимо двигаться, жить нельзя — и вы поможете нам строить такие приборы и процессы их регулярного обновления.
- Строить процессы разметки данных для обучения ML-моделей
Один из ключевых факторов, влияющих на качество ML-моделей, — это данные для обучения. Вы будете разрабатывать процессы сбора и разметки данных, оценивать и улучшать качество процессов. Примеры задач: разметка данных для распознавания речи на узбекском языке; сбор обучающих данных для задач текстовой классификации.
- Помогать проверять продуктовые гипотезы
Мы не только разрабатываем модели, но и помогаем внедрять их в продукты. При внедрении возникает множество гипотез о том, что и как можно сделать с помощью моделей. Для проверки гипотез часто требуется разработать и проанализировать прототип, выбрать лучший вариант решения задачи. Вы поможете менеджерам продукта и разработчикам строить прототипы и изучать варианты технических решений. Пример задачи: анализ разных алгоритмов кластеризации текстов на основе GPT.
Мы ждем, что вы:
- Пишете на Python
- Хорошо знаете статистику
- Разбираетесь в современных методах ML и NLP
- Обрабатывали и анализировали большие объёмы данных с помощью pandas, SQL, статистических пакетов, библиотек для визуализации данных, Spark SQL, Spark, Hadoop
- Работали с системами контроля версий, например с Git
Будет плюсом, если вы:
- Работали с DataLens
- Работали с краудсорсингом (Яндекс Толокой, Яндекс Заданиями)
Зарегистрируйтесь или войдите, чтобы открыть контакты работодателя
Прикрепите резюме для отклика
Уже с нами?
Войдите, чтобы отправить резюме
18 Февраля
Менеджер по работе с корпоративными клиентами сервиса (м. Котельники)
Москва
до 120 000 руб.
Компания "АВТОМИР, ГК" Группа компаний АВТОМИР - это один из крупнейших официальных дилеров на российском автомобильном рынке. На протяжении 32...
18 Февраля
Инженер-технолог( Всм-Сервис )
Москва
Компания "Всм-Сервис" Привет! Мы — команда «ВСМ-Сервис» Наша работа — это забота о безопасности и комфорте тысяч пассажиров по всей России ....
18 Февраля
Senior Data Engineer [Trust & Safety]
Москва
Компания "WILDBERRIES" Объединённая компания Wildberries и Russ — это международная технологическая компания, образованная в результате...
18 Февраля
Москва
от 350 000 до 380 000 руб.
Компания "ArtVolkov.ru" Мы усиливаем Data Team и ищем еще одного Data Engineer’а. Сейчас в команде несколько человек, и пара инженеров...
19 Февраля
Data Engineer( Ак Барс Цифровые Технологии )
Москва
Компания "Ак Барс Цифровые Технологии" Чем нужно будет заниматься: разработка ETL\ELT процессов; разработка витрин данных; написание...
Вакансия размещена в отрасли