Стажер Data Engineer (SberAI)
12 Декабря 2025
Город:
Москва
Занятость:
Полная занятость
Компания "Сбербанк"
Мы занимаемся построением и поддержкой надежных data-процессов, которые лежат в основе аналитики и машинного обучения. Вам предстоит работать с полным циклом данных: от их сбора и очистки до организации pipelines и обеспечения их качества.
Обязанности
- Разработка и поддержка парсеров (scrapers) и краулеров (crawlers) для сбора данных из веб-источников с использованием Scrapy , Selenium , BeautifulSoup
- Интеграция со сторонними сервисами и платформами через REST API.
- Организация надежного и эффективного процесса сбора данных с учетом политик сайтов
- Реализация процессов создания векторных эмбеддингов (embeddings) для текстовых и других типов данных
- Интеграция и настройка векторных баз данных (например, на основе pgvector для PostgreSQL) или специализированных решений (Weaviate, Qdrant, Milvus)
- Разработка и оптимизация pipelines для семантического / векторного поиска (vector search)
- Препроцессинг данных: очистка, нормализация, обработка пропусков, преобразование форматов
- Участие в создании и отборе признаков (feature engineering) для последующего использования в ML-моделях.
Требования
- Хорошее знание Python 3.12 и опыт написания скриптов на Bash
- Понимание принципов работы контейнеризации (Docker) и основ микросервисной архитектуры
- Опыт в веб-скрапинге или работе с API
- Опыт работы с системами контроля версий (Git)
- Понимание принципов построения CI/CD пайплайнов
- Базовые знания в области машинного обучения и больших языковых моделей (ML/LLM), чтобы понимать контекст использования данных.
Условия
- Комфортный современный офис рядом с м. Кутузовская
- Гибридный формат работы
- Корпоративный спортзал и зоны отдыха
- Более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
- Программа адаптации и помощь руководителя на старте.
Зарегистрируйтесь или войдите, чтобы открыть контакты работодателя
Прикрепите резюме для отклика
Уже с нами?
Войдите, чтобы отправить резюме
11 Декабря
Персональный менеджер-стажер ЮНИОР (м.Первомайская)
Москва
Компания "Банк ВТБ (ПАО)" В рамках стажировки Вас ждет работа с корпоративными клиентами и банковскими продуктами для юридических лиц....
11 Декабря
Data-аналитик в финансах (продукты для физических лиц)
Москва
Компания "Сбербанк" Команда управления структуры продуктов банковской книги запускает стратегический проект по созданию комплексной...
11 Декабря
Портфельный аналитик (Risk Data Analyst)
Москва
Компания "Тинькофф" Ищем опытных аналитиков, которые будут работать с рисковой стратегией принятия решений по нашим банковским продуктам...
11 Декабря
NLP engineer (GigaChat Pretrain Data)
Москва
Компания "Сбербанк" Мы - команда GigaChat Pretrain Data, готовим pretrain данные для GigaChat и GigaChat Vision. Pretrain данные - это...
11 Декабря
Стажер бизнес-аналитик( Галс Управление активами )
Москва
от 25 000 до 50 000 руб.
Компания "Галс Управление активами" Ты студент или выпускник ВУЗа и можешь работать от 20 до 40 часов в неделю? Прими участие в программе...
Вакансия размещена в отрасли