Компания "Spice Agency"
Сейчас мы в поиске опытного играющего тренера команды хранилища признаков для моделей машинного обучения, нам нужен человек с реальным опытом разработки и внедрения хранилища признаков на платформе больших данных (Big data стек), с использованием современного ML стека.
Чем предстоит заниматься
- Управлять командой из 6 экспертов Senior уровня (front-end, back-end, 4 DE);
- Отвечать за целепологание и контроль исполнения всех задач команды;
- Принимать участие в стратегических и тактических инициативах руководящей команды;
- Транслировать бизнес требования\задачи на технические задачи, распределять их в команде;
- Разработка архитектуры хранилища признаков для моделей машинного обучения.
- Разработка ETL\ELT на Apache Spark, Apache Spark Structured streaming\Flink
- Оптимизировать процессы хранения и обработки данных с использованием современных технологий и подходов.
Что ожидаем от тебя
- Опыт коммерческой разработки от 5 лет, опыт управления командой от 2-х лет;
- Опыт работы с Feast, Hopsworks, Tecton или аналогичные (Feature Store).
- Машинное обучение:
- Понимание принципов работы моделей машинного обучения: работа с признаками (feature engineering), валидация данных, подготовка и трансформация данных.
- Опыт работы с Big Data технологиями:
- Уверенное владение инструментами обработки больших данных: Apache Spark, Hadoop, Apache Kafka, HDFS;
- Знание фреймворков и библиотек для работы с распределенными вычислениями (Spark MLlib, Dask, Ray);
- Опыт с системами потоковой обработки данных\streaming (Apache Flink, Kafka Streams, Flink SQL).
- Навыки работы с базами данных:
- Глубокие знания работы с NoSQL базами данных (Redis, Taranatool);
- Знания реляционных баз данных на больших объемах данных (PostgreSQL).
- Инженерия данных и API:
- Опыт создания API для интеграции Feature Store с другими системами и ML платформами;
- Понимание архитектуры распределенных систем и микросервисов.
- Основной ЯП Python, Scala.
Будет плюсом:
- Опыт с системами MLOps для автоматизации, мониторинга и управления моделями (например MLflow, Kubeflow).
Что готовы предложить
- Оформление по ТК РФ: оклад (готовы обсуждать)+ годовой бонус;
- Компания входит в реестр ИТ компаний;
- Удаленный формат работы. При желании можно работать в офисе класса А (г. Москва, м. Павелецкая, Шлюзовая набережная, 4, 6 минут от метро пешком);
- ДМС со стоматологией (с 1 рабочего дня + полис путешественника);
- Частичная компенсация фитнеса / обучения / доп. мед. услуг (лимит-25 тыс. рублей в год).
Как мы проводим собеседования:
- 15-20 минут - общение с рекрутером (tg аудио);
- 90 минут - техническое интервью
- 45 минут - финальная встреча
- СБ, 1-3 дня
- Оффер, обсуждение даты выхода на работу.