Компания "Яндекс"
Яндекс — одна из немногих компаний в мире, оперирующих эксабайтами данных, которые нужно эффективно хранить, обрабатывать и передавать между различными системами. Для решения этих задач мы создали и развиваем распределённую платформу хранения и обработки данных YTsaurus. Практически каждый сервис Яндекса использует её. Недавно мы выложили код платформы в открытый доступ.
Одной из важных частей YTsaurus является SPYT — Apache Spark в качестве compute-движка поверх данных в YTsaurus. SPYT активно используют внешние и внутренние сервисы (например, для запуска ETL-процессов и ad-hoc-аналитики).
Отличительная особенность SPYT — глубокая интеграция между Apache Spark и YTsaurus, которая позволяет учитывать метаданные для эффективной обработки. Так, SPYT поддерживает транзакции YTsaurus и применяет знание о сортировке таблиц для исключения shuffle-фазы при выполнении операции JOIN. Помимо этого, SPYT использует YTsaurus в качестве среды исполнения для запуска кластеров Spark в облачной манере, благодаря чему в YTsaurus одновременно могут работать десятки кластеров SPYT. Подробнее об этом мы рассказывали на HighLoad++.
Мы ищем технического менеджера, который поможет нам развивать SPYT и будет заниматься сложными и амбициозными задачами. Примеры вызовов, которые стоят перед нами:
Мы — команда увлечённых людей, любим вызовы и готовы делиться знаниями. Приходите, если вам интересно развивать высоконагруженный инфраструктурный сервис и популяризовать YTsaurus как опенсорс-продукт.
Какие задачи вас ждут
Взаимодействие с пользователями
Вам предстоит много общаться с внутренними и внешними пользователями, участвовать в формировании лучших практик использования инфраструктуры. Нужно будет работать над снижением порога входа и развивать комьюнити вокруг YTsaurus и, в частности, вокруг SPYT.
Технические вызовы
Вы будете вести внутренние инфраструктурные проекты и участвовать в интеграционных проектах вместе с несколькими командами разработки, эксплуатации и тестирования. Например, работать над оптимизациями в SPYT и добиваться лучших показателей, чем ванильный Apache Spark.
Выстраивание рабочих процессов
Вам нужно будет сотрудничать с разработчиками других инфраструктурных сервисов, критически анализировать существующие рабочие процессы, находить проблемные места, предлагать и внедрять улучшения. Например, организовывать регулярный процесс обновления версии Apache Spark.
Мы ждем, что вы
26 Ноября
Менеджер по продукту( Университет СИНЕРГИЯ )
Москва
Компания "Университет СИНЕРГИЯ" В ПРОЦЕССЕ РАБОТЫ НЕОБХОДИМО Согласование беклога разработки на 2025 год Поэтапный план доработок на...
26 Ноября
Менеджер проекта( Университет СИНЕРГИЯ )
Москва
до 75 000 руб.
Компания "Университет СИНЕРГИЯ" В процессе работы необходимо Планирование проекта: определение целей, задач и сроков выполнения, а также...
26 Ноября
Менеджер по продукту ЕГЭ( Университет СИНЕРГИЯ )
Москва
Компания "Университет СИНЕРГИЯ" В ПРОЦЕССЕ РАБОТЫ НЕОБХОДИМО Работать с продуктами подготовки к экзаменам Анализировать текущие тренды...
26 Ноября
Москва
от 80 000 руб.
Компания "Авакс" Компания Авакс является одним из лидеров на рынке по продажам инновационной электроники и бытовой потребительской техники....
26 Ноября
Москва
от 180 000 до 200 000 руб.
Компания "СИРИУС" Торгово- производственная компания, работает на рынке с 2006 года, пройдя путь от поставок кабеля, к открытию собственных...