Technical Lead CUDA/Triton Kernel Development для LLM Acceleration

11 Декабря

Партнерские Вакансии

Город:

Москва

Занятость:

Полная занятость

Компания "Сбербанк"

О проекте
Мы создаём самые сильные языковые модели в России и одни из самых больших в мире такие как GigaChat3 Ultra. Создание таких систем требует оптимизации архитектуры под GPU и решение проблем с масштабированием на кластера из тысяч видеокарт. Все это - нетривиальные инженерные вызовы, решение которых закладывается в следующие поколения наших моделей. У нас вы будете работать с современным набором видеокарт: NVIDIA B200/H100. Наш стек полностью интегрирован с PyTorch/TensorRT/ONNX и активно использует Triton, CUDA, CUTLASS и кастомные ядра для оптимизации: FlashAttention, PagedAttention, DeepEP, и др.

Среди наших достижений — реализация собственных ядер для распределённого обучения: асинхронный Expert & Tensor Parallel, а также Async Liger. Но хочется больше

Цель - снизить latency и увеличить throughput, оптимизировать новые архитектуры, делать их обучение экономически выгодным по сравнению с классическими LLM & MoE

Ключевые обязанности

  • Лидировать направление по разработке и оптимизации CUDA/Triton-ядер для LLM
  • Тесно взаимодействовать с ML-инженерами и research-командами для понимания workload’ов и bottleneck’ов (например: multinode inference, sparse attention, mixture-of-experts, long-context inference).
  • Участвовать в open-source инициативах (возможно — форки/патчи в Triton, upstream в PyTorch/TensorRT/SGLang).

Мы ожидаем, что вы

  • Имеете 5+ лет опыта в low-level GPU программировании (CUDA C++, PTX/SASS, shared memory/coalescing/warp-shuffle, async memcpy, stream management).
  • Глубоко понимаете архитектуру NVIDIA GPU (Tensor Cores, warp execution, occupancy, L2 cache hierarchy) и умеете профилировать через Nsight.
  • Владеете Triton (или готовы освоить быстро) и понимаете его trade-offs vs чистая CUDA.
  • Есть опыт работы с современными фреймворками: PyTorch (custom ops, torch.compile), TensorRT (plugins), возможно — SGLang.
  • Имеете опыт управления технической командой (2+ лет как lead/tech lead)

Условия

  • Формат работы - удиленный или гибрид на выбор из любого города РФ
  • Ежегодный пересмотр зарплаты годовая премия
  • Зоны отдыха
  • Более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
  • Программа адаптации и помощь руководителя на старте (для стартовых позиций)
  • Расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
  • Ипотека для сотрудников выгоднее до 7%
  • Бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
  • Вознаграждение за рекомендацию друзей в команду Сбера
Похожие вакансии

17 Декабря

Lead Java/Kotlin

Москва

Компания "X5 Tech" X5 Group - лидер офлайн- и онлайн-рынка продуктов питания. Мы управляем портфелем брендов сетевых магазинов «Пятёрочка»,...

Отправить резюме подробнее

17 Декабря

Technical Product (FinTech)

Москва

Компания "Продамус" Продамус — аккредитованная, продуктовая IT-компания, создающая цифровые сервисы для бизнеса. Мы разрабатываем...

Отправить резюме подробнее

17 Декабря

PHP-разработчик (Senior\Lead)

Жуковский

до 350 000 руб.

Компания "CORE" Наш клиент один из крупнейших сетей зоомагазинов и сервисов для заботы о питомцах в России. Для развития и поддержания...

Отправить резюме подробнее

17 Декабря

AI Lead / Head of AI Development (Platform AI)

Москва

от 400 000 до 600 000 руб.

Компания "Солвтех" О вакансии Мы развиваем промышленную цифровую платформу для поддержки инженерных и операционных решений в нефтегазовой и...

Отправить резюме подробнее

18 Декабря

Руководитель направления комиссионных и партнерских продуктов для премиальных клиентов( Экспобанк )

Москва

Компания "Экспобанк" АО «Экспобанк» - это современный частный российский банк. Успешно работает на рынке более 30 лет в сегменте крупного...

Отправить резюме подробнее

Вакансия размещена в отрасли

Информационные технологии / IT / Интернет: