Компания "Сбербанк"
О проекте
Мы создаём самые сильные языковые модели в России и одни из самых больших в мире такие как GigaChat3 Ultra. Создание таких систем требует оптимизации архитектуры под GPU и решение проблем с масштабированием на кластера из тысяч видеокарт. Все это - нетривиальные инженерные вызовы, решение которых закладывается в следующие поколения наших моделей. У нас вы будете работать с современным набором видеокарт: NVIDIA B200/H100. Наш стек полностью интегрирован с PyTorch/TensorRT/ONNX и активно использует Triton, CUDA, CUTLASS и кастомные ядра для оптимизации: FlashAttention, PagedAttention, DeepEP, и др.
Среди наших достижений — реализация собственных ядер для распределённого обучения: асинхронный Expert & Tensor Parallel, а также Async Liger. Но хочется больше
Цель - снизить latency и увеличить throughput, оптимизировать новые архитектуры, делать их обучение экономически выгодным по сравнению с классическими LLM & MoE
Ключевые обязанности
Мы ожидаем, что вы
Условия
17 Декабря
Москва
Компания "X5 Tech" X5 Group - лидер офлайн- и онлайн-рынка продуктов питания. Мы управляем портфелем брендов сетевых магазинов «Пятёрочка»,...
17 Декабря
Москва
Компания "Продамус" Продамус — аккредитованная, продуктовая IT-компания, создающая цифровые сервисы для бизнеса. Мы разрабатываем...
17 Декабря
Жуковский
до 350 000 руб.
Компания "CORE" Наш клиент один из крупнейших сетей зоомагазинов и сервисов для заботы о питомцах в России. Для развития и поддержания...
17 Декабря
AI Lead / Head of AI Development (Platform AI)
Москва
от 400 000 до 600 000 руб.
Компания "Солвтех" О вакансии Мы развиваем промышленную цифровую платформу для поддержки инженерных и операционных решений в нефтегазовой и...
18 Декабря
Руководитель направления комиссионных и партнерских продуктов для премиальных клиентов( Экспобанк )
Москва
Компания "Экспобанк" АО «Экспобанк» - это современный частный российский банк. Успешно работает на рынке более 30 лет в сегменте крупного...