Компания "Сбербанк"
Наша команда отвечает за эффективность обучения моделей GigaChat: от pretraining с нуля до масштабных online RL / RLHF экспериментов. Мы строим инфраструктуру, которая позволяет проводить large-scale обучение на больших MoE-моделях, добиваясь предельной эффективности использования кластера. Работаем на всех уровнях стека: от CUDA/Triton-ядер и низкоуровневых оптимизаций до распределённого обучения и ускорения инференса.
Цель — снизить стоимость и длительность обучения, сократить time-to-feedback по экспериментам, повысить стабильность и производительность пайплайна, сделать обучение новых/экспериментальных архитектур максимально эффективным и предсказуемым.
23 Марта
Москва
Компания "Страховая компания «Сбербанк страхование»" Мы в поиске специалиста по Data Science, который будет внедрять современные ML и AI решений...
24 Марта
Data Engineer в Платформу данных Yandex Cloud
Москва
Компания "Яндекс" Платформа данных — ключевой дифференциатор Yandex Cloud как облачного провайдера в России. Это набор облачных сервисов,...
25 Марта
Старший бизнес-аналитик в Back Office/Senior Business Analyst (Back Office)( EMEX )
Москва
Компания "EMEX" EMEX — компания с большой и интересной историей, один из первых маркетплейсов на рынке РФ. Cейчас EMEX — международный...
26 Марта
Москва
Компания "Сбербанк" Команда Блока «Сеть Продаж» в поиске Дата-инженера. Мы разрабатываем и внедряем end-to-end решения на основе больших...
25 Марта
Senior Key Account Manager (KAM) в IT компанию
Москва
от 180 000 руб.
Компания "Смартвэй" Smartway — аккредитованная компания-разработчик собственного онлайн-сервиса для бронирования командировок с 10-летней...
Вакансия размещена в отрасли