Inference Engineer

12 Января

Партнерские Вакансии

Город:

Москва

Занятость:

Полная занятость

Компания "Star-staff"

Ищем Inference инженера в международную продуктовую AI-компанию, которая уже более 4 лет разрабатывает приложение для редактирования фото и видео на базе компьютерного зрения и искусственного интеллекта. Продукт активно растёт, используется пользователями в США и Европе, а команда работает над тем, чтобы сложные AI-модели работали быстро и стабильно в реальном продукте.

Чем предстоит заниматься:

  • Оптимизировать инференс нейросетей в продакшене: искать узкие места, измерять производительность, ускорять работу моделей

  • Адаптировать и оптимизировать модели для запуска на мобильных устройствах (latency, потребление памяти, батарея, стабильность)

  • Улучшать серверный инференс: повышать пропускную способность и снижать стоимость вычислений

  • Работать совместно с ML-исследователями над архитектурой моделей с учётом их эффективности в реальном использовании

  • Внедрять готовые решения и, при необходимости, разрабатывать кастомные оптимизации под конкретные сценарии

Кого мы ищем:

  • Коммерческий опыт оптимизации инференса нейросетей (mobile / edge / server)

  • Глубокий практический опыт хотя бы с одним из инструментов: Core ML / TFLite / ONNX Runtime / TensorRT или низкоуровневые технологии: Metal / Vulkan / OpenCL / OpenGL / CUDA / Triton

  • Понимание архитектуры GPU / NPU и принципов их работы

  • Опыт применения техник оптимизации инференса.

  • Будет плюсом: Опыт on-device inference (особенно iOS), опыт работы с моделями компьютерного зрения (фото / видео)

Что предлагает компания:

  • Гибридный график работы в Тбилиси (помощь по релокации предоставляется);

  • Конкурентный доход (вилка обсуждается индивидуально);

  • Возможность работать с реальными AI-продуктами, которые используются сотнями тысяч пользователей ($50M ARR and 250K+ пользователей);

  • Работа в сильной инженерной команде в быстрорастущем стартапе, сотрудники компании имели опыт работы в топ-компаниях отрасли, таких как Lensa, Picsart, Viber, AIRI, Yandex.

Похожие вакансии

10 Января

Web SRE/Site Reliability Engineer

Москва

Компания "ДДОС ГВАРД" Привет! Мы — DDoS-Guard. С 2011 года защищаем бизнес от DDoS-атак, ускоряем доставку контента и обеспечиваем надежный...

Отправить резюме подробнее

10 Января

Senior Data Engineer( РСХБ-Интех )

Москва

Компания "РСХБ-Интех" В связи с активным расширением команды мы в поисках Senior Data Engineer в Лабораторию искусственного интеллекта. ЧЕМ...

Отправить резюме подробнее

10 Января

Lead Backend Engineer

Москва

от 300 000 руб.

Компания "UP business" Наш клиент — технологическая компания, создающая масштабируемые системы для крупных корпоративных клиентов в сфере...

Отправить резюме подробнее

10 Января

Стажер QA-engineer

Москва

Компания "NOVATEST" Всем привет! Мы запускаем стажировку на вакансию "QA-engineer". После ее успешного прохождения, у тебя есть реальная...

Отправить резюме подробнее

10 Января

Data Engineer, Ozon Fresh

Москва

Компания "Ozon" Мы ищем математика-разработчика в группу товародвижения в отдел Data Science. Команда поддерживает и развивает проект...

Отправить резюме подробнее

Вакансия размещена в отрасли

Информационные технологии / IT / Интернет: