AI/LLM Engineer (Кипр) (в архиве)

29 Января

Партнерские Вакансии

Город:

Москва

Занятость:

Полная занятость

Компания "Selecty"

Наш клиент - ведущий дистрибьютор продуктов и решений в области информационных и коммуникационных технологий.

Локация: Кипр (обязательная релокация)

Формат работы:

  • Офис или гибридный формат - три удалённых рабочих дня и два дня в офисе (вторник и четверг). Офис в Лимассоле

О позиции:

Компания создает новую платформу автоматизации для внутреннего использования, которая объединяет бизнес-процессы, AI-модели и внутренние системы. Нам необходимо разработать внутреннюю AI-платформу на базе самостоятельно размещённых (self-hosted) LLM-моделей.

Мы ищем AI/LLM инженера, который будет разворачивать модели локально или в гибридной среде, строить API-слой для взаимодействия с ними и интегрировать их с нашими автоматизированными workflow (n8n) и внутренними инструментами.

Вы будете работать над производительностью моделей, пайплайнами извлечения данных (RAG) и обеспечением безопасной обработки внутренних корпоративных данных.

Обязанности:

  • Развёртывание и оптимизация локальных LLM-моделей (Llama, Qwen, Mistral и др.).

  • Разработка API-эндпоинтов (FastAPI/REST) для взаимодействия с моделями.

  • Создание и поддержка RAG-пайплайнов: эмбеддинги, чанкинг, векторный поиск.

  • Работа с векторными базами данных (Chroma, Milvus, Faiss, Qdrant).

  • Интеграция AI-сервисов с автоматизацией в n8n.

  • Настройка промптов и поведения моделей для повышения качества ответов.

  • Мониторинг производительности моделей, задержек и использования ресурсов.

  • Обеспечение безопасной и конфиденциальной обработки внутренних данных.


Требования:

  • Llama / Qwen / Mistral, Python, FastAPI, векторные БД.

  • Опыт работы в ML/AI-инжиниринге от 3 лет.

  • Практический опыт развёртывания и инференса LLM-моделей.

  • Уверенные знания Python и опыт работы с FastAPI или аналогичными фреймворками.

  • Опыт работы с векторным поиском или RAG-пайплайнами.

  • Понимание принципов проектирования API и оптимизации производительности систем.

Будет плюсом:

  • Опыт работы с GPU-серверами NVIDIA.

  • Базовые знания LoRA / QLoRA-файнтюнинга.

  • Опыт интеграции AI-систем с платформами автоматизации.

  • Знание принципов защиты данных и безопасных ML-процессов.

Условия работы:

  • Фиксированный график работы.

  • Командировки.

  • Возможность работать в финансово устойчивой и быстрорастущей международной компании.

  • Постоянное взаимодействие с глобальными командами профессионалов.

  • Международные карьерные возможности.

  • Доступ к непрерывному профессиональному развитию: обучение, сертификационные программы, мероприятия и тимбилдинги.

  • Медицинская страховка.

  • Конкурентный компенсационный пакет и система мотивации.

ChatGPT может допускать ошибки. Проверяйте важную информацию. Смотрите настройки cookie-файлов.

Похожие вакансии

11 Марта

Data engineer (DBT)

Москва

Компания "Тера Интегро" Обязанности: Участие в проекте построения Платформы данных на технологиях ( Greenplum , Clickhouse , S 3...

Отправить резюме подробнее

10 Марта

Senior DevOps Engineer( Spice Agency )

Москва

Компания "Spice Agency" В компанию — поставщика программного обеспечения для игорного бизнеса, сотрудничающую с ведущими мировыми провайдерами...

Отправить резюме подробнее

10 Марта

Data Engineer( Велтрэйд )

Москва

Компания "Велтрэйд" Velpharm Group – это ведущий игрок в фармацевтической индустрии, специализирующийся на разработке, производстве и...

Отправить резюме подробнее

06 Марта

QA Automation Engineer C#

Москва

Компания "Employcity" Продуктовая IT компания, которая занимается разработкой и поддержкой высоконагруженных проектов для крупных компаний,...

Отправить резюме подробнее

11 Марта

Руководитель проекта по внедрению AI (GPT)

Москва

Компания "МТС Банк" МТС Финтех – одно из ключевых направлений экосистемы МТС. Мы используем современные цифровые решения и развиваем...

Отправить резюме подробнее

Вакансия размещена в отрасли

Информационные технологии / IT / Интернет: