AI/LLM Engineer (Кипр)
19 Января 2026
Город:
Москва
Занятость:
Полная занятость
Компания "Selecty"
Наш клиент - ведущий дистрибьютор продуктов и решений в области информационных и коммуникационных технологий.
Локация: Кипр (обязательная релокация)
Формат работы:
- Офис или гибридный формат - три удалённых рабочих дня и два дня в офисе (вторник и четверг). Офис в Лимассоле
О позиции:
Компания создает новую платформу автоматизации для внутреннего использования, которая объединяет бизнес-процессы, AI-модели и внутренние системы. Нам необходимо разработать внутреннюю AI-платформу на базе самостоятельно размещённых (self-hosted) LLM-моделей.
Мы ищем AI/LLM инженера, который будет разворачивать модели локально или в гибридной среде, строить API-слой для взаимодействия с ними и интегрировать их с нашими автоматизированными workflow (n8n) и внутренними инструментами.
Вы будете работать над производительностью моделей, пайплайнами извлечения данных (RAG) и обеспечением безопасной обработки внутренних корпоративных данных.
Обязанности:
-
Развёртывание и оптимизация локальных LLM-моделей (Llama, Qwen, Mistral и др.).
-
Разработка API-эндпоинтов (FastAPI/REST) для взаимодействия с моделями.
-
Создание и поддержка RAG-пайплайнов: эмбеддинги, чанкинг, векторный поиск.
-
Работа с векторными базами данных (Chroma, Milvus, Faiss, Qdrant).
-
Интеграция AI-сервисов с автоматизацией в n8n.
-
Настройка промптов и поведения моделей для повышения качества ответов.
-
Мониторинг производительности моделей, задержек и использования ресурсов.
-
Обеспечение безопасной и конфиденциальной обработки внутренних данных.
Требования:
-
Llama / Qwen / Mistral, Python, FastAPI, векторные БД.
-
Опыт работы в ML/AI-инжиниринге от 3 лет.
-
Практический опыт развёртывания и инференса LLM-моделей.
-
Уверенные знания Python и опыт работы с FastAPI или аналогичными фреймворками.
-
Опыт работы с векторным поиском или RAG-пайплайнами.
-
Понимание принципов проектирования API и оптимизации производительности систем.
Будет плюсом:
-
Опыт работы с GPU-серверами NVIDIA.
-
Базовые знания LoRA / QLoRA-файнтюнинга.
-
Опыт интеграции AI-систем с платформами автоматизации.
-
Знание принципов защиты данных и безопасных ML-процессов.
Условия работы:
-
Фиксированный график работы.
-
Командировки.
-
Возможность работать в финансово устойчивой и быстрорастущей международной компании.
-
Постоянное взаимодействие с глобальными командами профессионалов.
-
Международные карьерные возможности.
-
Доступ к непрерывному профессиональному развитию: обучение, сертификационные программы, мероприятия и тимбилдинги.
-
Медицинская страховка.
-
Конкурентный компенсационный пакет и система мотивации.
ChatGPT может допускать ошибки. Проверяйте важную информацию. Смотрите настройки cookie-файлов.
Зарегистрируйтесь или войдите, чтобы открыть контакты работодателя
Прикрепите резюме для отклика
Уже с нами?
Войдите, чтобы отправить резюме
15 Января
ML разработчик (LLM, Whisper, RAG, Agents)
Москва
Компания "AMarkets" Fintech компания AMarkets с 2007 года предоставляет передовые решения для торговли на финансовых рынках для трейдеров и...
14 Января
Тестировщик (QA Engineer) систем антифрода
Москва
до 220 000 руб.
Компания "РСХБ-Интех" Полное проектное сопровождение тестирования новых бизнес-процессов: от анализа требований до приемки. Организация и...
14 Января
Senior VoIP Engineer (FreeSWITCH)
Москва
до 340 000 руб.
Компания "Центр Орбита" Группа Компаний Орбита - ведущий разработчик цифровых решений, российская аккредитованная ИТ-компания Масштабный...
14 Января
Software Development Engineer in Test/SDET C# (Services Integration)
Москва
Компания "Лаборатория Касперского" Кто мы: Мы – команда профессионалов, занимающаяся тестированием флагманских продуктов Лаборатории...
14 Января
QA automation engineer (Python, ML-сервисы)
Москва
Компания "РТ Лабс" РТЛабс создаёт и развивает масштабные цифровые сервисы Госуслуг — портал, мобильные приложения, социально значимые услуги,...
Вакансия размещена в отрасли