Компания "Selecty"
Наш клиент - ведущий дистрибьютор продуктов и решений в области информационных и коммуникационных технологий.
Локация: Кипр (обязательная релокация)
Формат работы:
О позиции:
Компания создает новую платформу автоматизации для внутреннего использования, которая объединяет бизнес-процессы, AI-модели и внутренние системы. Нам необходимо разработать внутреннюю AI-платформу на базе самостоятельно размещённых (self-hosted) LLM-моделей.
Мы ищем AI/LLM инженера, который будет разворачивать модели локально или в гибридной среде, строить API-слой для взаимодействия с ними и интегрировать их с нашими автоматизированными workflow (n8n) и внутренними инструментами.
Вы будете работать над производительностью моделей, пайплайнами извлечения данных (RAG) и обеспечением безопасной обработки внутренних корпоративных данных.
Обязанности:
Развёртывание и оптимизация локальных LLM-моделей (Llama, Qwen, Mistral и др.).
Разработка API-эндпоинтов (FastAPI/REST) для взаимодействия с моделями.
Создание и поддержка RAG-пайплайнов: эмбеддинги, чанкинг, векторный поиск.
Работа с векторными базами данных (Chroma, Milvus, Faiss, Qdrant).
Интеграция AI-сервисов с автоматизацией в n8n.
Настройка промптов и поведения моделей для повышения качества ответов.
Мониторинг производительности моделей, задержек и использования ресурсов.
Обеспечение безопасной и конфиденциальной обработки внутренних данных.
Требования:
Llama / Qwen / Mistral, Python, FastAPI, векторные БД.
Опыт работы в ML/AI-инжиниринге от 3 лет.
Практический опыт развёртывания и инференса LLM-моделей.
Уверенные знания Python и опыт работы с FastAPI или аналогичными фреймворками.
Опыт работы с векторным поиском или RAG-пайплайнами.
Понимание принципов проектирования API и оптимизации производительности систем.
Будет плюсом:
Опыт работы с GPU-серверами NVIDIA.
Базовые знания LoRA / QLoRA-файнтюнинга.
Опыт интеграции AI-систем с платформами автоматизации.
Знание принципов защиты данных и безопасных ML-процессов.
Условия работы:
Фиксированный график работы.
Командировки.
Возможность работать в финансово устойчивой и быстрорастущей международной компании.
Постоянное взаимодействие с глобальными командами профессионалов.
Международные карьерные возможности.
Доступ к непрерывному профессиональному развитию: обучение, сертификационные программы, мероприятия и тимбилдинги.
Медицинская страховка.
Конкурентный компенсационный пакет и система мотивации.
ChatGPT может допускать ошибки. Проверяйте важную информацию. Смотрите настройки cookie-файлов.
07 Января
Тестировщик ПО / QA engineer (web)
Москва
от 105 000 руб.
Компания "Equip Group" Equip Group — компания, работающая на рынке оборудования для профессиональной кухни более 30 лет. За это время мы...
07 Января
Москва
Компания "РТ-ИНФОРМ" ООО «РТ-ИНФОРМ» - аккредитованная IT-компания, инфраструктурное, 100% дочернее Общество Госкорпорации «Ростех»,...
07 Января
Senior Go Engineer / Lead Go Engineer (Architecture-focused)
Москва
Компания "Интеграция Дистрибуция Проекты" Проект: Платёжная система для клиента из Юго-Восточной Азии Домен: FinTech / Payments / Highload...
07 Января
Senior Java Engineer / Lead Java Engineer (Architecture-focused)
Москва
Компания "Интеграция Дистрибуция Проекты" Проект: Платёжная система для клиента из Юго-Восточной Азии Домен: FinTech / Payments / Highload...
07 Января
Москва
Компания "Сбербанк" Наша NLP команда занимается задачами, связанными с извлечением информации из документов, диалогов, текстов различной...