Data Engineer (RAG / AI Platform)( Тинькофф ) (в архиве)

23 Декабря

Партнерские Вакансии

Город:

Москва

Занятость:

Полная занятость

Компания "Тинькофф"

Мы строим DataPlatfrom и AI-инфраструктуру, в которой инженеры, аналитики и разработчики смогут использовать современные подходы Retrieval-Augmented Generation (RAG) без боли и ручных костылей.
Наша цель — сделать RAG таким же привычным компонентом платформы, как SQL, Spark или CI/CD.
Для этого мы ищем Platform Data Engineer, который поможет сформировать и стандартизировать RAG-pipeline — от загрузки данных и чанкирования до метрик качества и retrival-механизмов. Дополнительным вызовом будет создание агентов для целей Data Platform используя RAG.

⚙️ Задачи:

  • Проектировать и внедрять RAG-пайплайны уровня платформы: ingestion данных, чанкирование, эмбеддинги, retrival, оценка качества ответов.
  • Исследовать SOTA-методы RAG (chunking, reranking, hybrid retrival, еvаlframeworks — RAGAS, TruLens, Langfuse, etc.) и адаптировать их под инфраструктуру Data / Dev Platform.
  • Создавать reusable компоненты (Python-библиотеки, API, Helm-чарты, шаблоны пайплайнов) для команд-потребителей.
  • Встраивать RAG в экосистему платформы: от self-service интерфейсов до observability и developer experience.
  • Разрабатывать метрики качества и мониторинг RAG-решений: faithfulness, groundedness, latency, coverage.
  • Агрегировать и распространять практики подготовки данных для использования в RAG.
  • Участвовать в воркшопах и кодлабах, обучать команды применению AI в продакшене.

???? Требования:

  • Уверенные знания Python, SQL.
  • Понимание архитектуры RAG-систем.
  • Опыт работы с LLM и embeddings — OpenAI, Gemini, Mistral.
  • Опыт работы с Docker, Git, Linux, Bash, знание CI/CD.
  • Понимание общих принципов устройства СУБД (реляционных + NoSQL).
  • Знание подходов по организации ETL-процессов, инструментов построения ETL.

???? Будет плюсом:

  • Практический опыт с векторными БД (Milvus, Qdrant, FAISS, Chroma).
  • Понимание ML evaluation и метрик RAG-решений.
  • Опыт с LangChain / LlamaIndex .
  • Опыт построения retrival-и-еvаlpipelines в проде.
  • Знание Trino / ClickHouse / Greenplum / Spark — как источников данных.
  • Понимание принципов System Design / архитектуры ML-платформ.
Похожие вакансии

10 Января

Web SRE/Site Reliability Engineer

Москва

Компания "ДДОС ГВАРД" Привет! Мы — DDoS-Guard. С 2011 года защищаем бизнес от DDoS-атак, ускоряем доставку контента и обеспечиваем надежный...

Отправить резюме подробнее

10 Января

Senior Data Engineer( РСХБ-Интех )

Москва

Компания "РСХБ-Интех" В связи с активным расширением команды мы в поисках Senior Data Engineer в Лабораторию искусственного интеллекта. ЧЕМ...

Отправить резюме подробнее

10 Января

Lead Backend Engineer

Москва

от 300 000 руб.

Компания "UP business" Наш клиент — технологическая компания, создающая масштабируемые системы для крупных корпоративных клиентов в сфере...

Отправить резюме подробнее

10 Января

Стажер QA-engineer

Москва

Компания "NOVATEST" Всем привет! Мы запускаем стажировку на вакансию "QA-engineer". После ее успешного прохождения, у тебя есть реальная...

Отправить резюме подробнее

10 Января

Data аналитик( Осьминожка )

Москва

от 180 000 руб.

Компания "Осьминожка" OSMI IT — интегратор решений в области искусственного интеллекта и веб-разработки . Мы помогаем среднему и крупному...

Отправить резюме подробнее

Вакансия размещена в отрасли

Информационные технологии / IT / Интернет: