Разработчик
110 000 руб
Stepan
Возраст
25 лет (26 Октября 2000)
Город
Москва
Переезд невозможен
Полная занятость
2 месяца
Информационные технологии / IT / Интернет
Разрабатывал AI-платформу для автоматической модерации пользовательского контента с использованием LLM и RAG-подхода. Основной фокус — дообучение модели на специфичных данных, ускорение инференса и интеграция решений в прод.
Ключевые задачи и достижения:
- Дообучил DistilBERT на корпусе из 1.2M+ сообщений — F1-score вырос до 0.92, при этом удалось снизить False Positive Rate до <5%.
- Реализовал пайплайн с RAG-архитектурой для работы с доменно-специфичными данными — повысили релевантность выводов.
- Оптимизировал инференс: конвертировал модель в TensorRT — latency снизили до 50 мс, потребление памяти — на 30% меньше.
- Ускорил выборки и фильтрацию контента за счёт рефакторинга SQL и продуманной индексации в PostgreSQL (+35% скорости).
- Собрал REST API и реализовал асинхронную обработку запросов через Celery + WebSockets — время ответа сократилось в 4 раза.
Настроил мониторинг модели через Prometheus и Grafana — для отслеживания качества и раннего выявления дрейфа.
- Контейнеризовал всё в Docker и выкатил через AWS SageMaker с подключением CI/CD.
Платформу интегрировали в клиентские low-code пайплайны и внешние API — ускорили внедрение и масштабирование решений.
- Пример результата: после внедрения система закрывала до 85% всего входящего контента без участия модераторов, при этом сохраняя высокую точность и скорость.
Технологии: Python, Django, PyTorch, Transformers (DistilBERT, RAG), PostgreSQL, Redis, Celery, Docker, AWS SageMaker, Prometheus, Grafana, REST API.
Высшее
Москва, 2020 — 2024 гг.
РУДН
ML инженер
Яндекс Практикум
Python Backend
24 февраля, 2009
27 марта, 2008
37 500 руб
Ольга Олеговна
Город
Москва
Возраст
38 лет (23 декабря 1987)
Опыт работы:
-14 года и -4 месяца
Последнее место работы:
Помощник медицинской сетры, ООО "Международный центр диализа"
07.2006 - 07.2007
27 февраля, 2009