Разработчик
110 000 руб
Stepan
Возраст
25 лет (26 Октября 2000)
Город
Москва
Переезд невозможен
Полная занятость
2 месяца
Информационные технологии / IT / Интернет
Разрабатывал AI-платформу для автоматической модерации пользовательского контента с использованием LLM и RAG-подхода. Основной фокус — дообучение модели на специфичных данных, ускорение инференса и интеграция решений в прод.
Ключевые задачи и достижения:
- Дообучил DistilBERT на корпусе из 1.2M+ сообщений — F1-score вырос до 0.92, при этом удалось снизить False Positive Rate до <5%.
- Реализовал пайплайн с RAG-архитектурой для работы с доменно-специфичными данными — повысили релевантность выводов.
- Оптимизировал инференс: конвертировал модель в TensorRT — latency снизили до 50 мс, потребление памяти — на 30% меньше.
- Ускорил выборки и фильтрацию контента за счёт рефакторинга SQL и продуманной индексации в PostgreSQL (+35% скорости).
- Собрал REST API и реализовал асинхронную обработку запросов через Celery + WebSockets — время ответа сократилось в 4 раза.
Настроил мониторинг модели через Prometheus и Grafana — для отслеживания качества и раннего выявления дрейфа.
- Контейнеризовал всё в Docker и выкатил через AWS SageMaker с подключением CI/CD.
Платформу интегрировали в клиентские low-code пайплайны и внешние API — ускорили внедрение и масштабирование решений.
- Пример результата: после внедрения система закрывала до 85% всего входящего контента без участия модераторов, при этом сохраняя высокую точность и скорость.
Технологии: Python, Django, PyTorch, Transformers (DistilBERT, RAG), PostgreSQL, Redis, Celery, Docker, AWS SageMaker, Prometheus, Grafana, REST API.
Высшее
Москва, 2020 — 2024 гг.
РУДН
ML инженер
Яндекс Практикум
Python Backend
27 февраля, 2009
24 февраля, 2009
24 мая, 2009
40 000 руб
Фарида Зиннатовна
Город
Москва
Возраст
72 года (30 ноября 1953)
Опыт работы:
51 год и 6 месяцев
Последнее место работы:
Преподаватель 1С, Новая профессия
03.2009 - по текущее время