Разработчик
110 000 руб
Stepan
Возраст
25 лет (26 Октября 2000)
Город
Москва
Переезд невозможен
Полная занятость
2 месяца
Информационные технологии / IT / Интернет
Разрабатывал AI-платформу для автоматической модерации пользовательского контента с использованием LLM и RAG-подхода. Основной фокус — дообучение модели на специфичных данных, ускорение инференса и интеграция решений в прод.
Ключевые задачи и достижения:
- Дообучил DistilBERT на корпусе из 1.2M+ сообщений — F1-score вырос до 0.92, при этом удалось снизить False Positive Rate до <5%.
- Реализовал пайплайн с RAG-архитектурой для работы с доменно-специфичными данными — повысили релевантность выводов.
- Оптимизировал инференс: конвертировал модель в TensorRT — latency снизили до 50 мс, потребление памяти — на 30% меньше.
- Ускорил выборки и фильтрацию контента за счёт рефакторинга SQL и продуманной индексации в PostgreSQL (+35% скорости).
- Собрал REST API и реализовал асинхронную обработку запросов через Celery + WebSockets — время ответа сократилось в 4 раза.
Настроил мониторинг модели через Prometheus и Grafana — для отслеживания качества и раннего выявления дрейфа.
- Контейнеризовал всё в Docker и выкатил через AWS SageMaker с подключением CI/CD.
Платформу интегрировали в клиентские low-code пайплайны и внешние API — ускорили внедрение и масштабирование решений.
- Пример результата: после внедрения система закрывала до 85% всего входящего контента без участия модераторов, при этом сохраняя высокую точность и скорость.
Технологии: Python, Django, PyTorch, Transformers (DistilBERT, RAG), PostgreSQL, Redis, Celery, Docker, AWS SageMaker, Prometheus, Grafana, REST API.
Высшее
Москва, 2020 — 2024 гг.
РУДН
ML инженер
Яндекс Практикум
Python Backend
24 мая, 2009
40 000 руб
Фарида Зиннатовна
Город
Москва
Возраст
72 года (30 ноября 1953)
Опыт работы:
51 год и 7 месяцев
Последнее место работы:
Преподаватель 1С, Новая профессия
03.2009 - по текущее время
27 февраля, 2009
24 февраля, 2009