Data Scientist LLM (Global markets)( Сбербанк )
25 Октября 2024
Город:
Москва
Занятость:
Полная занятость
Опыт:
Нет опыта
Компания "Сбербанк"
Команда, отвечающая за AI инициативы бизнеса Департамента Глобальных Рынков Сбера.
Что мы делаем?
Департамента Глобальных Рынков (ДГР) – предоставляет корпоративным и розничным клиентам широкий спектр продуктов и услуг на финансовых рынках. Ключевые направления бизнеса: торговые операции с ценными бумагами, деривативами, ликвидностью, на валютном, товарно-сырьевом рынках, структурные продукты.
Мы помогаем внутренним клиентам увеличивать доходность, создаем информационную платформу, проводим анализ финансовых рынков, работаем с разными форматами данных.
Наша команда решает очень широкий спектр DS-задач с применением самых передовых ML/DL алгоритмов и инструментов. В нашей компетенции — разработка, тестирования и вывод в промышленную среду моделей .
Мы ищем талантливого специалиста, который обладает опытом работы с большими языковыми моделями (LLM). В этой роли вы будете играть ключевую роль в исследовании и применении нашей LLM для решения широкого спектра задач, включая генерацию текста, извлечение информации, Q&A системы, логическое мышление и другие.
- Участие в разработке решения на основе обучения/ файнтюнинга (SFT LoRA, RLHF) современных генеративных сеток (GigaChat, LLAMA2, Gpt3.5/4);
- Построение пайплайна обработки данных и обучения LLM (LLM цепочек);
- Разработка векторизованных баз знаний с использованием LangChain, ChromaDB;
- Организация процесса мониторинга качества LLM;
- Тестирование, анализ и ранжирование сильных и слабых сторон различных моделей и конкретного решения;
- Участие в формировании требований и необходимых данных по улучшению моделей;
- Оценка как полученное решение достигает поставленных целей;
- Следить за последними исследованиями и инновациями в области языковых моделей и применять их на практике;
- Разработка документации и руководства для пользователей и разработчиков;
- Подготовка и анализ новостей для обучения модели.
Основные навыки:
- Знание Python на уровне middle-разработчика;
- Опыт анализа и обработки данных (numpy/pandas) и их визуализация (matplotlib, seaborn, plotly);
- Опыт web scraping (в идеале – playwright/parsel/httpx, возможно – selenium/beautifulsoup/requests);
- Опыт работы с БД (ORM);
- Опыт создания dashboards (streamlit/gradio/dash);
- Опыт асинхронного программирования (asyncio);
- Linux;
- Git;
- Docker.
Навыки NLP:
- Уверенное владение базовыми знаниями в Deep Learning и NLP с практическим опытом работы в этом направлении;
- Знание PyTorch или Tensorflow для возможности fine-tuning LLM под конкретную задачу;
- Знание LLM-фреймворков и библиотек (в идеале – langchain, дополнительно как пример - llama-index, openai) для создания LLM-приложений;
- Опыт использования LLM (gpt-3.5-turbo/gpt-4/open source), в идеале – опыт использования их API для создания LLM-приложений;
- Знание методов Prompt Engineering.
Личностные качества:
- Навыки и желание самостоятельного изучения новых технологий для проведения экспериментов и реализации MVP с участием в дальнейшим развитии проектов.
Проекты:
- Наличие публичных проектов, и/или активное участие в разработке open source проектов в области NLP/LLM;
- Наличие блога по NLP/LLM.
Условия
- Формат работы: офис (ул.Вавилова,19). Возможен гибрид;
- ДМС с первого дня;
- Скидки на продукты банка и экосистемы;
- Развитая IT архитектура;
- Постоянное развитие: обучающие курсы от лучших университетов и компаний (МФТИ, ВШЭ, NVIDIA и другие), участие в международных конференциях;
- Развитое DS community, регулярные митапы, дайджесты и конференции.
Зарегистрируйтесь или войдите, чтобы открыть контакты работодателя
Прикрепите резюме для отклика
Уже с нами?
Войдите, чтобы отправить резюме
17 Октября
Data scientist (Computer Vision), junior/middle
Москва
Компания "ЦИТМ Экспонента" Центр инженерных технологий и моделирования «Экспонента» – IT компания, разработчик и интегратор программного...
16 Октября
Москва
Компания "Employcity" Международная компания, которая разрабатывает надёжные и актуальные IT-решения для b2c и b2b сегмента находится в поисках...
17 Октября
Москва
Компания "Медиапоинт" В международную компанию с собственной digital-платформой игровой тематики требуется Middle Data Analyst. Требования:...
16 Октября
Менеджер по анализу и отчетности (Data-аналитик)
Москва
Компания "Автодор-Платные Дороги" Компания «Автодор – Платные Дороги» входит в группу компании ГК «Автодор». Основные направления...
16 Октября
Senior Data Analyst (Content Analytics Team) | Аналитик данных (команда контента)
Москва
Компания "АЛИБАБА.КОМ (РУ)" Наша команда отвечает за улучшение контента с помощью аналитики. Мы фокусируемся как на метриках качества контента,...
Вакансия размещена в отрасли