Разметчик текстовых данных ML (СКАН)
Город:
Москва
Занятость:
Полная занятость
Опыт:
Нет опыта
Компания "Интерфакс"
"Интерфакс" – крупнейшая в России негосударственная информационная группа, создатель передовых информационно-аналитических систем для B2B, одно из ведущих в стране и наиболее цитируемых в мире российских информационных агентств.
Мы не только создаем качественные и оперативные новости, но и умеем их анализировать, а также делать профессиональный медиа-анализ с помощью IT-технологий. Этот функционал собрал в себе наш сервис СКАН-Интерфакс (англ. SCAN).
СКАН позволяет оперативно отслеживать публикации о компании в СМИ, анализировать присутствие компании в медиапространстве, формировать отчеты по охватам, упоминаниям, тональности, заметности и т.д., а также делать мониторинг рисков по портфелям контрагентов с помощью API.
Задачи, которые предстоит решать:
- Размечать текстовые данные (Data labeling, data annotation) – добавлять тэги в сырые данные, чтобы показать модели машинного обучения (модели искусственного интеллекта) целевые атрибуты (ответы), которые она должна предсказывать.
- Читать фрагменты текста (статьи, параграфы, предложения, слова) и:
- категоризировать текст – оценивать относятся ли он к заданной тематике
- относить прочитанный фрагмент к определенным классам
- аннотировать сущности – разметка отдельных слов и фраз. Тэгирование фундаментальных сущностей (персон, названий компаний, указания местоположений и т.д.)
- аннотировать эмоциональную наполненности (является ли текст позитивным, негативным или нейтральным сообщением)
- связывать сущности – разметка определённых сущностей в тексте и связывание их с большими репозиториями данных
- извлекать и тэгировать ключевые фразы или слова
- Отслеживать показатели контроля качества размеченных данных.
- Обсуждать расхождений в разметке с командой.
Мы ожидаем, что вы:
- Уверенно пользуетесь компьютером, умеете заполнять онлайн формы и анкеты, умеете искать информацию в интернете.
- Ответственны и внимательны к деталям, следуете инструкциям.
- Спокойно относитесь к однообразным задачам и быстро адаптируетесь к новым.
- Умеете вчитываться в новостные тексты на любую тему.
- Конструктивно (без драки) защищаете свою точку зрения при возникновении разногласий в разметке. Мы в автоматическом режиме сравниваем разметку минимум двух разметчиков, чтобы исключить разногласия в данных.
- Эмоционально устойчивы и умеете абстрагироваться от прочитанного. Новостные данные очень разные.
Требования:
- Образование не ниже средне-специального или неоконченного высшего
Почему к нам?
- Это отличный, довольно не требовательный к изначальной подготовке путь для входа в Data Science и машинное обучение. Вы получите свой первый опыт на главном этапе – подготовке данных.
- Начнете работу в настоящей промышленной команде над продуктом лидером рынка.
- Погрузитесь в современную атмосферу работы по гибким методологиям – Agile (SCRUM, Kanban).
- Узнаете что такое команда мечты и отличные коллеги.
Желательно, но не обязательно:
- Знание принципов работы инструментов для разметки текстовых данных.
Что мы готовы предложить:
- Официальное оформление с первого дня работы, ДМС (включая стоматологию), "белая" заработная плата, премии по результатам работы: квартальные;
- Удобное местоположение: офис в историческом центре Москвы (Маяковская, 1 мин. ходьбы от метро);
- Гибридный формат работы;
- Тренинги и обучение, участие в профессиональных конференциях и корпоративных мероприятиях.
29 Сентября
Менеджер направления "Анализ данных"( 5POST )
Москва
от 200 000 до 230 000 руб.
Компания "5POST" Чем предстоит заниматься: Разработка, внедрение и контроль системы сбора и обработки данных управления безопасности;...
29 Сентября
Инженер систем хранения данных
Москва
до 250 000 руб.
Компания "Wanted" С 2016 года мы специализируемся на разработке программных комплексов хранения данных и искусственного интеллекта. Успешно...
29 Сентября
Аналитик данных / Senior Data Analyst( ЛитРес )
Москва
Компания "ЛитРес" Чем предстоит заниматься: Созданием и поддержкой маркетинговых дашбордов, математических моделей, витрин и ETL,...
29 Сентября
Аналитик данных для отчетности ММБ (банк)( Outlines Technologies )
Москва
до 230 000 руб.
Компания "Outlines Technologies" Outlines Tech – это аккредитованная IT-компания. Мы разрабатываем ПО и проекты для корпораций, а также...
29 Сентября
Инженер данных / DWH Developer
Москва
Компания "Альфа Капитал" Привет! Если вам интересна тема инвестиций, то мы в Альфа-Капитал как раз делаем это - мы занимаемся доверительным...
Вакансия размещена в отрасли