Разметчик текстовых данных ML (СКАН) (в архиве)

31 Августа

Партнерские Вакансии

Город:

Москва

Занятость:

Полная занятость

Опыт:

Нет опыта

Компания "Интерфакс"

"Интерфакс" – крупнейшая в России негосударственная информационная группа, создатель передовых информационно-аналитических систем для B2B, одно из ведущих в стране и наиболее цитируемых в мире российских информационных агентств.

Мы не только создаем качественные и оперативные новости, но и умеем их анализировать, а также делать профессиональный медиа-анализ с помощью IT-технологий. Этот функционал собрал в себе наш сервис СКАН-Интерфакс (англ. SCAN).

СКАН позволяет оперативно отслеживать публикации о компании в СМИ, анализировать присутствие компании в медиапространстве, формировать отчеты по охватам, упоминаниям, тональности, заметности и т.д., а также делать мониторинг рисков по портфелям контрагентов с помощью API.

Задачи, которые предстоит решать:

  • Размечать текстовые данные (Data labeling, data annotation) – добавлять тэги в сырые данные, чтобы показать модели машинного обучения (модели искусственного интеллекта) целевые атрибуты (ответы), которые она должна предсказывать.
  • Читать фрагменты текста (статьи, параграфы, предложения, слова) и:
    • категоризировать текст – оценивать относятся ли он к заданной тематике
    • относить прочитанный фрагмент к определенным классам
    • аннотировать сущности – разметка отдельных слов и фраз. Тэгирование фундаментальных сущностей (персон, названий компаний, указания местоположений и т.д.)
    • аннотировать эмоциональную наполненности (является ли текст позитивным, негативным или нейтральным сообщением)
    • связывать сущности – разметка определённых сущностей в тексте и связывание их с большими репозиториями данных
    • извлекать и тэгировать ключевые фразы или слова
  • Отслеживать показатели контроля качества размеченных данных.
  • Обсуждать расхождений в разметке с командой.

Мы ожидаем, что вы:

  • Уверенно пользуетесь компьютером, умеете заполнять онлайн формы и анкеты, умеете искать информацию в интернете.
  • Ответственны и внимательны к деталям, следуете инструкциям.
  • Спокойно относитесь к однообразным задачам и быстро адаптируетесь к новым.
  • Умеете вчитываться в новостные тексты на любую тему.
  • Конструктивно (без драки) защищаете свою точку зрения при возникновении разногласий в разметке. Мы в автоматическом режиме сравниваем разметку минимум двух разметчиков, чтобы исключить разногласия в данных.
  • Эмоционально устойчивы и умеете абстрагироваться от прочитанного. Новостные данные очень разные.

Требования:

  • Образование не ниже средне-специального или неоконченного высшего

Почему к нам?

  • Это отличный, довольно не требовательный к изначальной подготовке путь для входа в Data Science и машинное обучение. Вы получите свой первый опыт на главном этапе – подготовке данных.
  • Начнете работу в настоящей промышленной команде над продуктом лидером рынка.
  • Погрузитесь в современную атмосферу работы по гибким методологиям – Agile (SCRUM, Kanban).
  • Узнаете что такое команда мечты и отличные коллеги.

Желательно, но не обязательно:

  • Знание принципов работы инструментов для разметки текстовых данных.

Что мы готовы предложить:

  • Официальное оформление с первого дня работы, ДМС (включая стоматологию), "белая" заработная плата, премии по результатам работы: квартальные;
  • Удобное местоположение: офис в историческом центре Москвы (Маяковская, 1 мин. ходьбы от метро);
  • Гибридный формат работы;
  • Тренинги и обучение, участие в профессиональных конференциях и корпоративных мероприятиях.
Похожие вакансии

29 Сентября

Менеджер направления "Анализ данных"( 5POST )

Москва

от 200 000 до 230 000 руб.

Компания "5POST" Чем предстоит заниматься: Разработка, внедрение и контроль системы сбора и обработки данных управления безопасности;...

Отправить резюме подробнее

29 Сентября

Инженер систем хранения данных

Москва

до 250 000 руб.

Компания "Wanted" С 2016 года мы специализируемся на разработке программных комплексов хранения данных и искусственного интеллекта. Успешно...

Отправить резюме подробнее

29 Сентября

Аналитик данных / Senior Data Analyst( ЛитРес )

Москва

Компания "ЛитРес" Чем предстоит заниматься: Созданием и поддержкой маркетинговых дашбордов, математических моделей, витрин и ETL,...

Отправить резюме подробнее

29 Сентября

Аналитик данных для отчетности ММБ (банк)( Outlines Technologies )

Москва

до 230 000 руб.

Компания "Outlines Technologies" Outlines Tech – это аккредитованная IT-компания. Мы разрабатываем ПО и проекты для корпораций, а также...

Отправить резюме подробнее

29 Сентября

Инженер данных / DWH Developer

Москва

Компания "Альфа Капитал" Привет! Если вам интересна тема инвестиций, то мы в Альфа-Капитал как раз делаем это - мы занимаемся доверительным...

Отправить резюме подробнее

Вакансия размещена в отрасли

Информационные технологии / IT / Интернет: