Научная
деятельность
Университет ИТМО

Проект RENOIR: как диджитализация меняет индустрию новостей

Диджитализация пронизывает не одну сферу человеческой деятельности, внося значительные коррективы в традиционные способы работы. Медиасреда не стала исключением – ежедневная деятельность новостных бюро постепенно преобразуются с использованием искусственного интеллекта и других передовых технологий. На прошлой неделе в Университете ИТМО состоялась лекция руководителя подразделения цифровой стратегии агентства печати Словении Алеши Рехара, который рассказал о цифровой трансформации индустрии новостей, а также о проекте RENOIR, над которым сегодня трудятся представители медийной индустрии (новостное агентство Словении STA) и академическое сообщество (Варшавский технологический университет, Стенфордский университет и другие). С июня 2018 года к проекту присоединился Университет ИТМО.

Диджитализация и актуальные вызовы для новостной индустрии

Стремительное развитие цифровых технологий в последние годы влияет на новостную индустрию. Искусственный интеллект и другие современные технологии все больше определяют формат и скорость ежедневной деятельности новостных бюро, а также ставят перед медиасообществом новые вызовы. Среди последних особенно значительными стали снижение традиционного потока доходов (что особенно актуально для газетной индустрии, традиционная аудитория которой перешла на новые площадки для получения новостей), диверсификация площадок и форматов (все больше появляется платформ, на которых медийные компании могут предоставлять доступ к своему контенту – Facebook, Twitter и другие, и создавать online-комьюнити, что обязывает издания производить максимально вариативный контент для каждой из площадок), рост новых нетрадиционных игроков (блогеры, социальные медиа, небольшие тематические издания, над которыми работают команды из трех-пяти человек), нехватка финансов и человеческих ресурсов (для обслуживания новых трендов и запросов аудитории не всегда есть достаточное число специалистов).

По мнению Алеши Рехара, решением для новых вызовов может стать диджитализация. Первой выгодой эксперт называет экономию времени в рутинной деятельности – сегодня существует много способов, которые ускоряют доступ журналистов к необходимой информации, представленной на множестве языков. Это, в свою очередь, позволяет авторам дольше и тщательнее работать над материалами, требующими большего времени и концентрации. Вторая выгода – повышение качества сервисов и продуктов. Так, если у клиента новостного агентства есть запрос на предоставление контента определенной тематической области, традиционно эта задача лежала на плечах журналиста – именно ему предстояло вспомнить в какой тематический блок отправлялась опубликованная статья, однако теперь технологии позволяют решить проблему, предоставляя доступ ко всему необходимому, а также автоматически сортируя статьи на тематические блоки. Как только опубликована статья – информация о ней становится доступна для системы. Также эксперт отмечает новые возможности медийных компаний с исследовательскими партнерами и новые возможности для производства финансовых средств – обычно традиционные медиа не имеют достаточно ноу-хау из-за недостатка финансовых ресурсов – проект кооперации между научными лабораториями и представителями медиаиндустрии может решить эту проблему, считает эксперт. 

Алеша Рехар
Алеша Рехар

Проект RENOIR

Новостные компании все чаще тестируют и внедряют новые технологии в свою ежедневную деятельность – иногда это происходит в сотрудничестве с научно-исследовательскими институтами. Интересным примером такого сотрудничества стал проект в рамках гранта ЕС «Горизонт 2020» по программе «Мероприятия Марии Склодовской-Кюри. Обмен научными и инновационными кадрами» факультета физики Варшавского технологического университета Н2020 «Ренуар», в рамках которого Словенское агентство печати (STA) сотрудничает с исследовательскими лабораториями из нескольких стран - одним из партнеров по проекту стал и Университет ИТМО.

Проект «Ренуар» посвящен созданию новых механизмов обработки социальной информации. Особенность проекта заключается в уровне кооперации между участниками – участники проекта регулярно посещают вузы и компании-партнеры с целью обмена опытом. Всего проект разделен на пять уровней, на которых происходит обмен знаниями и инновациями в области инфраструктуры данных для социальной информации, создание инновационных решений в области техники обработки и анализа данных (которые агентство STA сможет применять в своей деятельности для расширения портфеля услуг), обмен знаниями и инновациями в области интеллектуального анализа данных и машинного обучения для реверс-инжиниринга обработки социальной информации и другое. Сегодня над проектом работают четыре основных партнера: Варшавский технологический университет (Польша), Вроцлавский технический университет (Польша), Институт Йозефа Стефана (Словения) и Словенское агентство печати STA, а также 11 других партнеров, среди которых Стэнфордский университет, Калифорнийский университет и Университет ИТМО.

Лекция Алеши Рехара
Лекция Алеши Рехара

Решения для агентства STA

Отслеживание статей – инструмент, который создали PhD-студенты Варшавского технологического университета. Это решение помогает узнать, как много материалов и с какой регулярностью было скопировано другими компаниями с веб-сайта новостного агентства. Сегодня STA анализируют, как часто их партнеры пользуются их материалами. С помощью Google Analytics API разработчики и медийщики узнают, кто именно и как часто копирует статьи, а также сколько кликов приходится на конкретный материал.

Другой интересный инструмент – классификация тем. Это менее комплексное решение было произведено в сотрудничестве с Вроцлавским техническим университетом в рамках студенческого конкурса, который проводило агентство печати STA. Идея проекта – автоматическая сортировка статей по тематическим топикам. Если раньше определение статьи под тематический блок оставалось за журналистом (из-за человеческого фактора не всегда сортировка происходила корректно), то теперь сортировка – функция системы, которая проверяет опубликованные статьи и анализирует, под какие топики она подходит для отправки ее в конкретные группы. 

Bloomberg. Источник: bloomberg.com
Bloomberg. Источник: bloomberg.com

Самое комплексное решение называется «Реестр событий». Этот инструмент был реализован в содружестве с медийным партнером (американское новостное агентство Bloomberg — один из ведущих поставщиков финансовой информации для профессиональных участников финансовых рынков) и академическими участники проекта. Реестр событий – это всемирный кросс-лингвальный новостной агрегатор, с помощью которого медийные сотрудники получают более быстрый доступ к информации о событиях, случившихся в мире вне зависимости от того, на каком языке эта информация представлена. В этой системе заложены функции автоматического анализа и категоризации новостей, а также автоматическое обнаружение событий (извлечение событий из статей и дальнейшая их тематическая кластеризация). Также этот инструмент предлагает сразу несколько функциональных возможностей для производителей новостей.

Первая функция – обзор лучших ежедневных новостей. Агрегатор предлагает более быстрый и простой способ обзора наиболее релевантных на данный момент времени новостей. Также система предоставит информацию о наиболее популярных личностях, организациях и локациях, позволив проследить и сравнить развитие популярности во временном промежутке. Все это экономит время медийных сотрудников и позволяет быстро работать с материалами на других языках. Вторая важная функция – помощь в отображении выбранного события. Это значит, что при подготовке материала о конкретном событии журналист может найти в новостном агрегаторе информацию об этом событии от разных информационных поставщиков, ознакомившись, таким образом, с несколькими точками зрения и не пропустив детали. По словам Алеши Рехара, этот инструмент позволяет одним новостным агентствам оценить, как работают другие агентства по всему миру. Если новость создается на основе событий, произошедших на территории другого государства, зачастую журналистам приходится работать с главным новостным агентством страны, что ограничивает создателей новостного контента одной точкой зрения на событие. Новый инструмент позволяет одновременно работать с несколькими точками зрения и, как следствие, более точно и объективно воссоздавать картину событий. Статьи из нескольких источников объединены в одну группу, что позволяет произвести краткий обзор различных аспектов мероприятия. Появляется резюме, скомпилированное сразу из нескольких материалов, созданных на разных языках. Все это помогает журналистам работать с более полной информацией, состоящей из тысяч рассказов по всему миру.

Словенское агентство печати STA. Источник: sta.si
Словенское агентство печати STA. Источник: sta.si

Третья функция – более быстрый доступ к информации об актуальных мировых новостях. Журналистам все меньше нужно самостоятельно мониторить ресурсы новостных агентств стран, в которых происходят те или иные события, так как система самостоятельно предлагает эту информацию, оповещая пользователей. Более того, здесь же можно найти статьи из разных новостных источников интересующего региона. Эта функция также полезна небольшим странам, желающим отследить особенности своего медийного образа, созданного другими странами. Например, агентство STA может узнать, что пишут о Словении другие страны, какие события, личности (ученые, звезды, политики) и институции наиболее привлекательны для зарубежной аудитории. 

Также инструмент «реестр событий» предлагает и другие функции, среди которых автоматическое создание мета-данных для новостных статей (зачастую метаданные в отделах информационных технологий создаются вручную) с помощью автоматизированного процессов – выбора ключевых слов, тематической категоризации и прочее. Иные функции – автоматическое обновление тематической страницы, привлекательная визуализация данных (карта сайта, облако, временная шкала), возможность сравнения скорости работы различных новостных агентств, анализ структуры отдельно взятого текста и другое.

Лекция Алеши Рехара
Лекция Алеши Рехара

В планах у представителей агентства STA – повысить качество механизмов, отвечающих за обнаружение fake news, анализ предвзятости и настроения новостей, предсказание развития событий на основе минувших событий, обнаружение и предупреждение о breaking news, увеличение ленты новостей и поддержка новых языков, а также автоматическое написание новостей (робожурналистика).