Медиа Облако - Media Cloud

Анализ Media Cloud 25 лучших Источники новостей США 'освещение Захвати Уолл-стрит за неделю 26 сентября 2011 г. по сравнению с неделей 3 октября 2011 г.

Медиа Облако является Открытый исходный код Анализ содержания инструмент, предназначенный для отображения СМИ освещение текущих событий. Он "выполняет пять основных функций: определение мультимедиа, ползать, извлечение текста, слово векторизация, и анализ ".[1] Медиа-облако "отслеживает сотни газет, тысячи веб-сайтов и блогов и архивирует информацию в форме с возможностью поиска. База данных ... позволяет исследователям искать ключевых людей, места и события - от Майкла Джексона до иранца. выборы - и точно узнайте, когда, где и как часто они освещаются ».[2] Media Cloud было разработано Центр Беркмана для Интернета и общества в Гарвардском университете и запущен в марте 2009 года.[3][4] Распространяется под GNU GPL 3+.[5]

По состоянию на октябрь 2011 года Media Cloud отслеживает новости в основном из американских источников. Он «собирает новости» в наборы из:[6]

Среди компаний, которые сотрудничали с Media Cloud (или продолжают сотрудничать), есть Morningside Analytics. [2], Betaworks [3], Bit.ly, Associated Press [4] и Global Voices [5].

Что делает Media Cloud

6 мая 2011 г. Беркман-центр перезапустил Media Cloud ", платформу, предназначенную для того, чтобы ученые, журналисты и все, кто интересуется миром СМИ, могли задавать количественные вопросы о внимании СМИ и отвечать на них. Более года мы собирали примерно 50 000 англоязычных историй в день из 17 000 источников СМИ, включая основные СМИ, левые и правые американские политические блоги, а также из 1000 популярных блогов, представляющих общий интерес ».[7]Эти данные были использованы для «анализа различий в освещении международных кризисов в профессиональных и гражданских СМИ и для изучения быстрых сдвигов во внимании СМИ, которые сопровождали поток последних новостей, характерный для начала 2011 года».[7] Международные исследования привели к публикации «нового исследования, в котором используется Media Cloud, чтобы помочь нам понять структуру профессиональных и гражданских СМИ в России и Египте».[7]Перезапуск Media Cloud позволяет пользователям, которые заинтересованы в использовании его инструментов, анализировать, «на что блоггеры и журналисты обращают внимание, игнорируют, празднуют или осуждают».[7]

Процесс проектирования

Обсуждения медиа-ландшафта были постоянными между MIT Media Lab и Беркман-центр Гарвардского университета, и они столкнулись с общим препятствием, состоящим в необходимости решения для обработки данных о новостях в больших масштабах, чтобы получить ответы на определенные вопросы. Мотивация для создания Media Cloud возникла не из-за одного конкретного вопроса, а из-за множества из них. В разделе «О себе» на своей веб-странице разработчики Media Cloud цитируют некоторые из первых вопросов, которые система должна была решить:

  • Представляют ли блоггеры сюжетные линии в основных СМИ или наоборот?
  • Являются ли онлайн-СМИ или печатные новости более мощным средством формирования новостной повестки дня?
  • Какие части мира освещаются или игнорируются различными СМИ?
  • Где и как начинаются важные новости?
  • Как конкурирующие термины одного и того же мероприятия используются в разных публикациях?
  • Можем ли мы охарактеризовать общий состав покрытия для данного источника?
  • Чем отличаются модели освещения местных и национальных новостей?
  • Можем ли мы отслеживать новостные циклы по конкретным вопросам?
  • Формируют ли новости онлайн-комментарии?

В анализ данных затем сможет анализировать различные аспекты освещения новостей, такие как источники средств массовой информации и языки, на которых будут освещаться эти истории.[1]

Как это устроено

Во-первых, Media Cloud выбирает набор медиаисточников и открывает каналы для каждого из них.[1] Затем каждый канал сканируется, чтобы определить, были ли добавлены какие-либо истории в какой-либо канал.[1] Затем извлекается весь контент из каждой релевантной истории. Любая реклама или другие страницы навигации остаются позади.[1] Текст каждой истории разбит на количество слов, которое показывает различные варианты слов, которые каждый медиа-источник использует при обсуждении любой соответствующей темы.[1] Затем количество слов анализируется и публикуется, чтобы показать тенденции данных.[1]

Использование и применение

Media Cloud использовалось с сентября 2010 г. по январь 2012 г. для получения данных для исследования в Центр Беркмана для Интернета и общества который проанализировал 9 757 онлайн-историй, связанных с COICA -СОПА -PIPA дебаты. Приложение с открытым исходным кодом было использовано для текста и анализ ссылок часть исследования.[8] Результаты этого исследования были опубликованы в июле 2013 г. [6].

В Центр Беркмана для Интернета и общества сайт предлагает интерактивную карту визуализации [7] из этого исследования, которое было создано, чтобы «изобразить медиаисточники (« узлы », которые отображаются на карте в виде кружков с разными цветами, обозначающими разные типы медиа) ... [и] отслеживать медиаисточники и их связи в пределах дискретных временных отрезков и позволяет пользователи могут увеличить масштаб дискуссии, чтобы увидеть, какие субъекты присутствуют в дебатах в течение определенного периода ... "[8] Эта карта позволяет визуализировать, как COICA -СОПА -PIPA Споры развивались со временем, используя анализ ссылок.

Многие компании пользуются возможностью анализировать и систематизировать эти новые данные, которые может создать медиа-облако. Такие компании как RAMP предлагают "облачный" способ анализа и создания каждого типа метаданные.[9]

На дискуссию о предвзятости СМИ повлияло то, что проект Media Cloud рассматривается как преобразовавший дискуссию не столько в вопрос личного мнения журналистов, сколько в дискуссию на основе данных.[10]

Подтверждение смещения является одной из форм развития предвзятости СМИ, при которой люди будут искать источники информации, которые соответствуют уже имеющимся у них убеждениям.[11] И конечным следствием предвзятости подтверждения является создание эхо-камеры, ситуация, в которой все стороны спора (обычно две) говорят только сами с собой, и это, скорее всего, приведет к застою в дебатах и ​​затруднит достижение консенсуса.[12] Анализ Media Cloud о Противоречие Gamergate, эпизод личных нападок на женщин-разработчиков игр,[13] показал два кластера источников новостей и дискуссий, которые были разделены по критериям наиболее распространенных мнений. Хотя между этими точками на графике анализа были связи, они не отражали достижение консенсуса и были обозначены как ссылки ненависти, в которых источники, которые будут связывать источники из других кластеров, будут делать это, чтобы категорически не согласиться. с содержанием ссылки.[14][15]

Влияние

Ключевая функциональность медиаоблака заключается в использовании сканирование сети периодически получать статьи из разных источников, а затем разбивать их на слова, которые нужно считать. Затем это количество слов анализируется, чтобы определить, что источники говорят об определенных новостях.[1] Этот процесс не является уникальным для Media Cloud и фактически является приложением недавно популярного потоковые алгоритмы. Это алгоритмы, которые работают с непрерывным и бесконечным потоком данных, а не ждут, пока будет собран полный пакет информации. Эти алгоритмы очень полезны, потому что они позволяют отслеживать тенденции, не зная, какие темы будут наиболее популярными. Этот тип функциональности впервые появился, когда сетевые менеджеры пытались динамически отслеживать, какие сайты имеют наибольший объем трафика. Отсюда потоковые алгоритмы использовались, чтобы программы динамически воздействовали на финансовую информацию, и исследователями, чьи эксперименты генерируют больше данных, чем можно проанализировать, поэтому потоковые алгоритмы используются для динамической фильтрации исходных данных.[16] Медиа-облако аналогичным образом воспользовалось функциональностью потоковых алгоритмов для динамического связывания слов с новостями при сканировании различных источников, а затем предоставило свой сервис подписи для генерации предложений на основе слов, которые интересуют пользователей, и связанных с ними сообщений СМИ.

Идеология

В Центр гражданских СМИ заявляет, что их цель - стимулирование политических действий и поддержка гражданских СМИ путем предоставления центр для производства технологических инноваций, которые могут использоваться в качестве инструментов для таких целей, а также путем координации процессов проектирования на уровне сообществ на муниципальном, национальном и глобальном уровнях.[17]

Медиа-облако - это один из инструментов, используемых Центром гражданских медиа, и способный предоставлять анализ данных касательно освещения новостей из разных источников, он использовался во многих ситуациях для вывода выводов об истории освещения события или категории в новостях, а также для создания вовлечение гражданского общества.[18]

Разработчики Media Cloud намерены помочь онлайн-активизм, предоставляя инструменты для проверки влияния материалов СМИ, написанных активистами. Эти онлайн-активисты могут проверить свое влияние с помощью анализа данных, полученных с помощью инструмента, и поиска важных мест, которых он не смог достичь. Распространение контента, который не достиг определенных целевых групп, может осуществляться с помощью предоставленной платформы.[19]

Проект идентифицирует себя как одно из решений Инновации.

Исследования

SOPA / PIPA

Социальное исследование, которое утверждает, что общественные дебаты были ответственны за Закон о борьбе с пиратством в Интернете неудачу и то, как она сыграла свою роль, предложили пять исследователей Центр Беркмана по Интернету и обществу при Гарвардском университете. Анализ данных был основан на использовании Media Cloud для анализа профилей тех, кто занимается проблемой. Среди участников дискуссии в исследовании перечислены люди всех групп политических убеждений. Что касается источников освещения и площадок для обсуждения, то считается, что технические СМИ, игровые сайты и политические блоги сыграли большую роль, чем основные СМИ. Главный вывод исследования состоит в том, что диверсификация политических взглядов, а не поляризация дебатов позволили достичь консенсуса, который вынудил политиков проголосовать против законопроекта.[20]

Смерть Трейвона Мартина

В Pew Research Center классифицировал съемка Трейвона Мартина, подросток, которого выстрелил в грудь полицейский из Флориды,[21] самые освещаемые новости с социальной составляющей за пять лет, предшествовавших событию. В документе, подготовленном с использованием Media Cloud, предполагается, что участие альтернативных СМИ помогло сместить фокус сюжета с эпизода со стрельбой на серию репортажей о расовая сегрегация.[22][23]

Аборт

В исследовании, проведенном Джулией Вейхерт и Кэтрин Ида, Media Cloud использовалось для анализа характера освещения новостей о дебатах об абортах, уделяя особое внимание тем, которыми чаще всего пользуются в социальных сетях. По словам сторонников, цифры исследования показали, что освещение в СМИ был сосредоточен на законодательстве и активизме. Кроме того, после ручной классификации источников освещения новостей как имеющих конкретные политические взгляды (консервативный, либеральный, центрист и либертарианец ), они указывают на различное использование изображений внутри этих кластеров: то, что они классифицировали как либеральные СМИ, демонстрирующие протесты, основные СМИ, показывающие законодательные фотографии, и консервативные СМИ, демонстрирующие изображения плода или живого младенца. На основании этих результатов Джулия и Кэтрин пришли к выводу, что со стороны организации не хватает стратегии. сторона выбора, в отличие от того, что они считают хорошо оформленным повествованием со стороны сторона защиты жизни.[18]

Чарли Эбдо и резня Бага

В течение первой недели 2015 года два разных эпизода религиозное насилие вызванный Исламские экстремисты проходил в Бага и Париж. Исследование, проведенное СМИ Разговор с помощью Media Cloud оценили и сравнили новостное освещение этих двух событий. Результаты исследования указывают на гораздо больший охват Чарли Эбдо стрельба[24] чем Резня в Баге[25] глобально. В исследовании также сообщается, что освещение терактов в Париже превысило освещение резни в Баге даже в Нигерия. В отчете неравномерное внимание СМИ объясняется не только Евроцентризм, но с трудностью принять сторону в конфликте между Боко Харам и Нигерийская армия.[26]

Чистый нейтралитет

Исследование Berkman Klein Center по результатам анализа данных Media Cloud о влиянии Интернета[27] об отмене предложенной политики по Чистый нейтралитет посредством Федеральная комиссия связи высказался за то, что разнообразие дебатов помогло сформировать результат обращения.[28]

Дело Нирбхая

Новости из групповое изнасилование студента-медика, Нирбхая, в Нью-Дели[29] вызвали рост освещения в новостях сексуального насилия в Индии. Это событие стало предметом исследования Media Cloud, в котором анализировался характер сообщений о сексуальных домогательствах. Сторонники исследования защищали, что освещение новостей игнорировало гендерное неравенство как причину таких эпизодов, и что они рассматривались как эпизодические события, в которых виноваты были только лица, согласно полученному ими анализу данных. .[30]

Будущее использование

В день перезапуска Media Cloud Итан Цукерман сказал: «Мы надеемся, что инструменты, которые мы предоставляем, станут дополнением к удивительным усилиям, таким как Project for Excellence в освещении новостей журналистики и индексы новых медиа - мы считаем их инструменты золотым стандартом для понимания того, что темы обсуждаются в американских СМИ. PEJ творит чудеса, используя талантливые команды программистов, которые пробуют разные уголки медиаэкосистемы, чтобы узнать, что обсуждается. Мы используем огромные наборы данных, алгоритмы и автоматизацию, чтобы дать другую картину, сфокусированную на одной на языке, а не на теме ".[7]

Будущее использование Media Cloud может включать смартфон или же планшет приложения для представления платформы пользователям вне компьютера. Приложение Media Cloud может служить источником новостей для пользователей в пути. Если бы Media Cloud расширилось на разные информационные сайты, оно могло бы ориентироваться на сайты социальных сетей и включать в них новости. Twitter и Facebook включили функции для актуальных новостей и тем, аналогичные тем, что стремится делать Media Cloud.

Инструмент расширяется до источников, которые не квалифицируются как СМИ, чтобы понять последствия изучаемых событий.[31] Социальные сети являются основной целью, поскольку они включают не только обмен новостями, но и реакцию на общий контент.[32]

Рекомендации

Центр Беркмана, Кембридж, Массачусетс, США
  1. ^ а б c d е ж грамм час Медиа-облако. О В архиве 2012-09-08 в Archive.today. Проверено 12 октября 2011 г.
  2. ^ Патрисия Коэн. «Горячая история, которая должна быть: отслеживание новостей через киберпространство». New York Times, 5 августа 2009 г.
  3. ^ Беркман Центр. Медиа Облако. Проверено 12 октября 2011 г.
  4. ^ Алиса Миллер. Преобразование средств массовой информации: улучшение новостей одним щелчком мыши. TED Books, 2011 г.
  5. ^ https://github.com/berkmancenter/mediacloud#user-content-license
  6. ^ Медиа-облако. Медиа наборы. Проверено 12 октября 2011 г.
  7. ^ а б c d е Цукерман, Итан. "Медиа-облако, перезапуск". Архивировано из оригинал 27 февраля 2014 г.. Получено 20 февраля 2014.
  8. ^ а б Центр Бекмана для Интернета и общества. «Новая публикация:« Социальная мобилизация и сетевая общественная сфера: отображение дебатов SOPA-PIPA »"". Гарвардский университет. Получено 19 марта 2014.
  9. ^ «Архивная копия». Архивировано из оригинал на 2014-02-17. Получено 2014-02-23.CS1 maint: заархивированная копия как заголовок (связь)
  10. ^ Ван, Шань (6 июня 2016 г.). «Это новое сотрудничество надеется помочь бесконечным дебатам о СМИ с некоторыми достоверными данными». NiemanLab. Получено 7 декабря 2016.
  11. ^ Плюс, Скотт (1993). Психология суждения и принятия решений. п.233.
  12. ^ sdf (24 июня 2004 г.). "Джон Горенфельд, Мессия Луна и Медиа-эхо-камера". Daily Kos. Получено 7 декабря 2016.
  13. ^ Eördögh, Fruzsina (25 ноября 2014 г.). «Gamergate и новая орда цифровых саботажников». Получено 7 декабря 2016.
  14. ^ Туфекчи, Зейнеп (28 марта 2014 г.). «Большие вопросы для больших данных в социальных сетях: репрезентативность, валидность и другие методологические ошибки». arXiv:1403.7400 [cs.SI ].
  15. ^ http://www.americanscientist.org/issues/pub/the-britney-spears-problem/1
  16. ^ Итан Цукерман. «О Центре гражданских медиа». Архивировано из оригинал 20 декабря 2016 г.. Получено 7 декабря 2016.
  17. ^ а б Итан Цукерман (26 августа 2015 г.). «Понимание освещения в СМИ: семь летних экспериментов с медиа-облаком». Получено 7 декабря 2016.
  18. ^ Итан Цукерман (30 октября 2015 г.). «Могут ли новаторы построить разрушительное и справедливое будущее?». Получено 7 декабря 2016.
  19. ^ Бенклер; и другие. (Июль 2013). «Социальная мобилизация и сетевая общественная сфера: отображение дебатов SOPA-PIPA». SSRN  2295953. Цитировать журнал требует | журнал = (помощь)
  20. ^ Burch, Audra D. S .; Лаура Изензее (22 марта 2012 г.). «Трейвон Мартин: типичный подросток, который любил видеоигры, с нетерпением ждал выпускного вечера». Майами Геральд. Получено 23 марта, 2012.
  21. ^ Graeff, Erdhaert; Мэтт Стемпек; Итан Цукерман (17 января 2014 г.). «Битва за« Трейвона Мартина »: отображение противоречий в средствах массовой информации в Интернете и за его пределами». Первый понедельник. Получено 7 декабря 2016.
  22. ^ Кэролайн О'Донован (14 февраля 2014 г.). «Как преступление становится политическим: Трейвон Мартин и то, как различные СМИ совместно создают новости». Получено 7 декабря 2016.
  23. ^ "Атака Charlie Hebdo: три дня террора". 14 января 2015. Получено 7 декабря 2016.
  24. ^ Доннелли, Элизабет (13 января 2015 г.). «Резня Боко Харам: 7 вопросов, которые стоит задать». Получено 7 декабря 2016.
  25. ^ Цукерман, Итан (13 января 2015 г.). «Освещение в СМИ Charlie Hebdo и резни в Баге: исследование контрастов». Получено 7 декабря 2016.
  26. ^ Ланнон, Роберт; Апендлтон (2 сентября 2014 г.). «Что мы можем узнать из 800 000 публичных комментариев к плану сетевого нейтралитета FCC?». Получено 7 декабря 2016.
  27. ^ Фарис, Роберт; и другие. (Февраль 2015 г.). «Еще один рейтинг для Интернета? Роль сетевой общественной сферы в дебатах о политике нейтралитета США» (PDF). Получено 7 декабря 2016.
  28. ^ Эмма Хендерсон (20 декабря 2015 г.). «Дело Nirbhaya: гнев и массовые протесты в связи с освобождением несовершеннолетнего преступника из банды Дели после трех лет содержания в исправительном центре». Получено 7 декабря 2016.
  29. ^ Анушка Шах (10 декабря 2015 г.). «Это то, что не так с тем, как индийские новости освещают женские проблемы». Получено 7 декабря 2016.
  30. ^ Цукерман, Итан (24 августа 2015 г.). «Цифровые СМИ и место Ганы на мировой арене». Получено 7 декабря 2016.
  31. ^ Келси, Элли (27 ноября 2016 г.). «Современные социальные сети и их влияние на общество». Получено 7 декабря 2016.

внешняя ссылка