Получение состязательной информации - Adversarial information retrieval
Получение состязательной информации (состязательный IR) - тема в поиск информации связаны со стратегиями работы с источником данных, часть которого была использована злонамеренно. Задачи могут включать в себя сбор, индексирование, фильтрацию, извлечение и ранжирование информации из такого источника данных. Adversarial IR включает изучение методов обнаружения, выделения и пресечения таких манипуляций.
В Интернете преобладающей формой таких манипуляций является рассылка спама в поисковых системах (также известный как спамдексинг), который включает использование различных методов для нарушения работы поисковые системы, обычно ради финансовой выгоды. Примеры спамодексирования: бомбардировка ссылок, комментарий или же реферер спам, спам-блоги (splogs), вредоносные теги. Разобрать механизм с целью понять, как это работает из алгоритмы ранжирования, блокировка рекламы, мошенничество с кликами,[1] и фильтрация веб-контента также могут рассматриваться как формы состязательности манипуляция данными.[2]
Темы
Темы, связанные с веб-спамом (спамодексингом):
- Ссылочный спам
- Спам по ключевым словам
- Маскировка
- Вредоносные теги
- Спам, связанный с блогами, в том числе спам в комментариях, сплоги, и пинг спам
Другие темы:
- Мошенничество с кликами обнаружение
- Обратный инжиниринг поисковый движок с рейтинг алгоритм
- Интернет фильтрация содержимого
- Блокировка рекламы
- Скрытность ползать
- Тролль (Интернет)
- Вредоносная пометка или голосование в социальные сети
- Астротурфинг
- Sockpuppetry
История
Термин «состязательный поиск информации» был впервые введен в обращение в 2000 г. Андрей Бродер (затем главный научный сотрудник Альта Виста ) во время веб-пленарного заседания на TREC -9 конференция.[3]
Смотрите также
Рекомендации
- ^ Янсен, Б. Дж. (2007) Мошенничество с кликами. Компьютер IEEE. 40 (7), 85-86.
- ^ Б. Дэвисон, М. Наджорк и Т. Конверс (2006 г.), Отчет SIGIR Worksheet: состязательный поиск информации в Интернете (AIRWeb 2006)
- ^ Д. Хокинг и Н. Крэсуэлл (2004 г.), Очень крупномасштабное извлечение и поиск в Интернете (препринт) В архиве 2007-08-29 на Wayback Machine
внешняя ссылка
- AIRWeb: серия семинаров по состязательному поиску информации в сети
- Проблема веб-спама: конкурс для исследователей по обнаружению веб-спама
- Наборы данных веб-спама: наборы данных для исследований по обнаружению веб-спама