Человеко-компьютерный поиск информации - Human–computer information retrieval
Человеко-компьютерный поиск информации (HCIR) - это исследование и разработка поиск информации методы, которые привносят человеческий интеллект в поиск процесс. Он сочетает в себе области взаимодействие человека с компьютером (HCI) и поиска информации (IR) и создает системы, которые улучшают поиск, принимая во внимание человеческий контекст или с помощью многоэтапного процесса поиска, который предоставляет возможность обратной связи с людьми.
История
Этот термин человеко-компьютерный поиск информации был придуман Гэри Маркионини в серии лекций, прочитанных с 2004 по 2006 гг.[1] Главный тезис Маркионини заключается в том, что «HCIR направлен на то, чтобы дать людям возможность исследовать крупномасштабные информационные базы, но требует, чтобы люди также брали на себя ответственность за этот контроль, расходуя когнитивную и физическую энергию».
В 1996 и 1998 годах пара мастерских на Университет Глазго на поиск информации и взаимодействие человека с компьютером стремились устранить частичное совпадение этих двух полей. Маркионини отмечает влияние Всемирная паутина и внезапное увеличение информационная грамотность - изменения, которые только зарождались в конце 1990-х.
Несколько семинаров были посвящены пересечению IR и HCI. Семинар по исследовательскому поиску, инициированный Лаборатория взаимодействия человека и компьютера Мэрилендского университета в 2005 г. чередуется Ассоциация вычислительной техники Специальная группа по поиску информации (SIGIR) и Специальная группа по взаимодействию компьютера и человека (CHI) конференции. Также в 2005 г. Европейский научный фонд провел исследовательский семинар по поиску информации в контексте. Затем в 2007 г. был проведен первый семинар по поиску информации с помощью компьютера. Массачусетский Институт Технологий.
Описание
HCIR включает в себя различные аспекты IR и HCI. К ним относятся поисковый поиск, в котором пользователи обычно сочетают стратегии запросов и просмотра, чтобы способствовать обучению и исследованию; поиск информации в контексте (т. е. с учетом аспектов пользователя или среды, которые обычно не отражаются в запросе); и интерактивный поиск информации, который Питер Ингверсен определяет как «интерактивные коммуникационные процессы, которые происходят во время поиска информации с участием всех основных участников поиска информации (IR), то есть пользователя, посредника и IR-системы».[2]
Основная задача HCIR заключается в том, чтобы системы IR, предназначенные для пользователей-людей, внедрялись и оценивались таким образом, чтобы отражать потребности этих пользователей.[3]
В большинстве современных ИК-систем используется в рейтинге модель поиска, в которой документы оцениваются на основе вероятность документа актуальность на запрос.[4] В этой модели система представляет пользователю только документы с самым высоким рейтингом. Эти системы обычно оцениваются на основе их средняя средняя точность по набору эталонных запросов от таких организаций, как Конференция по поиску текста (TREC).
Из-за того, что в HCIR делается упор на использование человеческого интеллекта в процессе поиска информации, требуются разные модели оценки - та, которая сочетает в себе оценку компонентов IR и HCI системы. Ключевое направление исследований в HCIR - оценка этих систем. Ранние работы по интерактивному поиску информации, такие как Юрген Кёнеманн и Николай Дж. Белкин в исследовании 1996 года различных уровней взаимодействия для автоматического переформулирования запросов с использованием стандартных показателей IR точность и отзывать но применять их к результатам нескольких итераций взаимодействия с пользователем, а не к одному ответу на запрос.[5] В других исследованиях HCIR, таких как модель оценки IIR Пиа Борлунд, применяется методология, более напоминающая HCI, с упором на характеристики пользователей, детали экспериментального плана и т. Д.[6]
Цели
Исследователи HCIR поставили следующие цели в отношении системы, в которой пользователь имеет больший контроль при определении соответствующих результатов.[1][7]
Системы должны
- больше не только доставлять соответствующие документы, но также должны предоставлять семантическую информацию вместе с этими документами
- повысить ответственность пользователей, а также контроль; то есть информационные системы требуют интеллектуальных усилий человека
- имеют гибкую архитектуру, чтобы они могли развиваться и адаптироваться к все более требовательным и осведомленным базам пользователей
- стремиться быть частью информационной экологии личных и общие воспоминания и инструменты, а не отдельные отдельные сервисы
- поддерживать весь жизненный цикл информации (от создания до сохранения), а не только этап распространения или использования
- поддержка настройки конечными пользователями и особенно специалистами в области информации, которые повышают ценность информационных ресурсов
- быть увлекательным и забавным в использовании
Короче говоря, ожидается, что системы поиска информации будут работать так же, как и хорошие библиотеки. Системы должны помогать пользователям преодолевать разрыв между данными или информацией (в очень узком, детализированном смысле этих терминов) и знаниями (обработанными данными или информацией, которые обеспечивают контекст, необходимый для информирования следующей итерации процесса поиска информации). То есть хорошие библиотеки предоставляют как информацию, в которой нуждается патрон, так и партнера в процессе обучения - информационный профессионал - ориентироваться в этой информации, понимать ее, сохранять и превращать в знания (что, в свою очередь, создает новые, более информированные потребности в информации).
Методы
Методы, связанные с HCIR, подчеркивают представление информации, использующей человеческий интеллект, чтобы привести пользователя к соответствующим результатам. Эти методы также стремятся позволить пользователям исследовать и переваривать набор данных без штрафных санкций, то есть без ненужных затрат времени, щелчков мыши или сдвига контекста.
Много поисковые системы имеют функции, которые включают в себя методы HCIR. Предложения по правописанию и автоматическое переформулирование запроса предоставить механизмы для предложения потенциальных путей поиска, которые могут привести пользователя к релевантным результатам. Эти предложения представляются пользователю, предоставляя пользователю возможность выбора и интерпретации.
Фасетный поиск позволяет пользователям перемещаться по информации иерархически, переходя от категории к подкатегориям, но выбирая порядок, в котором категории представлены. Это контрастирует с традиционными таксономии в котором иерархия категорий фиксирована и неизменна. Фасетная навигация подобно таксономической навигации, направляет пользователей, показывая им доступные категории (или фасеты), но не требует от них просмотра иерархии, которая может не совсем соответствовать их потребностям или образу мышления.[8]
Смотреть вперед обеспечивает общий подход к исследованию без штрафных санкций. Например, различные веб-приложения нанять AJAX для автоматического заполнения условий запроса и предложения популярных поисковых запросов. Другим распространенным примером упреждающего просмотра является способ, которым поисковые системы аннотируют результаты сводной информацией об этих результатах, включая как статическую информацию (например, метаданные об объектах) и «фрагменты» текста документа, наиболее подходящие для слов в поисковом запросе.
Отзыв о релевантности позволяет пользователям направлять IR-систему, указывая, являются ли конкретные результаты более или менее актуальными.[9]
Обобщение и аналитика помочь пользователям усвоить результаты, полученные по запросу. Обобщение здесь предназначено для охвата любых средств агрегирование или же сжатие запрос приводит к более удобной для человека форме. Фасетный поиск, описанный выше, является одной из таких форм резюмирования. Другой кластеризация, который анализирует набор документов, группируя похожие или совпадающие документы или термины. Кластеризация позволяет разделить результаты на группы связанных документов. Например, поиск по запросу "java" может вернуть кластеры для Java (язык программирования), Ява (остров), или же Ява (кофе).
Визуальное представление данных также считается ключевым аспектом HCIR. Представление обобщения или аналитики может отображаться в виде таблиц, диаграмм или сводок агрегированных данных. Другие виды визуализация информации которые позволяют пользователям получать доступ к сводным представлениям результатов поиска, включая облака тегов и древовидная карта.
Связанные области
Рекомендации
- ^ а б Маркионини, Г. (2006). К бюллетеню по поиску информации между человеком и компьютером, июнь / июль 2006 г. Бюллетень Американского общества информационных наук.
- ^ "Ingwersen, P. (1992). Взаимодействие при поиске информации. Лондон: Тейлор Грэм". Архивировано из оригинал на 2007-11-25. Получено 2007-11-28.
- ^ "Рабочая группа Mira (1996 г.). Рамки оценки для приложений интерактивного поиска мультимедийной информации". Архивировано из оригинал на 2008-02-01.
- ^ Гроссман Д. и Фридер О. (2004). Алгоритмы поиска информации и эвристика.
- ^ Коенеманн Дж. И Белкин Н. Дж. (1996). Случай для взаимодействия: исследование поведения и эффективности интерактивного поиска информации. В материалах конференции SIGCHI по человеческому фактору в вычислительных системах: точки соприкосновения (Ванкувер, Британская Колумбия, Канада, 13–18 апреля 1996 г.). М. Дж. Таубер, Под ред. ЧИ '96. ACM Press, Нью-Йорк, Нью-Йорк, 205-212
- ^ Борлунд, П. (2003). Модель оценки IIR: основа для оценки интерактивных информационно-поисковых систем. Информационные исследования, 8 (3), документ 152
- ^ Уайт Р., Капра Р., Головчинский Г., Кулес Б., Смит К. и Тункеланг Д. (2013). Введение в специальный выпуск о человеко-компьютерном поиске информации. Журнал обработки информации и управления 49 (5), 1053-1057
- ^ Херст, М. (1999). Пользовательские интерфейсы и визуализация, глава 10 Баеза-Йейтс, Р. и Рибейро-Нето, Б., Современный поиск информации.
- ^ Роккио, Дж. (1971). Актуальность обратной связи в поиске информации. В: Salton, G (ed), Система поиска SMART.