Расширенная логическая модель - Extended Boolean model
В Расширенная логическая модель был описан в Сообщениях статьи ACM, появившейся в 1983 году Джерардом Солтоном, Эдвардом А. Фоксом и Гарри Ву. Цель расширенной логической модели - преодолеть недостатки булевой модели, которая использовалась в поиск информации. Булевская модель не учитывает веса терминов в запросах, и набор результатов логического запроса часто либо слишком мал, либо слишком велик. Идея расширенной модели заключается в использовании частичного согласования и весов членов, как в модели векторного пространства. Он сочетает в себе характеристики Векторная модель пространства со свойствами Булева алгебра и оценивает сходство между запросами и документами. Таким образом, документ может быть в некоторой степени актуальным, если он соответствует некоторым из запрошенных условий и будет возвращен в результате, тогда как в Стандартная логическая модель это не было.[1]
Таким образом, расширенную булеву модель можно рассматривать как обобщение моделей как булевых, так и векторных пространств; эти два являются частными случаями, если используются подходящие настройки и определения. Кроме того, исследования показали, что эффективность улучшается по сравнению с обработкой логических запросов. Другое исследование показало, что обратная связь по релевантности и расширение запроса может быть интегрирован с расширенной обработкой логических запросов.
Определения
в Расширенная логическая модель, документ представлен в виде вектора (аналогично векторной модели). Каждый я измерение соответствует отдельному термину, связанному с документом.
Вес срока KИкс связанный с документом dj измеряется его нормализованным Частота сроков и может быть определен как:
куда IdfИкс является частота обратного документа и жх, j частота термина для термина x в документе j.
Вектор веса, связанный с документом dj можно представить как:
Пример двух измерений
Учитывая пространство, состоящее из двух терминов KИкс и Kу только соответствующие веса термов равны ш1 и ш2.[2] Таким образом, для запроса qили же = (KИкс ∨ Kу), мы можем вычислить подобие по следующей формуле:
Для запроса qи = (KИкс ∧ Kу), мы можем использовать:
Обобщение идеи и P-норм
Мы можем обобщить предыдущий пример двумерной расширенной булевой модели на более высокое t-мерное пространство, используя евклидовы расстояния.
Это можно сделать с помощью P-нормы что расширяет понятие расстояния, включая p-расстояния, где 1 ≤ п ≤ ∞ это новый параметр.[3]
- Обобщенный конъюнктивный запрос задается следующим образом:
- Сходство и можно определить как:
:
- Обобщенный дизъюнктивный запрос задается следующим образом:
- Сходство и можно определить как:
Примеры
Рассмотрим запрос q = (K1 ∧ K2) ∨ K3. Сходство между запросами q и документ d можно вычислить по формуле:
Улучшения по сравнению со стандартной логической моделью
Ли и Фокс[4] сравнили Стандартные и Расширенные логические модели с тремя наборами тестов, CISI, CACM и INSPEC. Используя P-нормы, они получили среднее улучшение точности на 79%, 106% и 210% по сравнению со Стандартной моделью для коллекций CISI, CACM и INSPEC. , соответственно.
Модель P-нормы требует больших вычислительных ресурсов из-за большого количества операций возведения в степень, которые она требует, но дает гораздо лучшие результаты, чем Стандартная модель и даже Нечеткое извлечение техники. В Стандартная логическая модель по-прежнему самый эффективный.
дальнейшее чтение
- Методы адаптивной обратной связи в расширенной булевой модели доктора Джонпилла Чоя
- Интерполяция расширенной логической модели поиска
- Fox, E .; Betrabet, S .; Кушик, М .; Ли, В. (1992), Информационный поиск: алгоритмы и структуры данных; Расширенная логическая модель, Prentice-Hall, Inc.
- Скорковская, Люси; Ирсинг, Павел (2009), "Эксперименты с автоматической формулировкой запросов в расширенной логической модели", Текст, речь и диалог, Конспект лекций по информатике, 5729, Springer Berlin / Heidelberg, стр. 371–378, Дои:10.1007/978-3-642-04208-9_51, HDL:11025/16985, ISBN 978-3-642-04207-2
Смотрите также
Рекомендации
- ^ Солтон, Джерард; Фокс, Эдвард А .; Ву, Гарри (1983), "Расширенный логический поиск информации", Коммуникации ACM, Сообщения ACM, Том 26, Выпуск 11, 26 (11): 1022–1036, Дои:10.1145/182.358466, HDL:1813/6351
- ^ "Люшэн Ван". Архивировано из оригинал на 2011-09-27. Получено 2009-12-01.
- ^ Гарсия, доктор Э., Расширенная логическая модель - взвешенные запросы: веса терминов, запросы p-Norm и типы множественных понятий. Логическое ИЛИ Расширенное? И это запрос
- ^ Lee, W. C .; Фокс, Э.А. (1988), Экспериментальное сравнение схем интерпретации логических запросов. (PDF)