Я ищу - Isearch

Я ищу является Открытый исходный код поиск текста программное обеспечение, впервые разработанное в 1994 г. Насиб Нассар в составе Isite Z39.50 информационная база. Проект стартовал в Информационная служба для поиска и извлечения сетевой информации (CNIDR) суперкомпьютерного центра MCNC в Северной Каролине и финансируется Национальный фонд науки следовать по следу WAIS и разработать прототипы систем для распределенных информационных сетей, включающих Интернет-приложения, библиотечные каталоги и другие информационные ресурсы.

Основные функции Isearch включают полнотекстовый поиск и поиск по полю, ранжирование по релевантности, логические запросы и поддержку многих типов документов, таких как HTML, почтовые папки, дайджесты списков, MEDLINE, BibTeX, SGML / XML, метаданные FGDC, NASA DIF, метаданные ANZLIC. , Метаданные ISO 19115 и многие другие типы ресурсов и форматы документов.

Это была первая поисковая система, которая была разработана с нуля для поддержки SGML и Z39.50 поиск и извлечение. Он включал в себя множество нововведений, включая модель «типа документа» - которая представляет собой просто (объектно-ориентированный) метод связывания каждого документа с классом функций, обеспечивающих стандартный интерфейс для доступа к документу. Это был один из первых движков (если не первый), когда-либо поддерживающий XML.

Алгоритмы поиска / индексирования текста Isearch были основаны на Гастон Гонне плодотворная работа над массивами PAT и деревьями для поиска текста --- идеи, которые были разработаны для проекта New Oxford English Dictionary в Univ. Ватерлоо и предоставил семена для Тим Брей движок PAT SGML, который лег в основу Открытый текст. Однако одним из ограничивающих факторов дизайна Isearch было то, что он не очень хорошо подходил для обработки чрезвычайно больших наборов данных, которые стали популярными в середине-конце 1990-х годов. Во многих случаях Isearch был адаптирован или изменен для использования различных алгоритмов, но обычно сохранял модель типа документа и архитектурную взаимосвязь с Isite.

Isearch получил широкое распространение и использовался на сотнях общедоступных поисковых сайтов, в том числе во многих крупных проектах, таких как Патентный поиск в Ведомстве США по патентам и товарным знакам (USPTO),Федеральный центр обмена географическими данными (FGDC), Глобальный каталог изменений НАСА, Система справочников НАСА EOS, Проект взаимодействия каталогов НАСА, служба предварительной печати астрономических данных на базе Научного института космического телескопа, Электронный бюллетень РСТ Всемирной организации интеллектуальной собственности (ВОИС), Linsearch ( поисковая машина для программного обеспечения с открытым исходным кодом, разработанная Майлзом Эфроном), проект SAGE Департамента специальных коллекций Университета Эмори, Eco Companion Australasia (каталог экологических геопространственных ресурсов), Австралийская национальная служба геномной информации (ANGIS), Open Directory Project и многочисленные правительственные порталы в контексте Службы поиска правительственной информации (GILS) GPO мандат (закончился в 2005 г.?).

С 1994 по 1998 год большая часть разработки была сосредоточена на Центре обмена информацией по обнаружению и извлечению сетевой информации (CNIDR) в Северной Каролине (ядро ядра) и BSn в Германии (Doctypes). К 1998 году большинство разработчиков ядра Isearch с открытым исходным кодом переориентировали разработку на несколько дополнительных. В 1998 году он стал частью эталонной программной платформы Advanced Search Facility, финансируемой Министерством торговли США.

A / WWW Enterprises в настоящее время поддерживает версию с открытым исходным кодом для публичного использования при поддержке платных государственных клиентов, таких как Бюро по патентам и товарным знакам США, НАСА и FGDC, которые предоставили поддержку для повышения функциональности и надежности программного обеспечения. Программный пакет считается эталонной реализацией программного обеспечения службы каталогов.

По состоянию на 2010 год версия Isearch с открытым исходным кодом все еще используется на 250+ узлах FGDC, а также ANZLIC в Австралии и избранными участниками Geospatial OneStop для облегчения сбора урожая GOS, включая NOAA, Бюро переписи населения и Полевой офис штата Теннеси. Служба рыбы и дикой природы, среди прочего.

Рекомендации