Информационное окно - Infobox
На вики, информационное окно это стол используется для сбора и представления подмножества информации о предмете, например документ. Это структурированный документ содержащий набор пары атрибут – значение,[1] И в Википедия представляет собой сводку информации о предмете статья.[2] Таким образом, они сопоставимы с данными столы в некоторых аспектах. Когда он представлен в более крупном документе, в котором он резюмируется, информационное окно часто представляется в виде боковая панель формат.
Информационное окно может быть реализовано в другом документе с помощью включая его в этот документ и указав некоторые или все пары атрибут-значение, связанные с этим информационным блоком, известные как параметризация.
Википедия
Информационное окно можно использовать для обобщения информации статьи о Википедия.[3] Они используются в похожих статьях, чтобы обеспечить единообразие изложения за счет использования общего формата.[4][2] Изначально инфобоксы (и шаблоны в целом) использовались для макет страницы целей.[2] Информационное окно можно включить в статью, указав ценить для некоторых или всех его параметры.[5] Используемое имя параметра должно быть таким же, как указано в шаблоне информационного окна, но с ним может быть связано любое значение.[5] Имя ограниченный от стоимости на знак равенства.[5] Название параметра можно рассматривать как атрибут тематики статьи.[6]
{{Infobox готовые блюда | name = | изображение = | imagesize = | caption = | альтернативное_имя = | страна = | регион = | создатель = | конечно = | type = | обслужено = | main_ingredient = | вариации = | калории = | другое =}} | {{Infobox готовые блюда | name = Crostata | image = Crostata limone e zenzero 3.jpg | imagesize = | caption = Кростата с начинкой из лимона и имбиря | альтернативное_имя = | страна = [[Италия]]| регион = [[Ломбардия]]| создатель = | конечно = [[Десерт]]| type = [[Пирог]]| обслужено = | main_ingredient = Кондитерская корочка, [[варенье]] или же [[рикотта]], фрукты | варианты = ''Crostata di frutta'', ''Crostata di Ricotta'', многие другие сладкие и соленые блюда | калории = | другое =}} |
Информационное окно Инфобокс готовой еды используется в статьях Википедии, связанных с едой, без значения указан для своего параметры (атрибуты). | То же информационное окно, что реализовано в статье Crostata. Обратите внимание, что значения находятся справа от знак равенства (=), и что имена параметров такие же, как и в спецификации для шаблона информационного окна. Значения указаны в разметка вики: записи, заключенные в квадратные скобки (например, [[Tart]]), будут отображаться как ссылка на соответствующую статью Википедии (например, Пирог ), и связанный файл будет включен в статью вместо его разметки. |
В Википедии информационное окно включается в статью путем включения его имени и пар атрибут-значение в двойной набор подтяжки. В MediaWiki программное обеспечение, на котором работает Википедия, разбирает документ, для которого инфобокс и другие шаблоны обрабатываются обработчик шаблонов. Это шаблонизатор что дает веб-документ и таблица стилей используется для презентации документа. Это позволяет отделить дизайн информационного окна от содержимого, которым он управляет;[2] то есть дизайн шаблона может быть обновлен, не затрагивая содержащуюся в нем информацию, и новый дизайн будет автоматически распространяться на все статьи, включающие информационное окно.[4] Обычно инфобоксы форматированный для отображения в правом верхнем углу статьи Википедии на рабочем столе,[3] или вверху в мобильной версии.
Размещение инфобокса внутри wikitext статьи важен для доступность.[7] А лучшая практика разместить их после устранение неоднозначности шаблоны (те, которые направляют читателей к статьям по темам с похожими названиями) и шаблоны обслуживания (например, помечающие статью как не имеющую ссылок), но перед всеми остальными содержание.[8][9]
Баеза-Йейтс и Кинг говорят, что некоторые редакторы считают такие шаблоны, как информационные окна, сложными,[10] поскольку шаблон может скрывать текст о свойстве или ресурсе, которые редактор желает изменить; это усугубляется связанными шаблонами, то есть шаблонами, включенными в другие шаблоны.[10]
По состоянию на август 2009 года английская Википедия использовала около 3000 шаблонов информационных ящиков, которые в совокупности использовали более 20 000 атрибутов.[11] С тех пор многие из них были объединены, чтобы уменьшить избыточность. По состоянию на июнь 2013 г. произошло не менее 1 345 446 исключений материнской компании. Шаблон информационного окна ,[12] используется некоторыми, но не всеми, информационными ящиками в 4 251 127 статьях.
Имя информационного окна обычно - «Информационное окно [жанр]»; тем не менее, широко используемым информационным ящикам могут быть присвоены более короткие названия, такие как «taxobox» для таксономии.[8]
Машинное обучение
Около 44,2% статей Википедии содержали информационные окна в 2008 году,[13] и около 33% в 2010 г.[14] Автоматизированный семантическое извлечение знаний с помощью машинное обучение алгоритмы используются для «извлечения машинно-обрабатываемой информации при относительно низкой стоимости сложности».[1] Однако низкий уровень охвата затрудняет задачу, хотя это можно частично преодолеть, дополнив данные статьи данными в категории в которую включена статья.[13] В Французская Википедия инициировал проект Инфобокс Версия 2 в мае 2011 г.[15][16]
Знания, полученные с помощью машинного обучения, можно использовать для улучшения статьи, например, с помощью автоматизированных программных предложений редакторам для добавления данных инфобокса.[13] Проект iPopulator создал систему для добавления значения к параметру информационного окна статьи посредством автоматического анализа текста этой статьи.[11]
DBpedia использует структурированный контент извлекается из инфобоксов[2] алгоритмами машинного обучения для создания ресурса связанные данные в Семантическая сеть; это было описано Тим Бернерс-Ли как «один из наиболее известных» компонентов проекта связанных данных.[17]
Машинное извлечение создает тройку, состоящую из субъекта, предиката или отношения и объекта.[1] Каждая пара атрибут-значение информационного окна используется для создания RDF заявление с использованием онтология.[18] Этому способствует более узкий разрыв между Википедией и онтологией, чем существует между неструктурированным или свободным текстом и онтологией.[19]
Семантические отношения между субъектом и объектом устанавливаются предикатом.[1] В информационном окне примера тройка ("crostata", type, "tart") указывает, что Crostata это тип пирог. Тема статьи используется в качестве темы, имя параметра используется в качестве предиката, а значение параметра - в качестве объекта.[18][1] Каждый тип информационного блока сопоставляется с классом онтологии, и каждое свойство (параметр) в информационном блоке сопоставляется со свойством онтологии.[20] Эти сопоставления используются при анализе статьи Википедии для извлечения данных.
Примечания
- ^ а б c d е Баеза-Ятс и Кинг 2009, п. 31.
- ^ а б c d е Лиянг 2011, п. 385.
- ^ а б Бротон 2008, п. 357.
- ^ а б Бротон 2008, п. 17.
- ^ а б c Бротон 2008, п. 18.
- ^ Баеза-Ятс и Кинг 2009, п. 30.
- ^ Бротон 2008, п. 234.
- ^ а б Бротон 2008, п. 235.
- ^ В Английская Википедия политика доступности указана в Википедия: Руководство по стилю / доступности. Политика о wikitext макет указан в Википедия: Руководство по стилю / макету и Википедия: Руководство по стилю / руководству.
- ^ а б Баеза-Ятс и Кинг 2009, п. 345.
- ^ а б Ланге, Бем и Науманн, 2010 г., п. 7.
- ^ "Инструменты сервера инструментов Jarry1250 - счетчик включения шаблонов". Список проектов Викимедиа. 7 июня 2013 г.. Получено 7 июн 2013.
- ^ а б c Баеза-Ятс и Кинг 2009, п. 28.
- ^ Ланге, Бем и Науманн, 2010 г., п. 5.
- ^ Гертман, Райнхардт и Топпен, 2011 г., п. 493.
- ^ Проект размещен на Французская Википедия страница Инфобокс / V2.
- ^ Миллер 2008.
- ^ а б Лиянг 2011, п. 387.
- ^ Вирву и Мацуура 2012, п. 315.
- ^ Лиянг 2011, п. 395.
Рекомендации
- Баеза-Йейтс, Рикардо; Кинг, Ирвин, ред. (2009). Услуги по ткачеству и люди во всемирной паутине. Springer. ISBN 9783642005695. LCCN 2009926100.
- Бротон, Джон (14 июля 2008 г.). Парикмахерская, Нан; Мейерс, Питер (ред.). Википедия - Пропавшее руководство. O'Reilly Media. ISBN 9780596553777.
- Гиртман, Стэн; Рейнхардт, Вольфганг; Топпен, Фред, ред. (2011). Развитие геоинформатики в меняющемся мире. Конспект лекций по геоинформации и картографии. 1. Springer. Дои:10.1007/978-3-642-19789-5. ISBN 9783642197888. ISSN 1863-2246. LCCN 2011925152.
- Ланге, Дастин; Бём, Кристоф; Науманн, Феликс (2010). Извлечение структурированной информации из статей Википедии для заполнения информационных ящиков. Technische Berichte des Hasso-Plattner-Instituts für Softwaresystemtechnik an der Universität Potsdam, Hasso-Plattner-Institut für Softwaresystemtechnik Potsdam. Universitätsverlag Potsdam. ISBN 9783869560816.
- Ю, Лиянг (2011). Руководство по семантической сети для разработчиков. Springer. Дои:10.1007/978-3-642-15970-1. ISBN 9783642159695.
- Миллер, Пол (2007-02-07). «Сэр Тим Бернерс-Ли беседует с Талис о семантической сети». Транскрипция CastingWords. Талис Групп. Архивировано из оригинал на 2013-05-10. Получено 2013-06-02.
- Вирву, Мария; Мацуура, Саэко, ред. (2012). Инженерия программного обеспечения, основанная на знаниях: Материалы десятой совместной конференции по инженерии программного обеспечения, основанной на знаниях. Границы, искусственный интеллект и приложения. 240. IOS Press. ISBN 9781614990932. LCCN 2012943674.
дальнейшее чтение
- Kiran, Kumar N .; Santosh, G.S.K .; Варма, Васудева (июнь 2011 г.). «Кластеризация многоязычных документов с использованием Википедии в качестве внешнего знания». Междисциплинарный поиск информации. Конспект лекций по информатике. Springer Berlin Heidelberg. 6653. Дои:10.1007/978-3-642-21353-3. ISBN 9783642213533. ISSN 0302-9743.
- Чутипорн, Анутария; Домингу, Джон, ред. (2008). Семантическая сеть: 3-я Азиатская конференция по семантической сети, ASWC 2008, Бангкок, Таиланд, 8-11 декабря 2008 г. Материалы. Конспект лекций по информатике. 5367. Springer. ISBN 9783540897033. ISSN 0302-9743.
- Ву, Фэй; Хоффманн, Ральф; Weld, Daniel s. (2008). «Извлечение информации из Википедии: спуск по длинному хвосту». Материалы 14-й международной конференции ACM SIGKDD по обнаружению знаний и интеллектуальному анализу данных. Ассоциация вычислительной техники: 731–739. Дои:10.1145/1401890.1401978. ISBN 9781605581934.