Граф знаний - Knowledge graph
А граф знаний это база знаний который использует графическую структуру модель данных или топология для интеграции данных. Графы знаний часто используются для хранения взаимосвязанных описаний сущности - объекты, события, ситуации или абстрактные концепции - с семантикой произвольной формы.[1]
С момента развития Семантическая сеть, графы знаний часто связаны с связанные открытые данные проекты, фокусируясь на связях между концепциями и сущностями.[2][3] Они также широко используются в поисковых системах, таких как Google, Bing, и Yahoo; системы знаний и службы ответов на вопросы, такие как Вольфрам Альфа, Apple Siri, и Amazon Алекса; и социальные сети, такие как LinkedIn и Facebook.
История
Этот термин был придуман еще в 1972 году при обсуждении того, как построить модульные системы обучения для курсов.[4] В конце 1980-х гг. Гронинген и Твенте университеты совместно начали проект под названием Графики знаний, сосредоточение внимания на дизайне семантических сетей с ребрами, ограниченными ограниченным набором отношений, чтобы облегчить алгебры на графе. В последующие десятилетия различия между семантическими сетями и графами знаний были размыты.
Некоторые ранние графики знаний были тематическими. В 1985 г. Wordnet была основана, фиксируя семантические отношения между словами и значениями - применение этой идеи к самому языку. В 2005 году Марк Вирк основал Geonames для фиксации отношений между различными географическими названиями и регионами и связанными объектами. В 1998 году Эндрю Эдмондс из Science in Finance Ltd в Великобритании создал систему под названием ThinkBase, которая предлагала рассуждения на основе нечеткой логики в графическом контексте.[5]
В 2007 году оба DBpedia и Freebase были созданы как хранилища знаний общего назначения на основе графов. DBpedia сосредоточилась исключительно на данных, извлеченных из Википедии, в то время как Freebase также включала ряд общедоступных наборов данных. Ни те, ни другие не называли себя «графом знаний», но разработали и описали связанные концепции.
В 2012 году Google представила свои Сеть знаний,[6] опираясь на DBpedia и Freebase среди других источников. Позже они включили RDFa, Микроданные, JSON-LD контент, извлеченный из проиндексированных веб-страниц, включая Всемирный справочник ЦРУ, Викиданные, и Википедия.[6][7] Типы сущностей и отношений, связанные с этим графом знаний, были дополнительно организованы с использованием терминов из schema.org.[8] словарный запас. Google Сеть знаний стал успешным дополнением к строковому поиску в Google, а его популярность в Интернете привела к более широкому использованию этого термина.[8]
С тех пор несколько крупных транснациональных корпораций рекламировали использование графов знаний, что еще больше популяризировало этот термин. К ним относятся Facebook, LinkedIn, Airbnb, Microsoft, Amazon, Убер и eBay.[9]
Определения
Не существует единого общепринятого определения графа знаний. Большинство определений рассматривают тему через призму семантической паутины и включают в себя следующие особенности:[10]
- Гибкие отношения между знаниями в актуальных областях: Граф знаний (i) определяет абстрактные классы и отношения сущностей в схеме, (ii) в основном описывает сущности реального мира и их взаимосвязи, организованные в виде графа, (iii) позволяет потенциально связывать произвольные сущности друг с другом, и (iv ) охватывает различные тематические области.[11]
- Общая структура: Сеть сущностей, их семантические типы, свойства и отношения.[12][13]
- Подтверждение рассуждений по предполагаемым онтологиям: Граф знаний собирает и интегрирует информацию в онтологию и применяет логику рассуждений для получения новых знаний.[2]
Однако существует множество представлений графов знаний, для которых некоторые из этих функций не актуальны. Для таких графов знаний более полезным может оказаться более простое определение:
- Цифровая структура, которая представляет знания как концепции и отношения между ними (факты). Граф знаний может включать в себя онтологию, которая позволяет людям и машинам понимать его содержимое и рассуждать о нем.[14]
Реализации
Помимо приведенных выше примеров, этот термин использовался для описания проектов открытых знаний, таких как YAGO и Викиданные; федерации, такие как облако связанных открытых данных;[15] ряд коммерческих инструментов поиска, в том числе помощник по семантическому поиску Yahoo Spark, Google Сеть знаний и Microsoft Satori; и диаграммы сущностей LinkedIn и Facebook.[2] Этот термин также все чаще используется в приложениях для создания заметок, позволяющих пользователю построить свой личный граф знаний.
Использование графа знаний для анализа данных
Граф знаний формально представляет семантику, описывая сущности и их отношения. Графики знаний могут использовать онтологии как слой схемы. Тем самым они позволяют логический вывод для извлечения неявное знание а не только разрешать запросы, запрашивающие явные знания.[16]
Чтобы разрешить использование графов знаний в различных задачах машинного обучения, было разработано несколько методов для получения представлений скрытых функций сущностей и отношений. Эти встраивания графов знаний позволяют подключать их к методам машинного обучения, требующим векторов функций, таких как вложения слов. Это может дополнять другие оценки концептуального сходства.[17] [18]
Смотрите также
Рекомендации
- ^ "Что такое сеть знаний?". 2018.
- ^ а б c Эрлингер, Лиза; Весс, Вольфрам (2016). К определению графов знаний (PDF). SEMANTiCS2016. Лейпциг: совместные материалы трека плакатов и демонстраций 12-й Международной конференции по семантическим системам - SEMANTiCS2016 и 1-го Международного семинара по семантическим изменениям и эволюции семантики (SuCCESS16). С. 13–16.
- ^ Сойлу, Ахмет (2020). «Улучшение государственных закупок в Европейском Союзе путем построения и использования интегрированной сети знаний». Материалы Международной конференции по семантической паутине (ISWC 2020): 430–446. Дои:10.1007/978-3-030-62466-8_27.
- ^ Эдвард В. Шнайдер. 1973. Прикладная модуляризация курса: интерфейсная система и ее значение для управления последовательностью и анализа данных. Ассоциация по разработке учебных систем (ADIS), Чикаго, Иллинойс, апрель 1972 г.
- ^ "Торговая марка США № 75589756".
- ^ а б Сингхал, Амит (16 мая 2012 г.). «Знакомство с сетью знаний: вещи, а не строки». Официальный блог Google. Получено 21 марта 2017.
- ^ Шварц, Барри (17 декабря 2014 г.). "Бесплатная база Google закрывается после перехода на Викиданные: влияние на сеть знаний?". Круглый стол поисковой системы. Получено 10 декабря, 2017.
- ^ а б Маккаскер, Джеймс П .; МакГиннес, Дебора Л. "Что такое сеть знаний?". www.authorea.com. Получено 21 марта 2017.
- ^ «Предприятия сети знаний». 2020.
- ^ Хоган, Эйдан; Бломквист, Ева; Кочес, Майкл; д'Амато, Клаудиа; де Мело, Жерар; Гутьеррес, Клаудио; Гайо, Хосе Эмилио Лабра; Кирран, Сабрина; Ноймайер, Себастьян; Поллерес, Аксель; Навильи, Роберто (2020-04-16). «Графики знаний». arXiv:2003.02320 [cs.AI ].
- ^ Паульхейм, Хайко (2017). «Уточнение графа знаний: обзор подходов и методов оценки» (PDF). Семантическая сеть: 489–508. Получено 21 марта 2017.
- ^ Кроеч, Маркус; Вейкум, Герхард. «Специальный выпуск о сети знаний». Журнал веб-семантики. Получено 21 марта 2017.
- ^ «Что такое сеть знаний? | Онотекст». Онтекст. Получено 2020-07-01.
- ^ «Сеть знаний о графах знаний». 2020.
- ^ «Связанное облако открытых данных». lod-cloud.net. Получено 2020-06-30.
- ^ "Каковы преимущества Панели знаний Google?". GKP Maker. 2020-10-06. Получено 2020-10-28.
- ^ Хунвэй Ван (октябрь 2018 г.). «RippleNet: распространение пользовательских предпочтений в сети знаний для рекомендательных систем». Международная конференция ACM по управлению информацией и знаниями: 417–426. arXiv:1803.03467. Дои:10.1145/3269206.3271739. S2CID 3766110.
- ^ «Встраивание моделей для завершения графа знаний».
внешняя ссылка
- Уилл Дуглас Хевен (4 сентября 2020 г.). "Этот всезнайка ИИ учится, непрерывно читая всю сеть". Обзор технологий MIT. Получено 5 сентября 2020.
Diffbot строит крупнейший в истории граф знаний, применяя распознавание изображений и обработку естественного языка к миллиардам веб-страниц.
Scholia имеет тема профиль для Граф знаний. |