Метод анализа информации на естественном языке - Cognition enhanced Natural language Information Analysis Method
Метод анализа информации на естественном языке с улучшенными познаниями (CogNIAM) концептуальный метод моделирования на основе фактов, который направлен на интеграцию различных измерений знаний: данных, правил, процессов и семантики. Для представления этих размеров мировые стандарты SBVR, BPMN и DMN от Группа управления объектами (OMG) используются. CogNIAM, преемник НИАМ, основан на работе ученого Сир Нейссен.[нужна цитата ]
CogNIAM структурирует знания, полученные от людей, документации и программного обеспечения, путем их классификации. Для этой цели CogNIAM использует так называемый «треугольник знаний».[1] Результат CogNIAM не зависит от того, кто его применяет. Полученная модель позволяет выразить знания в схематическая форма а также в контролируемый естественный язык.[2]
Различные измерения знания
CogNIAM распознает 4 различных аспекта знаний:
- Данные: каковы факты?
- Процесс: как создаются / удаляются / изменяются факты?
- Семантика: что означают факты?
- Правила: Какие условия применяются к фактам?
Эти размеры сильно влияют друг на друга. Правила ограничивают данные, семантика описывает концепции и термины, используемые в процессах и т. Д., Поэтому цель CogNIAM - объединить эти различные измерения.
Структурирование знаний
Как упоминалось ранее, CogNIAM классифицирует знания, используя треугольник знаний. Знания, которые можно сопоставить с треугольником знаний, имеют структурную значимость и могут быть выражены словами. Знания, которые невозможно передать словами, например «Мона Лиза», не включаются. Также знания должны быть структурно релевантными. Структурно несущественна, например, мотивация (почему?). Это важная информация, но она не добавляет ценности модели.[3] Остальные знания можно сопоставить с треугольником знаний. Треугольник знаний состоит из трех уровней
- Уровень 1 - Уровень фактов
Большинство знаний состоит из конкретных фактов. Факты описывают возможные текущие, прошлые или будущие состояния. В CogNIAM факт определяется как «утверждение, признанное соответствующим сообществом истинным».[4]
Пример факта уровня 1:
- «Столица Италии - Рим».
- Уровень 2 - уровень домена
На этом уровне указаны правила, регулирующие факты уровня 1. В приведенном выше примере правилом, регулирующим факты уровня 1, может быть «у страны ровно одна столица». Это правило гарантирует, что на уровне 1 не могут произойти ложные состояния или запрещенные переходы между различными состояниями. Помимо правил, уровень 2 содержит еще шесть категорий знаний, которые обсуждаются в следующей главе.
- Уровень 3 - Общий уровень
Этот уровень не связан с какой-либо конкретной областью, он ничего не говорит о столицах или странах. Поскольку уровень 2 управляет фактами на уровне 1, общий уровень управляет категориями знаний уровня 2. Он состоит из тех же категорий знаний, но здесь они применяются к содержанию уровня 2. Другими словами, уровень 3 содержит правила. которые определяют правила. Общий уровень также можно рассматривать как уровень, зависящий от предметной области, где предметная область является «знанием предметной области». В результате уровень 3 также управляет собой.
Категории знаний
Уровни 2 и 3 треугольника знаний состоят из семи категорий знаний:
- Определения понятий описывают значение каждого термина или группы терминов на уровне фактов. Здесь можно найти большую часть измерения семантики.
- Типы фактов предоставляют функциональные возможности для определения того, какие типы фактов считаются входящими в область интереса.
- Шаблоны общения:
- Шаблоны коммуникации фактов действуют как механизм коммуникации, который может использоваться в качестве шаблона для передачи фактов с использованием терминов, с которыми специалист в данной области знаком
- Шаблоны связи правил действуют как механизм связи для правил (см. Ниже) концептуальной схемы.
- Правила, различающие:
- Правила целостности или проверки, также известные как ограничения, ограничивают набор фактов и переходы между разрешенными наборами фактов теми, которые считаются полезными. Что касается качества данных, правила целостности используются, чтобы гарантировать качество фактов.
- Правила вывода используются для получения или расчета новой информации (фактов) на основе существующей информации.
- Правила Exchange передают факты в администрацию этого домена или удаляют факты из администрации. Другими словами, они определяют, как факты добавляются и / или удаляются из базы фактов, чтобы система оставалась синхронизированной с информацией о внешнем мире.
- Правила событий определяют, когда обновлять набор основных фактов с помощью правила деривации или правила обмена в контексте описания процесса.
- В описаниях процессов указываются действия по получению фактов и / или созданию фактов (правила обмена и / или деривации), которые должны выполняться различными субъектами для этого процесса, а также правила событий, вызывающие выполнение этих правил обмена и деривации в упорядоченном манера.
- Акторы, определяющие вовлеченных участников и их обязанности в процессах (с точки зрения правил обмена и деривации, которые они должны выполнять).
- Услуги, идентифицирующие реализации описаний процессов с точки зрения информационных продуктов, которые будут предоставлены или с которыми будут проводиться консультации
Рекомендации
- ^ Сир Нейссен и Андре Ле Кат. Кеннис Гебасерд Веркен], 2009. с. 118-148
- ^ Нейссен, Герард Мария, и Теренс Эйдан Халпин. Концептуальная схема и дизайн реляционной базы данных: подход, ориентированный на факты. Prentice-Hall, Inc., 1989.
- ^ Сир Нейссен. Kenniskunde 1A. 2001. с. 3
- ^ Лемменс, Инге, Жан-Поль Костер и Серж Валера. «Достижение функциональной совместимости на семантическом уровне». Конфедеративные международные конференции OTM «На пути к полноценным интернет-системам». Springer International Publishing, 2015. стр. 210