Сеть отношений - Relation network

А сеть отношений (RN) - это искусственная нейронная сеть компонент со структурой, которая может рассуждать об отношениях между объектами. Примерная категория таких отношений: пространственные отношения (вверху, внизу, слева, справа, впереди, сзади).[1]

RN могут выводить отношения, они эффективны в отношении данных и работают с набором объектов безотносительно к порядку объектов.[1]

История

В июне 2017 г. DeepMind объявил о первой сети отношений. В нем утверждалось, что технология достигла «сверхчеловеческих» характеристик на нескольких вопросно-ответный наборы задач.[1]

Спектакль
Набор данныхТочностьЗаметки
CleVR (пиксель)95.5%Изображения 3D-объектов, таких как сферы и цилиндры. Типы вопросов: запросы «атрибутов» («Какого цвета сфера?», Запросы «сравнения атрибутов» («Куб из того же материала, что и цилиндр?»), Запросы «подсчет» («Сколько сфер?» )
CleVR (описание состояния)96.4%Изображения представлены матрицами описания состояний. Каждая строка матрицы содержала характеристики отдельного объекта: координаты (x, y, z); цвет (г, г, б); форма (куб, цилиндр, ...); материал (резина, металл, ...); размер (маленький, большой, ...).
Типа CLEVR94%2D-изображения, каждое из которых содержит 6 квадратов и / или кругов 6 цветов. Вопросы кодируются как двоичные числа фиксированной длины, что устраняет сложности анализа естественного языка. Каждое изображение содержит 10 относительных («Какая форма объекта наиболее удалена от серого объекта?») И 10 нереляционных («Какая форма у серого объекта?») Вопросов.
баби90%Текстовые данные. 20 задач, каждая из которых требует определенного типа рассуждений, таких как дедукция, индукция или счет. Каждый вопрос связан с набором поддерживающих предложений. Например, предложения «Сандра взяла футбол» и «Сандра пошла в офис» подтверждают вопрос «Где футбол?» (ответ: «офис»). Каждое предложение обрабатывается отдельно. Порог успеха - 95%. 10к записей.
Динамическая физическая система93% контактов

/ 95% подсчет

Шары, движущиеся по поверхности, с упругими и неупругими связями. Один тест определил, были ли соединены пары шаров. Другой определил, сколько из них были связаны.

дизайн

RN ограничивают функциональную форму нейронной сети, чтобы уловить общие свойства реляционного мышления. Эти свойства явно добавляются к системе, а не устанавливаются путем обучения, так же как способность рассуждать о пространственных, инвариантных свойствах явным образом является частью сверточные нейронные сети (CNN). Рассматриваемые данные могут быть представлены в виде простого списка или в виде ориентированный граф чьи узлы являются объектами, а края - парами объектов, отношения которых необходимо учитывать. RN - это составная функция:

где вход - это набор «объектов» это яth объекта, а fφ и gθ - функции с параметрами φ и θ соответственно и q вот в чем вопрос. и находятся многослойные персептроны, в то время как 2 параметра - это обучаемые синаптические веса. РН дифференцируемы. Результатом gθ является «отношение»; следовательно, роль gθ заключается в выводе любых способов, которыми связаны два объекта.[1]

Обработка изображений (128x128 пикселей) осуществляется с помощью 4-х слойной CNN. Выходные данные CNN рассматриваются как объекты для анализа отношений, независимо от того, что эти «объекты» явно представляют. Вопросы обрабатывались с долговременная кратковременная память сеть.[1]

Смотрите также

использованная литература

  1. ^ а б c d е Санторо, Адам; Рапосо, Дэвид; Барретт, Дэвид Г.Т .; Малиновский, Матеуш; Паскану, Разван; Батталья, Питер; Лилликрап, Тимоти (5 июня 2017 г.). «Простой модуль нейронной сети для реляционных рассуждений». arXiv:1706.01427 [cs.CL ].