Сеть отношений - Relation network
А сеть отношений (RN) - это искусственная нейронная сеть компонент со структурой, которая может рассуждать об отношениях между объектами. Примерная категория таких отношений: пространственные отношения (вверху, внизу, слева, справа, впереди, сзади).[1]
RN могут выводить отношения, они эффективны в отношении данных и работают с набором объектов безотносительно к порядку объектов.[1]
История
В июне 2017 г. DeepMind объявил о первой сети отношений. В нем утверждалось, что технология достигла «сверхчеловеческих» характеристик на нескольких вопросно-ответный наборы задач.[1]
Набор данных | Точность | Заметки |
---|---|---|
CleVR (пиксель) | 95.5% | Изображения 3D-объектов, таких как сферы и цилиндры. Типы вопросов: запросы «атрибутов» («Какого цвета сфера?», Запросы «сравнения атрибутов» («Куб из того же материала, что и цилиндр?»), Запросы «подсчет» («Сколько сфер?» ) |
CleVR (описание состояния) | 96.4% | Изображения представлены матрицами описания состояний. Каждая строка матрицы содержала характеристики отдельного объекта: координаты (x, y, z); цвет (г, г, б); форма (куб, цилиндр, ...); материал (резина, металл, ...); размер (маленький, большой, ...). |
Типа CLEVR | 94% | 2D-изображения, каждое из которых содержит 6 квадратов и / или кругов 6 цветов. Вопросы кодируются как двоичные числа фиксированной длины, что устраняет сложности анализа естественного языка. Каждое изображение содержит 10 относительных («Какая форма объекта наиболее удалена от серого объекта?») И 10 нереляционных («Какая форма у серого объекта?») Вопросов. |
баби | 90% | Текстовые данные. 20 задач, каждая из которых требует определенного типа рассуждений, таких как дедукция, индукция или счет. Каждый вопрос связан с набором поддерживающих предложений. Например, предложения «Сандра взяла футбол» и «Сандра пошла в офис» подтверждают вопрос «Где футбол?» (ответ: «офис»). Каждое предложение обрабатывается отдельно. Порог успеха - 95%. 10к записей. |
Динамическая физическая система | 93% контактов / 95% подсчет | Шары, движущиеся по поверхности, с упругими и неупругими связями. Один тест определил, были ли соединены пары шаров. Другой определил, сколько из них были связаны. |
дизайн
RN ограничивают функциональную форму нейронной сети, чтобы уловить общие свойства реляционного мышления. Эти свойства явно добавляются к системе, а не устанавливаются путем обучения, так же как способность рассуждать о пространственных, инвариантных свойствах явным образом является частью сверточные нейронные сети (CNN). Рассматриваемые данные могут быть представлены в виде простого списка или в виде ориентированный граф чьи узлы являются объектами, а края - парами объектов, отношения которых необходимо учитывать. RN - это составная функция:
где вход - это набор «объектов» это яth объекта, а fφ и gθ - функции с параметрами φ и θ соответственно и q вот в чем вопрос. fφ и gθ находятся многослойные персептроны, в то время как 2 параметра - это обучаемые синаптические веса. РН дифференцируемы. Результатом gθ является «отношение»; следовательно, роль gθ заключается в выводе любых способов, которыми связаны два объекта.[1]
Обработка изображений (128x128 пикселей) осуществляется с помощью 4-х слойной CNN. Выходные данные CNN рассматриваются как объекты для анализа отношений, независимо от того, что эти «объекты» явно представляют. Вопросы обрабатывались с долговременная кратковременная память сеть.[1]