Эта страница была переведа с помощью Cloud Translation API.
Switch to English

отвлеченные рассуждения

  • Описание :

Данные процедурно генерируемых матриц (PGM) из статьи «Измерение абстрактного мышления в нейронных сетях», Барретт, Хилл, Санторо и др. 2018. Цель состоит в том, чтобы вывести правильный ответ из контекстных панелей на основе абстрактных рассуждений.

Чтобы использовать этот набор данных, загрузите все файлы * .tar.gz со страницы набора данных и поместите их в ~ / tensorflow_datasets / abstract_reasoning /.

$ R $ обозначает набор типов отношений (прогрессия, XOR, OR, AND, согласованное объединение), $ O $ обозначает типы объектов (форма, линия), а $ A $ обозначает типы атрибутов (размер, цвет, положение, количество). Структура матрицы $ S $ - это набор троек $ S = {[r, o, a]} $, которые определяют задачу, поставленную конкретной матрицей.

  • Домашняя страница : https://github.com/deepmind/abstract-reasoning-matrices

  • Исходный код : tfds.image.AbstractReasoning

  • Версии :

    • 1.0.0 (по умолчанию): без примечаний к выпуску.
  • Размер загрузки : Unknown size

  • Размер набора данных : Unknown size

  • Инструкции по загрузке вручную : для этого набора данных необходимо вручную загрузить исходные данные в download_config.manual_dir (по умолчанию ~/tensorflow_datasets/downloads/manual/ ):
    Данные можно загрузить с https://console.cloud.google.com/storage/browser/ravens-matrices. Поместите все файлы tar.gz в manual_dir.

  • Автоматическое кэширование ( документация ): неизвестно

  • Сплит :

Трещина Примеры
'test' 200 000
'train' 1,200,000
'validation' 20 000
  • Особенности :
FeaturesDict({
    'answers': Video(Image(shape=(160, 160, 1), dtype=tf.uint8)),
    'context': Video(Image(shape=(160, 160, 1), dtype=tf.uint8)),
    'filename': Text(shape=(), dtype=tf.string),
    'meta_target': Tensor(shape=(12,), dtype=tf.int64),
    'relation_structure_encoded': Tensor(shape=(4, 12), dtype=tf.int64),
    'target': ClassLabel(shape=(), dtype=tf.int64, num_classes=8),
})
  • Контролируемые ключи (см. as_supervised ): None

  • Цитата :

@InProceedings{pmlr-v80-barrett18a,
  title =    {Measuring abstract reasoning in neural networks},
  author =   {Barrett, David and Hill, Felix and Santoro, Adam and Morcos, Ari and Lillicrap, Timothy},
  booktitle =    {Proceedings of the 35th International Conference on Machine Learning},
  pages =    {511--520},
  year =     {2018},
  editor =   {Dy, Jennifer and Krause, Andreas},
  volume =   {80},
  series =   {Proceedings of Machine Learning Research},
  address =      {Stockholmsmassan, Stockholm Sweden},
  month =    {10--15 Jul},
  publisher =    {PMLR},
  pdf =      {http://proceedings.mlr.press/v80/barrett18a/barrett18a.pdf},
  url =      {http://proceedings.mlr.press/v80/barrett18a.html},
  abstract =     {Whether neural networks can learn abstract reasoning or whetherthey merely rely on superficial statistics is a topic of recent debate. Here, we propose a dataset and challenge designed to probe abstract reasoning, inspired by a well-known human IQ test. To succeed at this challenge, models must cope with various generalisation 'regimes' in which the training data and test questions differ in clearly-defined ways. We show that popular models such as ResNets perform poorly, even when the training and test sets differ only minimally, and we present a novel architecture, with structure designed to encourage reasoning, that does significantly better. When we vary the way in which the test questions and training data differ, we find that our model is notably proficient at certain forms of generalisation, but notably weak at others. We further show that the model's ability to generalise improves markedly if it is trained to predict symbolic explanations for its answers. Altogether, we introduce and explore ways to both measure and induce stronger abstract reasoning in neural networks. Our freely-available dataset should motivate further progress in this direction.}
}

abstract_reasoning / нейтральный (конфигурация по умолчанию)

  • Описание конфигурации : структуры, кодирующие матрицы как в
    обучающие и тестовые наборы содержат любые тройки $ [r, o, a] $ для $ r \ in R $,
    $ o \ in O $ и $ a \ in A $. Наборы для обучения и тестирования не пересекаются, с
    разделение происходит на уровне входных переменных (т.е.
    проявления).

  • Примеры ( tfds.as_dataframe ):

abstract_reasoning / интерполяция

  • Описание конфигурации : Как и в случае нейтрального разделения, $ S $ состоит из любых
    тройки $ [r, o, a] $. Для интерполяции в обучающей выборке, когда
    атрибут был «цвет» или «размер» (т. е. упорядоченные атрибуты), значения
    атрибуты были ограничены чётно-индексированными членами дискретного набора,
    тогда как в тестовом наборе допускались только значения с нечетным индексом. Обратите внимание, что все
    $ S $ содержит тройку $ [r, o, a] $ с атрибутом цвета или размера.
    Таким образом, по каждому вопросу тестового набора требуется обобщение.

  • Примеры ( tfds.as_dataframe ):

abstract_reasoning / экстраполяция

  • Описание конфигурации : То же, что и при интерполяции, но значения
    атрибуты были ограничены нижней половиной дискретного набора во время
    обучение, тогда как в тестовой выборке они принимали значения в верхней половине.

  • Примеры ( tfds.as_dataframe ):

abstract_reasoning / attr.rel.pairs

  • Описание конфигурации : Все $ S $ содержали не менее двух троек,
    $ ([r_1, o_1, a_1], [r_2, o_2, a_2]) = (t_1, t_2) $, из которых 400 жизнеспособны. Мы
    случайным образом распределены 360 для обучающего набора и 40 для тестового набора. Члены
    $ (t_1, t_2) $ из 40 удерживаемых пар не встречались вместе в структурах $ S $
    в обучающей выборке, и все структуры $ S $ имели хотя бы одну такую ​​пару
    $ (t_1, t_2) $ как подмножество.

  • Примеры ( tfds.as_dataframe ):

abstract_reasoning / attr.rels

  • Описание конфигурации : В нашем наборе данных существует 29 возможных уникальных
    тройки $ [r, o, a] $. Мы произвольно выделили семь из них для тестовой выборки,
    но так, чтобы каждый из атрибутов был представлен в этом наборе ровно один раз.
    Эти удерживаемые тройки никогда не встречались в вопросах обучающей выборки, и
    каждый $ S $ в тестовом наборе содержал хотя бы один из них.

  • Примеры ( tfds.as_dataframe ):

abstract_reasoning / attrs.pairs

  • Описание конфигурации : $ S $ содержит не менее двух троек. Всего 20
    (неупорядоченные) жизнеспособные пары атрибутов $ (a_1, a_2) $ такие, что для некоторых
    $ r_i, o_i, ([r_1, o_1, a_1], [r_2, o_2, a_2]) $ - жизнеспособная тройная пара
    $ ([r_1, o_1, a_1], [r_2, o_2, a_2]) = (t_1, t_2) $. Мы выделили 16 из этих пар
    для обучения и четыре для тестирования. Для пары $ (a_1, a_2) $ в тестовом наборе,
    $ S $ в обучающей выборке содержал тройки с $ a_1 $ или $ a_2 $. В тесте
    установлено, все $ S $ содержали тройки с $ a_1 $ и $ a_2 $.

  • Примеры ( tfds.as_dataframe ):

abstract_reasoning / attrs.shape.color

  • Описание конфигурации : Неактивный атрибут shape-color. $ S $ в
    обучающая выборка не содержала троек с $ o $ = shape и $ a $ = color.
    Все структуры, определяющие головоломки в тестовом наборе, содержали хотя бы одну тройку
    с $ o $ = shape и $ a $ = color.

  • Примеры ( tfds.as_dataframe ):

abstract_reasoning / attrs.line.type

  • Описание конфигурации : Тип строки удерживаемого атрибута. $ S $ в
    обучающая выборка не содержала троек с $ o $ = line и $ a $ = type.
    Все структуры, определяющие головоломки в тестовом наборе, содержали хотя бы одну тройку
    с $ o $ = line и $ a $ = type.

  • Примеры ( tfds.as_dataframe ):