Halaman ini diterjemahkan oleh Cloud Translation API.
Switch to English

abstract_reasoning

  • Deskripsi :

Data Prosedural Generated Matrices (PGM) dari makalah Mengukur Abstrak Penalaran di Jaringan Saraf, Barrett, Hill, Santoro et al. 2018. Tujuannya adalah untuk menyimpulkan jawaban yang benar dari panel konteks berdasarkan penalaran abstrak.

Untuk menggunakan kumpulan data ini, harap unduh semua file * .tar.gz dari halaman kumpulan data dan tempatkan di ~ / tensorflow_datasets / abstract_reasoning /.

$ R $ menunjukkan himpunan tipe relasi (perkembangan, XOR, OR, AND, gabungan yang konsisten), $ O $ menunjukkan tipe objek (bentuk, garis), dan $ A $ menunjukkan tipe atribut (ukuran, warna, posisi, jumlah). Struktur matriks, $ S $, adalah himpunan tripel $ S = {[r, o, a]} $ yang menentukan tantangan yang diajukan oleh matriks tertentu.

Membagi Contoh
'test' 200.000
'train' 1.200.000
'validation' 20.000
  • Fitur :
FeaturesDict({
    'answers': Video(Image(shape=(160, 160, 1), dtype=tf.uint8)),
    'context': Video(Image(shape=(160, 160, 1), dtype=tf.uint8)),
    'filename': Text(shape=(), dtype=tf.string),
    'meta_target': Tensor(shape=(12,), dtype=tf.int64),
    'relation_structure_encoded': Tensor(shape=(4, 12), dtype=tf.int64),
    'target': ClassLabel(shape=(), dtype=tf.int64, num_classes=8),
})
@InProceedings{pmlr-v80-barrett18a,
  title =    {Measuring abstract reasoning in neural networks},
  author =   {Barrett, David and Hill, Felix and Santoro, Adam and Morcos, Ari and Lillicrap, Timothy},
  booktitle =    {Proceedings of the 35th International Conference on Machine Learning},
  pages =    {511--520},
  year =     {2018},
  editor =   {Dy, Jennifer and Krause, Andreas},
  volume =   {80},
  series =   {Proceedings of Machine Learning Research},
  address =      {Stockholmsmassan, Stockholm Sweden},
  month =    {10--15 Jul},
  publisher =    {PMLR},
  pdf =      {http://proceedings.mlr.press/v80/barrett18a/barrett18a.pdf},
  url =      {http://proceedings.mlr.press/v80/barrett18a.html},
  abstract =     {Whether neural networks can learn abstract reasoning or whetherthey merely rely on superficial statistics is a topic of recent debate. Here, we propose a dataset and challenge designed to probe abstract reasoning, inspired by a well-known human IQ test. To succeed at this challenge, models must cope with various generalisation 'regimes' in which the training data and test questions differ in clearly-defined ways. We show that popular models such as ResNets perform poorly, even when the training and test sets differ only minimally, and we present a novel architecture, with structure designed to encourage reasoning, that does significantly better. When we vary the way in which the test questions and training data differ, we find that our model is notably proficient at certain forms of generalisation, but notably weak at others. We further show that the model's ability to generalise improves markedly if it is trained to predict symbolic explanations for its answers. Altogether, we introduce and explore ways to both measure and induce stronger abstract reasoning in neural networks. Our freely-available dataset should motivate further progress in this direction.}
}

abstract_reasoning / netral (konfigurasi default)

  • Deskripsi konfigurasi : Struktur yang mengkodekan matriks di kedua file
    set pelatihan dan pengujian berisi tiga kali lipat $ [r, o, a] $ untuk $ r \ in R $,
    $ o \ dalam O $, dan $ a \ dalam A $. Set pelatihan dan pengujian terputus-putus, dengan
    pemisahan yang terjadi pada level variabel input (yaitu piksel
    manifestasi).

  • Contoh ( tfds.as_dataframe ):

abstract_reasoning / interpolation

  • Deskripsi konfigurasi : Seperti pada pemisahan netral, $ S $ terdiri dari apa saja
    tiga kali lipat $ [r, o, a] $. Untuk interpolasi, di set pelatihan, saat file
    atributnya adalah "warna" atau "ukuran" (yaitu, atribut yang dipesan), nilai dari
    atribut dibatasi untuk anggota genap dari satu set diskrit,
    sedangkan dalam set pengujian hanya nilai indeks ganjil yang diizinkan. Catat itu semua
    $ S $ berisi beberapa triple $ [r, o, a] $ dengan atribut color or size.
    Jadi, generalisasi diperlukan untuk setiap pertanyaan dalam set pengujian.

  • Contoh ( tfds.as_dataframe ):

abstract_reasoning / ekstrapolasi

  • Deskripsi konfigurasi : Sama seperti di interpolasi, tetapi nilai
    atribut dibatasi ke bagian bawah dari set diskrit selama
    pelatihan, sedangkan di set tes mereka mengambil nilai di bagian atas.

  • Contoh ( tfds.as_dataframe ):

abstract_reasoning / attr.rel.pairs

  • Deskripsi konfigurasi : Semua $ S $ berisi setidaknya dua tripel,
    $ ([r_1, o_1, a_1], [r_2, o_2, a_2]) = (t_1, t_2) $, 400 di antaranya layak. Kita
    mengalokasikan 360 secara acak ke set pelatihan dan 40 ke set pengujian. Anggota
    $ (t_1, t_2) $ dari 40 pasangan yang ditahan tidak muncul bersamaan dalam struktur $ S $
    di set pelatihan, dan semua struktur $ S $ memiliki setidaknya satu pasangan seperti itu
    $ (t_1, t_2) $ sebagai subset.

  • Contoh ( tfds.as_dataframe ):

abstract_reasoning / attr.rels

  • Config description : Dalam dataset kami, ada 29 kemungkinan unique
    tiga kali lipat $ [r, o, a] $. Kami mengalokasikan tujuh di antaranya untuk set pengujian, secara acak,
    tetapi sedemikian rupa sehingga setiap atribut diwakili tepat satu kali dalam set ini.
    Tiga kali lipat yang diulurkan ini tidak pernah muncul dalam pertanyaan di set pelatihan, dan
    setiap $ S $ dalam set pengujian berisi setidaknya satu dari mereka.

  • Contoh ( tfds.as_dataframe ):

abstract_reasoning / attrs.pairs

  • Deskripsi konfigurasi : $ S $ berisi setidaknya dua tripel. Ada 20
    (tidak diurutkan) pasang atribut yang layak $ (a_1, a_2) $ sedemikian rupa untuk beberapa
    $ r_i, o_i, ([r_1, o_1, a_1], [r_2, o_2, a_2]) $ adalah triple pair yang layak
    $ ([r_1, o_1, a_1], [r_2, o_2, a_2]) = (t_1, t_2) $. Kami mengalokasikan 16 pasangan ini
    untuk pelatihan dan empat untuk pengujian. Untuk sepasang $ (a_1, a_2) $ dalam set pengujian,
    $ S $ dalam set pelatihan berisi tiga kali lipat dengan $ a_1 $ atau $ a_2 $. Dalam ujian
    set, semua $ S $ berisi tiga kali lipat dengan $ a_1 $ dan $ a_2 $.

  • Contoh ( tfds.as_dataframe ):

abstract_reasoning / attrs.shape.color

  • Deskripsi konfigurasi : Bentuk-warna atribut yang ditahan. $ S $ masuk
    set pelatihan tidak berisi tripel dengan $ o $ = bentuk dan $ a $ = warna.
    Semua struktur yang mengatur puzzle di set pengujian berisi setidaknya satu triple
    dengan $ o $ = bentuk dan $ a $ = warna.

  • Contoh ( tfds.as_dataframe ):

abstract_reasoning / attrs.line.type

  • Deskripsi konfigurasi : Jenis baris atribut yang dimilikinya. $ S $ masuk
    set pelatihan tidak berisi tripel dengan $ o $ = line dan $ a $ = type.
    Semua struktur yang mengatur puzzle di set pengujian berisi setidaknya satu triple
    dengan $ o $ = line dan $ a $ = type.

  • Contoh ( tfds.as_dataframe ):