abstract_reasoning

l10n-placeholder1 ilişki türleri kümesini (ilerleme, XOR, OR, AND, tutarlı birleşim), \\(O\\) nesne türlerini (şekil, çizgi) ve \\(A\\) öznitelik türlerini (boyut, renk, Pozisyon numarası). Bir matrisin yapısı, \\(S\\), belirli bir matris tarafından ortaya konan zorluğu belirleyen üçlüler \\(S={[r, o, a]}\\) kümesidir. Bu veri setini kullanmak için: ```python import tensorflow_datasets as tfds ds = tfds.load('abstract_reasoning', split='train') for ds.take(4): print(ex) ``` Bkz. [kılavuz ](https://www.tensorflow.org/datasets/overview) [tensorflow_datasets](https://www.tensorflow.org/datasets) hakkında daha fazla bilgi için. " />
  • Açıklama :

Measuring Abstract Reasoning in Neural Networks, Barrett, Hill, Santoro ve ark. 2018. Amaç, soyut akıl yürütmeye dayalı bağlam panellerinden doğru cevabı çıkarmaktır.

Bu veri setini kullanmak için lütfen veri seti sayfasından tüm *.tar.gz dosyalarını indirin ve ~/tensorflow_datasets/abstract_reasoning/ içine yerleştirin.

\(R\) , ilişki türleri kümesini (ilerleme, XOR, VEYA, VE, tutarlı birleşim), \(O\) nesne türlerini (şekil, çizgi) ve \(A\) öznitelik türlerini (boyut, renk, konum, sayı). Bir matrisin yapısı,\(S\), belirli bir matris tarafından ortaya konan zorluğu belirleyen \(S={[r, o, a]}\) üçlü kümesidir.

Bölmek Örnekler
'test' 200.000
'train' 1.200.000
'validation' 20.000
  • Özellik yapısı :
FeaturesDict({
    'answers': Video(Image(shape=(160, 160, 1), dtype=tf.uint8)),
    'context': Video(Image(shape=(160, 160, 1), dtype=tf.uint8)),
    'filename': Text(shape=(), dtype=tf.string),
    'meta_target': Tensor(shape=(12,), dtype=tf.int64),
    'relation_structure_encoded': Tensor(shape=(4, 12), dtype=tf.int64),
    'target': ClassLabel(shape=(), dtype=tf.int64, num_classes=8),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtype Tanım
ÖzelliklerDict
Yanıtlar Video(Resim) (8, 160, 160, 1) tf.uint8
bağlam Video(Resim) (8, 160, 160, 1) tf.uint8
dosya adı Metin tf.string
meta_hedef tensör (12,) tf.int64
ilişki_yapısı_encoding tensör (4, 12) tf.int64
hedef sınıf etiketi tf.int64
@InProceedings{pmlr-v80-barrett18a,
  title =    {Measuring abstract reasoning in neural networks},
  author =   {Barrett, David and Hill, Felix and Santoro, Adam and Morcos, Ari and Lillicrap, Timothy},
  booktitle =    {Proceedings of the 35th International Conference on Machine Learning},
  pages =    {511--520},
  year =     {2018},
  editor =   {Dy, Jennifer and Krause, Andreas},
  volume =   {80},
  series =   {Proceedings of Machine Learning Research},
  address =      {Stockholmsmassan, Stockholm Sweden},
  month =    {10--15 Jul},
  publisher =    {PMLR},
  pdf =      {http://proceedings.mlr.press/v80/barrett18a/barrett18a.pdf},
  url =      {http://proceedings.mlr.press/v80/barrett18a.html},
  abstract =     {Whether neural networks can learn abstract reasoning or whetherthey merely rely on superficial statistics is a topic of recent debate. Here, we propose a dataset and challenge designed to probe abstract reasoning, inspired by a well-known human IQ test. To succeed at this challenge, models must cope with various generalisation 'regimes' in which the training data and test questions differ in clearly-defined ways. We show that popular models such as ResNets perform poorly, even when the training and test sets differ only minimally, and we present a novel architecture, with structure designed to encourage reasoning, that does significantly better. When we vary the way in which the test questions and training data differ, we find that our model is notably proficient at certain forms of generalisation, but notably weak at others. We further show that the model's ability to generalise improves markedly if it is trained to predict symbolic explanations for its answers. Altogether, we introduce and explore ways to both measure and induce stronger abstract reasoning in neural networks. Our freely-available dataset should motivate further progress in this direction.}
}

abstract_reasoning/nötr (varsayılan yapılandırma)

  • Konfigürasyon açıklaması : Her iki sistemde de matrisleri kodlayan yapılar.
    eğitim ve test setleri, l10n-yer tutucu12 için herhangi bir üçlü \([r, o, a]\) \(r \\in R\),
    \(o \\in O\)tutucu13 ve \(a \\in A\). Eğitim ve test setleri ayrıktır,
    giriş değişkenleri düzeyinde meydana gelen ayrılma (yani piksel
    tezahürler).

abstract_reasoning/enterpolasyon

  • Yapılandırma açıklaması : Nötr bölmede olduğu gibi, \(S\) herhangi birinden oluşuyordu.
    üçlüler \([r, o, a]\). Enterpolasyon için, eğitim setinde,
    nitelik "renk" veya "beden" idi (yani sıralı nitelikler), değerleri
    nitelikler, ayrı bir kümenin çift indeksli üyeleriyle sınırlandırıldı,
    oysa test setinde sadece tek indeksli değerlere izin verildi. Dikkat edin, hepsi
    \(S\) , color veya size özniteliğine sahip bazı üçlü \([r, o, a]\) -placeholder18 içeriyordu.
    Bu nedenle test setindeki her soru için genelleme yapılması gerekmektedir.

soyut_akıl yürütme/ekstrapolasyon

  • Yapılandırma açıklaması : İnterpolasyondakiyle aynı, ancak değerleri
    öznitelikler, sırasında ayrık kümenin alt yarısı ile sınırlandırılmıştır.
    antrenman yaparken, test setinde üst yarıda değerler aldılar.

abstract_reasoning/attr.rel.pairs

  • Yapılandırma açıklaması : Tüm \(S\) en az iki üçlü içeriyordu,
    \(([r_1,o_1,a_1],[r_2,o_2,a_2]) = (t_1, t_2)\), bunlardan 400'ü uygulanabilir. Biz
    360'ı eğitim kümesine, 40'ı da test kümesine rastgele ayrılmıştır. Üyeler
    40\((t_1, t_2)\) çiftten l10n-yer tutucu21 yapılarda birlikte oluşmadı\(S\)
    eğitim setinde ve tüm yapılarda \(S\) böyle en az bir çifte sahipti
    alt küme olarak\((t_1, t_2)\) .

abstract_reasoning/attr.rels

  • Yapılandırma açıklaması : Veri kümemizde 29 olası benzersiz
    üçlüler \([r,o,a]\). Bunlardan yedi tanesini test seti için rastgele ayırdık,
    ancak öyle ki her bir özellik bu kümede tam olarak bir kez temsil edildi.
    Bu uzatılan üçlüler, eğitim setindeki sorularda hiç olmadı ve
    test setindeki her \(S\) bunlardan en az birini içeriyordu.

abstract_reasoning/attrs.pairs

  • Yapılandırma açıklaması : \(S\) , en az iki üçlü içeriyordu. 20 tane var
    (sırasız) geçerli nitelik çiftleri \((a_1, a_2)\) öyle ki bazıları için
    \(r_i, o_i, ([r_1,o_1,a_1],[r_2,o_2,a_2])\) geçerli bir üçlü çifttir
    \(([r_1,o_1,a_1],[r_2,o_2,a_2]) = (t_1, t_2)\). Bu çiftlerden 16 tanesini ayırdık.
    eğitim için ve dördü test için. Test setindeki bir çift \((a_1, a_2)\) için,
    Eğitim setindeki\(S\) -yer tutucu32, \(a_1\) tutucu33 veya \(a_2\)ile üçlüler içeriyordu. Testte
    kümesinde, tüm \(S\) tutucu35, \(a_1\) tutucu36 ve \(a_2\)ile üçlüler içeriyordu.

abstract_reasoning/attrs.shape.color

  • Yapılandırma açıklaması : Tutulan öznitelik şekil-renk. \(S\) içinde
    eğitim seti, \(o\)=şekil ve \(a\)=renkli üçlüler içermiyordu.
    Test setindeki bulmacaları yöneten tüm yapılar en az bir üçlü
    \(o\)=şekil ve \(a\)=renk ile.

abstract_reasoning/attrs.line.type

  • Yapılandırma açıklaması : Tutulan öznitelik satır türü. \(S\) içinde
    eğitim seti, \(o\)=çizgi ve \(a\)=tür ile üçlü içermiyordu.
    Test setindeki bulmacaları yöneten tüm yapılar en az bir üçlü
    \(o\)=satır ve \(a\)=tür ile.