- Açıklama :
Measuring Abstract Reasoning in Neural Networks, Barrett, Hill, Santoro ve ark. 2018. Amaç, soyut akıl yürütmeye dayalı bağlam panellerinden doğru cevabı çıkarmaktır.
Bu veri setini kullanmak için lütfen veri seti sayfasından tüm *.tar.gz dosyalarını indirin ve ~/tensorflow_datasets/abstract_reasoning/ içine yerleştirin.
\(R\) , ilişki türleri kümesini (ilerleme, XOR, VEYA, VE, tutarlı birleşim), \(O\) nesne türlerini (şekil, çizgi) ve \(A\) öznitelik türlerini (boyut, renk, konum, sayı). Bir matrisin yapısı,\(S\), belirli bir matris tarafından ortaya konan zorluğu belirleyen \(S={[r, o, a]}\) üçlü kümesidir.
Ana sayfa : https://github.com/deepmind/abstract-reasoning-matrices
Kaynak kodu :
tfds.image.AbstractReasoning
Sürümler :
-
1.0.0
(varsayılan): Sürüm notu yok.
-
İndirme boyutu :
Unknown size
Veri kümesi boyutu :
Unknown size
Manuel indirme talimatları : Bu veri kümesi, kaynak verileri download_config.manual_dir içine manuel olarak
download_config.manual_dir
gerektirir (varsayılanı~/tensorflow_datasets/downloads/manual/
):
Veriler https://console.cloud.google.com/storage/browser/ravens-matrices adresinden indirilebilir. Lütfen tüm tar.gz dosyalarını manual_dir içine koyun.Otomatik önbelleğe alındı ( belgeler ): Bilinmiyor
Bölmeler :
Bölmek | Örnekler |
---|---|
'test' | 200.000 |
'train' | 1.200.000 |
'validation' | 20.000 |
- Özellik yapısı :
FeaturesDict({
'answers': Video(Image(shape=(160, 160, 1), dtype=tf.uint8)),
'context': Video(Image(shape=(160, 160, 1), dtype=tf.uint8)),
'filename': Text(shape=(), dtype=tf.string),
'meta_target': Tensor(shape=(12,), dtype=tf.int64),
'relation_structure_encoded': Tensor(shape=(4, 12), dtype=tf.int64),
'target': ClassLabel(shape=(), dtype=tf.int64, num_classes=8),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtype | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
Yanıtlar | Video(Resim) | (8, 160, 160, 1) | tf.uint8 | |
bağlam | Video(Resim) | (8, 160, 160, 1) | tf.uint8 | |
dosya adı | Metin | tf.string | ||
meta_hedef | tensör | (12,) | tf.int64 | |
ilişki_yapısı_encoding | tensör | (4, 12) | tf.int64 | |
hedef | sınıf etiketi | tf.int64 |
Denetimli anahtarlar (bkz
as_supervised
doc ):None
Şekil ( tfds.show_examples ): Desteklenmez.
Örnekler ( tfds.as_dataframe ): Eksik.
alıntı :
@InProceedings{pmlr-v80-barrett18a,
title = {Measuring abstract reasoning in neural networks},
author = {Barrett, David and Hill, Felix and Santoro, Adam and Morcos, Ari and Lillicrap, Timothy},
booktitle = {Proceedings of the 35th International Conference on Machine Learning},
pages = {511--520},
year = {2018},
editor = {Dy, Jennifer and Krause, Andreas},
volume = {80},
series = {Proceedings of Machine Learning Research},
address = {Stockholmsmassan, Stockholm Sweden},
month = {10--15 Jul},
publisher = {PMLR},
pdf = {http://proceedings.mlr.press/v80/barrett18a/barrett18a.pdf},
url = {http://proceedings.mlr.press/v80/barrett18a.html},
abstract = {Whether neural networks can learn abstract reasoning or whetherthey merely rely on superficial statistics is a topic of recent debate. Here, we propose a dataset and challenge designed to probe abstract reasoning, inspired by a well-known human IQ test. To succeed at this challenge, models must cope with various generalisation 'regimes' in which the training data and test questions differ in clearly-defined ways. We show that popular models such as ResNets perform poorly, even when the training and test sets differ only minimally, and we present a novel architecture, with structure designed to encourage reasoning, that does significantly better. When we vary the way in which the test questions and training data differ, we find that our model is notably proficient at certain forms of generalisation, but notably weak at others. We further show that the model's ability to generalise improves markedly if it is trained to predict symbolic explanations for its answers. Altogether, we introduce and explore ways to both measure and induce stronger abstract reasoning in neural networks. Our freely-available dataset should motivate further progress in this direction.}
}
abstract_reasoning/nötr (varsayılan yapılandırma)
- Konfigürasyon açıklaması : Her iki sistemde de matrisleri kodlayan yapılar.
eğitim ve test setleri, l10n-yer tutucu12 için herhangi bir üçlü \([r, o, a]\) \(r \\in R\),
\(o \\in O\)tutucu13 ve \(a \\in A\). Eğitim ve test setleri ayrıktır,
giriş değişkenleri düzeyinde meydana gelen ayrılma (yani piksel
tezahürler).
abstract_reasoning/enterpolasyon
- Yapılandırma açıklaması : Nötr bölmede olduğu gibi, \(S\) herhangi birinden oluşuyordu.
üçlüler \([r, o, a]\). Enterpolasyon için, eğitim setinde,
nitelik "renk" veya "beden" idi (yani sıralı nitelikler), değerleri
nitelikler, ayrı bir kümenin çift indeksli üyeleriyle sınırlandırıldı,
oysa test setinde sadece tek indeksli değerlere izin verildi. Dikkat edin, hepsi
\(S\) , color veya size özniteliğine sahip bazı üçlü \([r, o, a]\) -placeholder18 içeriyordu.
Bu nedenle test setindeki her soru için genelleme yapılması gerekmektedir.
soyut_akıl yürütme/ekstrapolasyon
- Yapılandırma açıklaması : İnterpolasyondakiyle aynı, ancak değerleri
öznitelikler, sırasında ayrık kümenin alt yarısı ile sınırlandırılmıştır.
antrenman yaparken, test setinde üst yarıda değerler aldılar.
abstract_reasoning/attr.rel.pairs
- Yapılandırma açıklaması : Tüm \(S\) en az iki üçlü içeriyordu,
\(([r_1,o_1,a_1],[r_2,o_2,a_2]) = (t_1, t_2)\), bunlardan 400'ü uygulanabilir. Biz
360'ı eğitim kümesine, 40'ı da test kümesine rastgele ayrılmıştır. Üyeler
40\((t_1, t_2)\) çiftten l10n-yer tutucu21 yapılarda birlikte oluşmadı\(S\)
eğitim setinde ve tüm yapılarda \(S\) böyle en az bir çifte sahipti
alt küme olarak\((t_1, t_2)\) .
abstract_reasoning/attr.rels
- Yapılandırma açıklaması : Veri kümemizde 29 olası benzersiz
üçlüler \([r,o,a]\). Bunlardan yedi tanesini test seti için rastgele ayırdık,
ancak öyle ki her bir özellik bu kümede tam olarak bir kez temsil edildi.
Bu uzatılan üçlüler, eğitim setindeki sorularda hiç olmadı ve
test setindeki her \(S\) bunlardan en az birini içeriyordu.
abstract_reasoning/attrs.pairs
- Yapılandırma açıklaması : \(S\) , en az iki üçlü içeriyordu. 20 tane var
(sırasız) geçerli nitelik çiftleri \((a_1, a_2)\) öyle ki bazıları için
\(r_i, o_i, ([r_1,o_1,a_1],[r_2,o_2,a_2])\) geçerli bir üçlü çifttir
\(([r_1,o_1,a_1],[r_2,o_2,a_2]) = (t_1, t_2)\). Bu çiftlerden 16 tanesini ayırdık.
eğitim için ve dördü test için. Test setindeki bir çift \((a_1, a_2)\) için,
Eğitim setindeki\(S\) -yer tutucu32, \(a_1\) tutucu33 veya \(a_2\)ile üçlüler içeriyordu. Testte
kümesinde, tüm \(S\) tutucu35, \(a_1\) tutucu36 ve \(a_2\)ile üçlüler içeriyordu.
abstract_reasoning/attrs.shape.color
- Yapılandırma açıklaması : Tutulan öznitelik şekil-renk. \(S\) içinde
eğitim seti, \(o\)=şekil ve \(a\)=renkli üçlüler içermiyordu.
Test setindeki bulmacaları yöneten tüm yapılar en az bir üçlü
\(o\)=şekil ve \(a\)=renk ile.
abstract_reasoning/attrs.line.type
- Yapılandırma açıklaması : Tutulan öznitelik satır türü. \(S\) içinde
eğitim seti, \(o\)=çizgi ve \(a\)=tür ile üçlü içermiyordu.
Test setindeki bulmacaları yöneten tüm yapılar en az bir üçlü
\(o\)=satır ve \(a\)=tür ile.