Halaman ini diterjemahkan oleh Cloud Translation API.
Switch to English

ai2_arc

  • Deskripsi :

Kumpulan data baru dari 7.787 pertanyaan sains pilihan ganda tingkat sekolah dasar asli, dikumpulkan untuk mendorong penelitian dalam menjawab pertanyaan tingkat lanjut. Dataset dipartisi menjadi Set Tantangan dan Set Mudah, di mana yang pertama hanya berisi pertanyaan yang dijawab dengan tidak benar oleh algoritme berbasis pengambilan dan algoritme kata bersama. Kami juga menyertakan korpus lebih dari 14 juta kalimat sains yang relevan dengan tugas tersebut, dan implementasi tiga model dasar neural untuk kumpulan data ini. Kami mengajukan ARC sebagai tantangan bagi komunitas.

FeaturesDict({
    'answerKey': ClassLabel(shape=(), dtype=tf.int64, num_classes=5),
    'choices': Sequence({
        'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=5),
        'text': Text(shape=(), dtype=tf.string),
    }),
    'id': Text(shape=(), dtype=tf.string),
    'question': Text(shape=(), dtype=tf.string),
})
@article{allenai:arc,
      author    = {Peter Clark  and Isaac Cowhey and Oren Etzioni and Tushar Khot and
                    Ashish Sabharwal and Carissa Schoenick and Oyvind Tafjord},
      title     = {Think you have Solved Question Answering? Try ARC, the AI2 Reasoning Challenge},
      journal   = {arXiv:1803.05457v1},
      year      = {2018},
}

ai2_arc / ARC-Challenge (konfigurasi default)

  • Deskripsi konfigurasi : Kumpulan Tantangan yang terdiri dari 2590 pertanyaan "sulit" (pertanyaan yang pengambilannya dan metode kejadiannya gagal dijawab dengan benar)

  • Ukuran 939.91 KiB data : 939.91 KiB

  • Split :

Membagi Contoh
'test' 1.172
'train' 1.119
'validation' 299

ai2_arc / ARC-Easy

  • Deskripsi konfigurasi : Kumpulan Mudah 5197 pertanyaan untuk Tantangan ARC.

  • Ukuran set data : 1.63 MiB

  • Split :

Membagi Contoh
'test' 2.376
'train' 2.251
'validation' 570