ai2_arc

  • Deskripsi :

Kumpulan data baru dari 7.787 pertanyaan sains pilihan ganda tingkat sekolah dasar asli, dikumpulkan untuk mendorong penelitian dalam menjawab pertanyaan tingkat lanjut. Dataset dipartisi menjadi Kumpulan Tantangan dan Kumpulan Mudah, di mana yang pertama hanya berisi pertanyaan yang dijawab salah oleh algoritme berbasis pengambilan dan algoritme kejadian bersama kata. Kami juga menyertakan kumpulan lebih dari 14 juta kalimat sains yang relevan dengan tugas tersebut, dan penerapan tiga model dasar saraf untuk kumpulan data ini. Kami menjadikan ARC sebagai tantangan bagi komunitas.

FeaturesDict({
    'answerKey': ClassLabel(shape=(), dtype=int64, num_classes=5),
    'choices': Sequence({
        'label': ClassLabel(shape=(), dtype=int64, num_classes=5),
        'text': Text(shape=(), dtype=string),
    }),
    'id': Text(shape=(), dtype=string),
    'question': Text(shape=(), dtype=string),
})
  • Dokumentasi fitur :
Fitur Kelas Membentuk Dtype Keterangan
fiturDict
kunci jawaban LabelKelas int64
pilihan Urutan
pilihan/label LabelKelas int64
pilihan/teks Teks rangkaian
Indo Teks rangkaian
pertanyaan Teks rangkaian
@article{allenai:arc,
      author    = {Peter Clark  and Isaac Cowhey and Oren Etzioni and Tushar Khot and
                    Ashish Sabharwal and Carissa Schoenick and Oyvind Tafjord},
      title     = {Think you have Solved Question Answering? Try ARC, the AI2 Reasoning Challenge},
      journal   = {arXiv:1803.05457v1},
      year      = {2018},
}

ai2_arc/ARC-Challenge (konfigurasi default)

  • Deskripsi konfigurasi : Kumpulan Tantangan dari 2590 pertanyaan "sulit" (pertanyaan yang gagal dijawab dengan benar oleh metode pengambilan dan kejadian bersama)

  • Ukuran dataset : 939.91 KiB

  • Perpecahan :

Membelah Contoh
'test' 1.172
'train' 1.119
'validation' 299

ai2_arc/ARC-Mudah

  • Deskripsi konfigurasi : Kumpulan 5197 pertanyaan yang mudah untuk Tantangan ARC.

  • Ukuran dataset : 1.63 MiB

  • Perpecahan :

Membelah Contoh
'test' 2.376
'train' 2.251
'validation' 570