- Deskripsi :
Eraser Multi RC adalah kumpulan data untuk kueri melalui bagian multi-baris, bersama dengan jawaban dan rasionalte. Setiap contoh dalam kumpulan data ini memiliki 5 bagian berikut
- Sebuah Bagian Mutli-line 2. Sebuah Pertanyaan tentang bagian tersebut 3. Sebuah Jawaban untuk pertanyaan tersebut
- Sebuah Klasifikasi, apakah jawabannya benar atau salah 5. Penjelasan yang membenarkan klasifikasi
Situs web : https://cogcomp.seas.upenn.edu/multirc/
Kode sumber :
tfds.text.EraserMultiRc
Versi :
-
0.1.1
(default): Tidak ada catatan rilis.
-
Ukuran unduhan :
1.59 MiB
Ukuran kumpulan data :
Unknown size
Cache otomatis ( dokumentasi ): Tidak diketahui
Split :
Membagi | Contoh |
---|---|
'test' | 4.848 |
'train' | 24.029 |
'validation' | 3.214 |
- Fitur :
FeaturesDict({
'evidences': Sequence(Text(shape=(), dtype=tf.string)),
'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
'passage': Text(shape=(), dtype=tf.string),
'query_and_answer': Text(shape=(), dtype=tf.string),
})
Kunci yang diawasi (Lihat
as_supervised
doc ):None
Kutipan :
@unpublished{eraser2019,
title = {ERASER: A Benchmark to Evaluate Rationalized NLP Models},
author = {Jay DeYoung and Sarthak Jain and Nazneen Fatema Rajani and Eric Lehman and Caiming Xiong and Richard Socher and Byron C. Wallace}
}
@inproceedings{MultiRC2018,
author = {Daniel Khashabi and Snigdha Chaturvedi and Michael Roth and Shyam Upadhyay and Dan Roth},
title = {Looking Beyond the Surface:A Challenge Set for Reading Comprehension over Multiple Sentences},
booktitle = {NAACL},
year = {2018}
}
Gambar ( tfds.show_examples ): Tidak didukung.
Contoh ( tfds.as_dataframe ):