- Deskripsi :
BoolQ adalah kumpulan data jawaban pertanyaan untuk pertanyaan ya / tidak yang berisi 15942 contoh. Pertanyaan-pertanyaan ini muncul secara alami, mereka dibuat dalam pengaturan yang tidak dipicu dan tidak dibatasi.
Setiap contoh adalah triplet (pertanyaan, bagian, jawaban), dengan judul halaman sebagai konteks tambahan opsional. Penyiapan klasifikasi pasangan teks mirip dengan tugas inferensi bahasa alami yang sudah ada.
Beranda : https://github.com/google-research-datasets/boolean-questions
Kode sumber :
tfds.text.bool_q.BoolQ
Versi :
-
1.0.0
(default): Tidak ada catatan rilis.
-
Ukuran unduhan :
8.36 MiB
Ukuran set data :
8.51 MiB
Cache otomatis ( dokumentasi ): Ya
Split :
Membagi | Contoh |
---|---|
'train' | 9.427 |
'validation' | 3.270 |
- Fitur :
FeaturesDict({
'answer': tf.bool,
'passage': Text(shape=(), dtype=tf.string),
'question': Text(shape=(), dtype=tf.string),
'title': Text(shape=(), dtype=tf.string),
})
Kunci yang diawasi (Lihat
as_supervised
doc ):None
Kutipan :
@inproceedings{clark2019boolq,
title = {BoolQ: Exploring the Surprising Difficulty of Natural Yes/No Questions},
author = {Clark, Christopher and Lee, Kenton and Chang, Ming-Wei, and Kwiatkowski, Tom and Collins, Michael, and Toutanova, Kristina},
booktitle = {NAACL},
year = {2019},
}
Gambar ( tfds.show_examples ): Tidak didukung.
Contoh ( tfds.as_dataframe ):