- Deskripsi :
Stanford Question Answer Dataset (SQuAD) adalah kumpulan data pemahaman bacaan, yang terdiri dari pertanyaan-pertanyaan yang diajukan oleh crowdworkers pada sekumpulan artikel Wikipedia, di mana jawaban untuk setiap pertanyaan adalah segmen teks, atau rentang, dari bagian bacaan yang sesuai, atau pertanyaan mungkin tidak bisa dijawab.
Situs web : https://rajpurkar.github.io/SQuAD-explorer/
Kode sumber :
tfds.question_answering.squad.Squad
Versi :
-
2.0.0
(default): Tidak ada catatan rilis.
-
Kunci yang diawasi (Lihat
as_supervised
doc ):None
Kutipan :
@article{2016arXiv160605250R,
author = { {Rajpurkar}, Pranav and {Zhang}, Jian and {Lopyrev},
Konstantin and {Liang}, Percy},
title = "{SQuAD: 100,000+ Questions for Machine Comprehension of Text}",
journal = {arXiv e-prints},
year = 2016,
eid = {arXiv:1606.05250},
pages = {arXiv:1606.05250},
archivePrefix = {arXiv},
eprint = {1606.05250},
}
.dll- Gambar ( tfds.show_examples ): Tidak didukung.
skuad / v1.1 (konfigurasi default)
Deskripsi konfigurasi : Versi 1.1.0 dari SQUAD
Ukuran unduhan :
33.51 MiB
Ukuran
94.04 MiB
data :94.04 MiB
Cache otomatis ( dokumentasi ): Ya
Split :
Membagi | Contoh |
---|---|
'train' | 87.599 |
'validation' | 10.570 |
- Fitur :
FeaturesDict({
'answers': Sequence({
'answer_start': tf.int32,
'text': Text(shape=(), dtype=tf.string),
}),
'context': Text(shape=(), dtype=tf.string),
'id': tf.string,
'question': Text(shape=(), dtype=tf.string),
'title': Text(shape=(), dtype=tf.string),
})
- Contoh ( tfds.as_dataframe ):
skuad / v2.0
Deskripsi konfigurasi : Versi 2.0.0 dari SQUAD
Ukuran unduhan :
44.34 MiB
Ukuran
148.51 MiB
data :148.51 MiB
Cache otomatis ( dokumentasi ): Ya (validasi), Hanya jika
shuffle_files=False
(latih)Split :
Membagi | Contoh |
---|---|
'train' | 130.319 |
'validation' | 11.873 |
- Fitur :
FeaturesDict({
'answers': Sequence({
'answer_start': tf.int32,
'text': Text(shape=(), dtype=tf.string),
}),
'context': Text(shape=(), dtype=tf.string),
'id': tf.string,
'is_impossible': tf.bool,
'plausible_answers': Sequence({
'answer_start': tf.int32,
'text': Text(shape=(), dtype=tf.string),
}),
'question': Text(shape=(), dtype=tf.string),
'title': Text(shape=(), dtype=tf.string),
})
- Contoh ( tfds.as_dataframe ):