kalite

  • Açıklama :

QuALITY, çoktan seçmeli, uzun okuma anlama veri seti.

Yalnızca ham sürümü sağlıyoruz.

Bölmek örnekler
'dev' 230
'test' 232
'train' 300
  • Özellik yapısı :
FeaturesDict({
    'article': Text(shape=(), dtype=string),
    'article_id': Text(shape=(), dtype=string),
    'difficults': Sequence(bool),
    'gold_labels': Sequence(int32),
    'options': Sequence(Sequence(Text(shape=(), dtype=string))),
    'question_ids': Sequence(Text(shape=(), dtype=string)),
    'questions': Sequence(Text(shape=(), dtype=string)),
    'set_unique_id': Text(shape=(), dtype=string),
    'source': Text(shape=(), dtype=string),
    'title': Text(shape=(), dtype=string),
    'topic': Text(shape=(), dtype=string),
    'url': Text(shape=(), dtype=string),
    'writer_id': Text(shape=(), dtype=string),
    'writer_labels': Sequence(int32),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Açıklama
ÖzelliklerDict
makale Metin sicim
makale_kimliği Metin sicim
zorluklar Sıra(Tensor) (Hiçbiri,) bool
gold_labels Sıra(Tensor) (Hiçbiri,) int32
seçenekler Sıra(Sıra(Metin)) (Yok, Yok) sicim
soru_kimlikleri Sıra(Metin) (Hiçbiri,) sicim
sorular Sıra(Metin) (Hiçbiri,) sicim
set_unique_id Metin sicim
kaynak Metin sicim
Başlık Metin sicim
başlık Metin sicim
url Metin sicim
yazar_kimliği Metin sicim
yazar_etiketleri Sıra(Tensor) (Hiçbiri,) int32
@article{pang2021quality,
  title={ {QuALITY}: Question Answering with Long Input Texts, Yes!},
  author={Pang, Richard Yuanzhe and Parrish, Alicia and Joshi, Nitish and Nangia, Nikita and Phang, Jason and Chen, Angelica and Padmakumar, Vishakh and Ma, Johnny and Thompson, Jana and He, He and Bowman, Samuel R.},
  journal={arXiv preprint arXiv:2112.08608},
  year={2021}
}

kalite/ham (varsayılan yapılandırma)

  • Yapılandırma açıklaması : HTML ile ham.

  • Veri kümesi boyutu : 22.18 MiB

  • Örnekler ( tfds.as_dataframe ):

kaliteli/soyulmuş

  • Yapılandırma açıklaması : HTML'den çıkarıldı.

  • Veri kümesi boyutu : 20.73 MiB

  • Örnekler ( tfds.as_dataframe ):