qualité

  • Descriptif :

QuALITY, un ensemble de données de compréhension à choix multiples et à lecture longue.

Nous fournissons uniquement la version brute.

Diviser Exemples
'dev' 230
'test' 232
'train' 300
  • Structure des fonctionnalités :
FeaturesDict({
    'article': Text(shape=(), dtype=string),
    'article_id': Text(shape=(), dtype=string),
    'difficults': Sequence(bool),
    'gold_labels': Sequence(int32),
    'options': Sequence(Sequence(Text(shape=(), dtype=string))),
    'question_ids': Sequence(Text(shape=(), dtype=string)),
    'questions': Sequence(Text(shape=(), dtype=string)),
    'set_unique_id': Text(shape=(), dtype=string),
    'source': Text(shape=(), dtype=string),
    'title': Text(shape=(), dtype=string),
    'topic': Text(shape=(), dtype=string),
    'url': Text(shape=(), dtype=string),
    'writer_id': Text(shape=(), dtype=string),
    'writer_labels': Sequence(int32),
})
  • Documentation des fonctionnalités :
Caractéristique Classe Façonner Dtype Description
FonctionnalitésDict
article Texte chaîne de caractères
article_id Texte chaîne de caractères
difficultés Séquence (tenseur) (Aucun,) bourdonner
gold_labels Séquence (tenseur) (Aucun,) int32
choix Séquence(Séquence(Texte)) (Aucun, Aucun) chaîne de caractères
question_ids Séquence (texte) (Aucun,) chaîne de caractères
des questions Séquence (texte) (Aucun,) chaîne de caractères
set_unique_id Texte chaîne de caractères
la source Texte chaîne de caractères
Titre Texte chaîne de caractères
sujet Texte chaîne de caractères
URL Texte chaîne de caractères
id_écrivain Texte chaîne de caractères
écrivain_étiquettes Séquence (tenseur) (Aucun,) int32
@article{pang2021quality,
  title={ {QuALITY}: Question Answering with Long Input Texts, Yes!},
  author={Pang, Richard Yuanzhe and Parrish, Alicia and Joshi, Nitish and Nangia, Nikita and Phang, Jason and Chen, Angelica and Padmakumar, Vishakh and Ma, Johnny and Thompson, Jana and He, He and Bowman, Samuel R.},
  journal={arXiv preprint arXiv:2112.08608},
  year={2021}
}

qualité/brut (configuration par défaut)

  • Description de la configuration : Raw avec HTML.

  • Taille du jeu de données : 22.18 MiB

  • Exemples ( tfds.as_dataframe ):

qualité/dépouillé

  • Description de la configuration : dépouillé de HTML.

  • Taille du jeu de données : 20.73 MiB

  • Exemples ( tfds.as_dataframe ):