qualità

  • Descrizione :

QUALITY, un set di dati di comprensione della lettura a scelta multipla e lunga.

Forniamo solo la versione grezza.

Diviso Esempi
'dev' 230
'test' 232
'train' 300
  • Struttura delle caratteristiche :
FeaturesDict({
    'article': Text(shape=(), dtype=string),
    'article_id': Text(shape=(), dtype=string),
    'difficults': Sequence(bool),
    'gold_labels': Sequence(int32),
    'options': Sequence(Sequence(Text(shape=(), dtype=string))),
    'question_ids': Sequence(Text(shape=(), dtype=string)),
    'questions': Sequence(Text(shape=(), dtype=string)),
    'set_unique_id': Text(shape=(), dtype=string),
    'source': Text(shape=(), dtype=string),
    'title': Text(shape=(), dtype=string),
    'topic': Text(shape=(), dtype=string),
    'url': Text(shape=(), dtype=string),
    'writer_id': Text(shape=(), dtype=string),
    'writer_labels': Sequence(int32),
})
  • Documentazione delle funzionalità :
Caratteristica Classe Forma Tipo D Descrizione
CaratteristicheDict
articolo Testo corda
articolo_id Testo corda
difficoltà Sequenza (tensore) (Nessuno,) bool
etichette_oro Sequenza (tensore) (Nessuno,) int32
opzioni Sequenza(Sequenza(Testo)) (Nessuno, nessuno) corda
question_ids Sequenza(Testo) (Nessuno,) corda
domande Sequenza(Testo) (Nessuno,) corda
set_unique_id Testo corda
fonte Testo corda
titolo Testo corda
argomento Testo corda
URL Testo corda
scrittore_id Testo corda
etichette_scrittore Sequenza (tensore) (Nessuno,) int32
@article{pang2021quality,
  title={ {QuALITY}: Question Answering with Long Input Texts, Yes!},
  author={Pang, Richard Yuanzhe and Parrish, Alicia and Joshi, Nitish and Nangia, Nikita and Phang, Jason and Chen, Angelica and Padmakumar, Vishakh and Ma, Johnny and Thompson, Jana and He, He and Bowman, Samuel R.},
  journal={arXiv preprint arXiv:2112.08608},
  year={2021}
}

qualità/raw (configurazione predefinita)

  • Descrizione della configurazione : Raw con HTML.

  • Dimensione del set di dati: 22.18 MiB

  • Esempi ( tfds.as_dataframe ):

qualità/spogliato

  • Descrizione della configurazione : priva di HTML.

  • Dimensione del set di dati: 20.73 MiB

  • Esempi ( tfds.as_dataframe ):