calidad

  • Descripción :

CALIDAD, un conjunto de datos de comprensión de lectura larga de opción múltiple.

Proporcionamos solo la versión sin formato.

Separar Ejemplos
'dev' 230
'test' 232
'train' 300
  • Características :
FeaturesDict({
    'article': Text(shape=(), dtype=tf.string),
    'article_id': Text(shape=(), dtype=tf.string),
    'difficults': Sequence(tf.bool),
    'gold_labels': Sequence(tf.int32),
    'options': Sequence(Sequence(Text(shape=(), dtype=tf.string))),
    'question_ids': Sequence(Text(shape=(), dtype=tf.string)),
    'questions': Sequence(Text(shape=(), dtype=tf.string)),
    'set_unique_id': Text(shape=(), dtype=tf.string),
    'source': Text(shape=(), dtype=tf.string),
    'title': Text(shape=(), dtype=tf.string),
    'topic': Text(shape=(), dtype=tf.string),
    'url': Text(shape=(), dtype=tf.string),
    'writer_id': Text(shape=(), dtype=tf.string),
    'writer_labels': Sequence(tf.int32),
})
@article{pang2021quality,
  title={ {QuALITY}: Question Answering with Long Input Texts, Yes!},
  author={Pang, Richard Yuanzhe and Parrish, Alicia and Joshi, Nitish and Nangia, Nikita and Phang, Jason and Chen, Angelica and Padmakumar, Vishakh and Ma, Johnny and Thompson, Jana and He, He and Bowman, Samuel R.},
  journal={arXiv preprint arXiv:2112.08608},
  year={2021}
}

calidad/sin procesar (configuración predeterminada)

  • Descripción de la configuración : Raw con HTML.

  • Tamaño del conjunto de datos : 22.18 MiB

  • Ejemplos ( tfds.as_dataframe ):

calidad/despojado

  • Descripción de la configuración : despojado de HTML.

  • Tamaño del conjunto de datos : 20.73 MiB

  • Ejemplos ( tfds.as_dataframe ):