¡El Día de la Comunidad de ML es el 9 de noviembre! Únase a nosotros para recibir actualizaciones de TensorFlow, JAX, y más Más información

soltar

  • Descripción:

Con el rendimiento del sistema en los puntos de referencia de comprensión de lectura existentes que se acercan o superan al rendimiento humano, necesitamos un nuevo conjunto de datos sólidos que mejore las capacidades de los sistemas para leer párrafos de texto. DROP es un punto de referencia de 96k preguntas de colaboración colectiva, creado de manera adversaria, en el que un sistema debe resolver referencias en una pregunta, tal vez a múltiples posiciones de entrada, y realizar operaciones discretas sobre ellas (como sumar, contar o clasificar). Estas operaciones requieren una comprensión mucho más completa del contenido de los párrafos que la necesaria para los conjuntos de datos anteriores.

  • Inicio: https://allennlp.org/drop

  • El código fuente: tfds.text.drop.Drop

  • versiones:

    • 1.0.0 : Versión inicial.
    • 2.0.0 (por defecto): Agrega todas las opciones para las respuestas.
  • Tamaño del paquete: 7.92 MiB

  • Conjunto de datos de tamaño: 116.24 MiB

  • Auto-caché ( documentación ): Sí

  • Fraccionamientos:

Separar Ejemplos de
'dev' 9.536
'train' 77,409
  • características:
FeaturesDict({
    'answer': Text(shape=(), dtype=tf.string),
    'passage': Text(shape=(), dtype=tf.string),
    'query_id': Text(shape=(), dtype=tf.string),
    'question': Text(shape=(), dtype=tf.string),
    'validated_answers': Sequence(Text(shape=(), dtype=tf.string)),
})
  • Cita:
@inproceedings{Dua2019DROP,
  author={Dheeru Dua and Yizhong Wang and Pradeep Dasigi and Gabriel Stanovsky and Sameer Singh and Matt Gardner},
  title={  {DROP}: A Reading Comprehension Benchmark Requiring Discrete Reasoning Over Paragraphs},
  booktitle={Proc. of NAACL},
  year={2019}
}