Sintonizar con las primeras mujeres en ML Simposio este martes, 19 de octubre a 09 a.m. PST Registrar ahora

equipo

  • Descripción:

El conjunto de datos de respuesta a preguntas de Stanford (SQuAD) es un conjunto de datos de comprensión de lectura, que consta de preguntas formuladas por los trabajadores de la plataforma en un conjunto de artículos de Wikipedia, donde la respuesta a cada pregunta es un segmento de texto, o tramo, del pasaje de lectura correspondiente, o la pregunta. podría ser incontestable.

@article{2016arXiv160605250R,
       author = { {Rajpurkar}, Pranav and {Zhang}, Jian and {Lopyrev},
                 Konstantin and {Liang}, Percy},
        title = "{SQuAD: 100,000+ Questions for Machine Comprehension of Text}",
      journal = {arXiv e-prints},
         year = 2016,
          eid = {arXiv:1606.05250},
        pages = {arXiv:1606.05250},
archivePrefix = {arXiv},
       eprint = {1606.05250},
}

escuadrón / v1.1 (configuración predeterminada)

  • Descripción config: La versión 1.1.0 de la escuadra

  • Tamaño del paquete: 33.51 MiB

  • Conjunto de datos de tamaño: 94.06 MiB

  • Auto-caché ( documentación ): Sí

  • Fraccionamientos:

Separar Ejemplos de
'train' 87.599
'validation' 10,570
  • características:
FeaturesDict({
    'answers': Sequence({
        'answer_start': tf.int32,
        'text': Text(shape=(), dtype=tf.string),
    }),
    'context': Text(shape=(), dtype=tf.string),
    'id': tf.string,
    'question': Text(shape=(), dtype=tf.string),
    'title': Text(shape=(), dtype=tf.string),
})

escuadrón / v2.0

  • Descripción config: la versión 2.0.0 de la escuadra

  • Tamaño del paquete: 44.34 MiB

  • Conjunto de datos de tamaño: 148.54 MiB

  • Auto-caché ( documentación ): Sí (validación), solamente cuando está shuffle_files=False (tren)

  • Fraccionamientos:

Separar Ejemplos de
'train' 130,319
'validation' 11,873
  • características:
FeaturesDict({
    'answers': Sequence({
        'answer_start': tf.int32,
        'text': Text(shape=(), dtype=tf.string),
    }),
    'context': Text(shape=(), dtype=tf.string),
    'id': tf.string,
    'is_impossible': tf.bool,
    'plausible_answers': Sequence({
        'answer_start': tf.int32,
        'text': Text(shape=(), dtype=tf.string),
    }),
    'question': Text(shape=(), dtype=tf.string),
    'title': Text(shape=(), dtype=tf.string),
})