Hai una domanda? Connettiti con la community al forum TensorFlow Visita il forum

squadra

  • Descrizione :

Stanford Question Answering Dataset (SQuAD) è un set di dati di comprensione della lettura, costituito da domande poste da crowdworker su una serie di articoli di Wikipedia, in cui la risposta a ogni domanda è un segmento di testo, o intervallo, dal corrispondente passaggio di lettura, o la domanda potrebbe essere senza risposta.

@article{2016arXiv160605250R,
       author = { {Rajpurkar}, Pranav and {Zhang}, Jian and {Lopyrev},
                 Konstantin and {Liang}, Percy},
        title = "{SQuAD: 100,000+ Questions for Machine Comprehension of Text}",
      journal = {arXiv e-prints},
         year = 2016,
          eid = {arXiv:1606.05250},
        pages = {arXiv:1606.05250},
archivePrefix = {arXiv},
       eprint = {1606.05250},
}

squad / v1.1 (configurazione predefinita)

  • Descrizione configurazione : versione 1.1.0 di SQUAD

  • Dimensioni download : 33.51 MiB

  • Dimensioni 94.06 MiB : 94.06 MiB

  • Memorizzazione automatica nella cache ( documentazione ): sì

  • Divisioni :

Diviso Esempi
'train' 87.599
'validation' 10.570
  • Caratteristiche :
FeaturesDict({
    'answers': Sequence({
        'answer_start': tf.int32,
        'text': Text(shape=(), dtype=tf.string),
    }),
    'context': Text(shape=(), dtype=tf.string),
    'id': tf.string,
    'question': Text(shape=(), dtype=tf.string),
    'title': Text(shape=(), dtype=tf.string),
})

squadra / v2.0

  • Descrizione configurazione : versione 2.0.0 di SQUAD

  • Dimensioni download : 44.34 MiB

  • Dimensioni 148.54 MiB : 148.54 MiB

  • shuffle_files=False automatica nella cache ( documentazione ): Sì (convalida), solo quando shuffle_files=False (train)

  • Divisioni :

Diviso Esempi
'train' 130.319
'validation' 11.873
  • Caratteristiche :
FeaturesDict({
    'answers': Sequence({
        'answer_start': tf.int32,
        'text': Text(shape=(), dtype=tf.string),
    }),
    'context': Text(shape=(), dtype=tf.string),
    'id': tf.string,
    'is_impossible': tf.bool,
    'plausible_answers': Sequence({
        'answer_start': tf.int32,
        'text': Text(shape=(), dtype=tf.string),
    }),
    'question': Text(shape=(), dtype=tf.string),
    'title': Text(shape=(), dtype=tf.string),
})