Hai una domanda? Connettiti con la community al forum TensorFlow Visita il forum

trivia_qa

  • Descrizione :

TriviaqQA è un set di dati di comprensione della lettura contenente oltre 650.000 tripli di domande-risposte-prove. TriviaqQA comprende 95.000 coppie di domande e risposte create da appassionati di curiosità e documenti di prova raccolti in modo indipendente, sei per domanda in media, che forniscono una supervisione a distanza di alta qualità per rispondere alle domande.

Diviso Esempi
'test' 10.832
'train' 87.622
'validation' 11.313
  • Caratteristiche :
FeaturesDict({
    'answer': FeaturesDict({
        'aliases': Sequence(Text(shape=(), dtype=tf.string)),
        'matched_wiki_entity_name': Text(shape=(), dtype=tf.string),
        'normalized_aliases': Sequence(Text(shape=(), dtype=tf.string)),
        'normalized_matched_wiki_entity_name': Text(shape=(), dtype=tf.string),
        'normalized_value': Text(shape=(), dtype=tf.string),
        'type': Text(shape=(), dtype=tf.string),
        'value': Text(shape=(), dtype=tf.string),
    }),
    'entity_pages': Sequence({
        'doc_source': Text(shape=(), dtype=tf.string),
        'filename': Text(shape=(), dtype=tf.string),
        'title': Text(shape=(), dtype=tf.string),
        'wiki_context': Text(shape=(), dtype=tf.string),
    }),
    'question': Text(shape=(), dtype=tf.string),
    'question_id': Text(shape=(), dtype=tf.string),
    'question_source': Text(shape=(), dtype=tf.string),
    'search_results': Sequence({
        'description': Text(shape=(), dtype=tf.string),
        'filename': Text(shape=(), dtype=tf.string),
        'rank': tf.int32,
        'search_context': Text(shape=(), dtype=tf.string),
        'title': Text(shape=(), dtype=tf.string),
        'url': Text(shape=(), dtype=tf.string),
    }),
})
@article{2017arXivtriviaqa,
       author = { {Joshi}, Mandar and {Choi}, Eunsol and {Weld},
                 Daniel and {Zettlemoyer}, Luke},
        title = "{triviaqa: A Large Scale Distantly Supervised Challenge Dataset for Reading Comprehension}",
      journal = {arXiv e-prints},
         year = 2017,
          eid = {arXiv:1705.03551},
        pages = {arXiv:1705.03551},
archivePrefix = {arXiv},
       eprint = {1705.03551},
}

trivia_qa / rc (configurazione predefinita)

  • Descrizione configurazione : coppie domanda-risposta in cui tutti i documenti per una determinata domanda contengono le stringhe di risposta. Include il contesto da Wikipedia e i risultati di ricerca.

  • Esempi ( tfds.as_dataframe ):

trivia_qa / rc.nocontext

  • Descrizione configurazione : coppie domanda-risposta in cui tutti i documenti per una determinata domanda contengono le stringhe di risposta.

  • Esempi ( tfds.as_dataframe ):

trivia_qa / non filtrato

  • Descrizione configurazione : 110k coppie domanda-risposta per QA a dominio aperto in cui non tutti i documenti per una determinata domanda contengono le stringhe di risposta. Ciò rende il set di dati non filtrato più appropriato per il controllo di qualità in stile IR. Include il contesto da Wikipedia e i risultati di ricerca.

  • Esempi ( tfds.as_dataframe ):

trivia_qa / unfiltered.nocontext

  • Descrizione configurazione : 110k coppie domanda-risposta per QA dominio aperto in cui non tutti i documenti per una determinata domanda contengono le stringhe di risposta. Ciò rende il set di dati non filtrato più appropriato per il controllo di qualità in stile IR.

  • Esempi ( tfds.as_dataframe ):