Halaman ini diterjemahkan oleh Cloud Translation API.
Switch to English

trivia_qa

  • Deskripsi :

TriviaqQA adalah kumpulan data pemahaman bacaan yang berisi lebih dari 650 ribu pertanyaan-jawaban-bukti tiga kali lipat. TriviaqQA mencakup 95 ribu pasangan pertanyaan-jawaban yang ditulis oleh penggemar trivia dan dokumen bukti yang dikumpulkan secara independen, rata-rata enam per pertanyaan, yang memberikan pengawasan jarak jauh berkualitas tinggi untuk menjawab pertanyaan.

Membagi Contoh
'test' 10.832
'train' 87.622
'validation' 11.313
  • Fitur :
FeaturesDict({
    'answer': FeaturesDict({
        'aliases': Sequence(Text(shape=(), dtype=tf.string)),
        'matched_wiki_entity_name': Text(shape=(), dtype=tf.string),
        'normalized_aliases': Sequence(Text(shape=(), dtype=tf.string)),
        'normalized_matched_wiki_entity_name': Text(shape=(), dtype=tf.string),
        'normalized_value': Text(shape=(), dtype=tf.string),
        'type': Text(shape=(), dtype=tf.string),
        'value': Text(shape=(), dtype=tf.string),
    }),
    'entity_pages': Sequence({
        'doc_source': Text(shape=(), dtype=tf.string),
        'filename': Text(shape=(), dtype=tf.string),
        'title': Text(shape=(), dtype=tf.string),
        'wiki_context': Text(shape=(), dtype=tf.string),
    }),
    'question': Text(shape=(), dtype=tf.string),
    'question_id': Text(shape=(), dtype=tf.string),
    'question_source': Text(shape=(), dtype=tf.string),
    'search_results': Sequence({
        'description': Text(shape=(), dtype=tf.string),
        'filename': Text(shape=(), dtype=tf.string),
        'rank': tf.int32,
        'search_context': Text(shape=(), dtype=tf.string),
        'title': Text(shape=(), dtype=tf.string),
        'url': Text(shape=(), dtype=tf.string),
    }),
})
@article{2017arXivtriviaqa,
       author = { {Joshi}, Mandar and {Choi}, Eunsol and {Weld},
                 Daniel and {Zettlemoyer}, Luke},
        title = "{triviaqa: A Large Scale Distantly Supervised Challenge Dataset for Reading Comprehension}",
      journal = {arXiv e-prints},
         year = 2017,
          eid = {arXiv:1705.03551},
        pages = {arXiv:1705.03551},
archivePrefix = {arXiv},
       eprint = {1705.03551},
}

trivia_qa / rc (konfigurasi default)

  • Deskripsi konfigurasi : Pasangan pertanyaan-jawaban di mana semua dokumen untuk pertanyaan tertentu berisi string jawaban. Termasuk konteks dari Wikipedia dan hasil pencarian.

  • Contoh ( tfds.as_dataframe ):

trivia_qa / rc.nocontext

  • Deskripsi konfigurasi : Pasangan pertanyaan-jawaban di mana semua dokumen untuk pertanyaan tertentu berisi string jawaban.

  • Contoh ( tfds.as_dataframe ):

trivia_qa / tidak difilter

  • Deskripsi konfigurasi : 110k pasangan pertanyaan-jawaban untuk QA domain terbuka di mana tidak semua dokumen untuk pertanyaan tertentu berisi string jawaban. Ini membuat set data yang tidak difilter lebih sesuai untuk QA gaya IR. Termasuk konteks dari Wikipedia dan hasil pencarian.

  • Contoh ( tfds.as_dataframe ):

trivia_qa / unfiltered.nocontext

  • Deskripsi konfigurasi : 110k pasangan pertanyaan-jawaban untuk QA domain terbuka di mana tidak semua dokumen untuk pertanyaan tertentu berisi string jawaban. Ini membuat set data yang tidak difilter lebih sesuai untuk QA gaya IR.

  • Contoh ( tfds.as_dataframe ):