لدي سؤال؟ تواصل مع المجتمع في منتدى زيارة منتدى TensorFlow

trivia_qa

  • الوصف :

TriviaqQA هي مجموعة بيانات لفهم القراءة تحتوي على أكثر من 650 ألف سؤال وجواب ودليل ثلاثي. يتضمن TriviaqQA 95 ألف زوج من الأسئلة والأجوبة من تأليف عشاق التوافه ووثائق الأدلة التي تم جمعها بشكل مستقل ، ستة لكل سؤال في المتوسط ​​، والتي توفر إشرافًا عن بُعد عالي الجودة للإجابة على الأسئلة.

انشق، مزق أمثلة
'test' 10832
'train' 87622
'validation' 11،313
  • الميزات :
FeaturesDict({
    'answer': FeaturesDict({
        'aliases': Sequence(Text(shape=(), dtype=tf.string)),
        'matched_wiki_entity_name': Text(shape=(), dtype=tf.string),
        'normalized_aliases': Sequence(Text(shape=(), dtype=tf.string)),
        'normalized_matched_wiki_entity_name': Text(shape=(), dtype=tf.string),
        'normalized_value': Text(shape=(), dtype=tf.string),
        'type': Text(shape=(), dtype=tf.string),
        'value': Text(shape=(), dtype=tf.string),
    }),
    'entity_pages': Sequence({
        'doc_source': Text(shape=(), dtype=tf.string),
        'filename': Text(shape=(), dtype=tf.string),
        'title': Text(shape=(), dtype=tf.string),
        'wiki_context': Text(shape=(), dtype=tf.string),
    }),
    'question': Text(shape=(), dtype=tf.string),
    'question_id': Text(shape=(), dtype=tf.string),
    'question_source': Text(shape=(), dtype=tf.string),
    'search_results': Sequence({
        'description': Text(shape=(), dtype=tf.string),
        'filename': Text(shape=(), dtype=tf.string),
        'rank': tf.int32,
        'search_context': Text(shape=(), dtype=tf.string),
        'title': Text(shape=(), dtype=tf.string),
        'url': Text(shape=(), dtype=tf.string),
    }),
})
@article{2017arXivtriviaqa,
       author = { {Joshi}, Mandar and {Choi}, Eunsol and {Weld},
                 Daniel and {Zettlemoyer}, Luke},
        title = "{triviaqa: A Large Scale Distantly Supervised Challenge Dataset for Reading Comprehension}",
      journal = {arXiv e-prints},
         year = 2017,
          eid = {arXiv:1705.03551},
        pages = {arXiv:1705.03551},
archivePrefix = {arXiv},
       eprint = {1705.03551},
}

trivia_qa / rc (التكوين الافتراضي)

  • وصف التكوين : أزواج الأسئلة والإجابات حيث تحتوي جميع المستندات الخاصة بسؤال معين على سلسلة (سلاسل) الإجابة. يتضمن سياق من ويكيبيديا ونتائج البحث.

  • أمثلة ( tfds.as_dataframe ):

trivia_qa / rc.nocontext

  • وصف التكوين : أزواج الأسئلة والإجابات حيث تحتوي جميع المستندات الخاصة بسؤال معين على سلسلة (سلاسل) الإجابة.

  • أمثلة ( tfds.as_dataframe ):

trivia_qa / غير مصفاة

  • وصف التكوين : 110 ألف زوج من الأسئلة والأجوبة للمجال المفتوح لضمان الجودة حيث لا تحتوي جميع المستندات الخاصة بسؤال معين على سلسلة (سلاسل) الإجابة. هذا يجعل مجموعة البيانات غير المفلترة أكثر ملاءمة لنمط IR لضمان الجودة. يتضمن سياق من ويكيبيديا ونتائج البحث.

  • أمثلة ( tfds.as_dataframe ):

trivia_qa / unfiltered.nocontext

  • وصف التكوين : 110 ألف زوج من الأسئلة والأجوبة للمجال المفتوح لضمان الجودة حيث لا تحتوي جميع المستندات الخاصة بسؤال معين على سلسلة (سلاسل) الإجابة. هذا يجعل مجموعة البيانات غير المفلترة أكثر ملاءمة لنمط IR لضمان الجودة.

  • أمثلة ( tfds.as_dataframe ):