איכות

  • תיאור :

QUALITY, מערך נתונים רב-ברירה להבנת הנקרא ארוך.

אנו מספקים רק את הגרסה הגולמית.

לְפַצֵל דוגמאות
'dev' 230
'test' 232
'train' 300
  • מבנה תכונה :
FeaturesDict({
    'article': Text(shape=(), dtype=string),
    'article_id': Text(shape=(), dtype=string),
    'difficults': Sequence(bool),
    'gold_labels': Sequence(int32),
    'options': Sequence(Sequence(Text(shape=(), dtype=string))),
    'question_ids': Sequence(Text(shape=(), dtype=string)),
    'questions': Sequence(Text(shape=(), dtype=string)),
    'set_unique_id': Text(shape=(), dtype=string),
    'source': Text(shape=(), dtype=string),
    'title': Text(shape=(), dtype=string),
    'topic': Text(shape=(), dtype=string),
    'url': Text(shape=(), dtype=string),
    'writer_id': Text(shape=(), dtype=string),
    'writer_labels': Sequence(int32),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
מאמר טֶקסט חוּט
מאמר_מזהה טֶקסט חוּט
קשיים רצף (טנזור) (אף אחד,) bool
תוויות_זהב רצף (טנזור) (אף אחד,) int32
אפשרויות Sequence(Sequence(Text)) (אין, אין) חוּט
זיהוי_שאלות רצף (טקסט) (אף אחד,) חוּט
שאלות רצף (טקסט) (אף אחד,) חוּט
set_unique_id טֶקסט חוּט
מָקוֹר טֶקסט חוּט
כותרת טֶקסט חוּט
נוֹשֵׂא טֶקסט חוּט
כתובת אתר טֶקסט חוּט
סופר_מזהה טֶקסט חוּט
סופר_תוויות רצף (טנזור) (אף אחד,) int32
@article{pang2021quality,
  title={ {QuALITY}: Question Answering with Long Input Texts, Yes!},
  author={Pang, Richard Yuanzhe and Parrish, Alicia and Joshi, Nitish and Nangia, Nikita and Phang, Jason and Chen, Angelica and Padmakumar, Vishakh and Ma, Johnny and Thompson, Jana and He, He and Bowman, Samuel R.},
  journal={arXiv preprint arXiv:2112.08608},
  year={2021}
}

איכות/גולמי (תצורת ברירת המחדל)

  • תיאור תצורה : גולמי עם HTML.

  • גודל ערכת נתונים: 22.18 MiB

  • דוגמאות ( tfds.as_dataframe ):

איכותי/מופשט

  • תיאור תצורה : מופשט מ-HTML.

  • גודל מערך נתונים : 20.73 MiB

  • דוגמאות ( tfds.as_dataframe ):