quac

  • 説明

コンテキストでの質問応答は、情報探索ダイアログをモデル化し、理解し、参加するためのデータセットです。データインスタンスは、2人の群衆労働者間のインタラクティブなダイアログで構成されています:(1)隠されたウィキペディアのテキストについて可能な限り学ぶために一連の自由形式の質問を提起する学生、および(2)短い抜粋を提供することによって質問に答える教師(スパン)テキストから。 QuACは、既存の機械理解データセットには見られない課題をもたらします。その質問は、多くの場合、より自由形式で、答えられないか、ダイアログコンテキスト内でのみ意味があります。

  • ホームページhttps://quac.ai/

  • ソースコードtfds.text.quac.Quac

  • バージョン

    • 1.0.0 (デフォルト):初期リリース。
  • ダウンロードサイズ73.47 MiB

  • データセットのサイズ298.04 MiB

  • オートキャッシュされたドキュメント):いいえ

  • スプリット

スプリット
'train' 83,568
'validation' 7,354
  • 特長
FeaturesDict({
    'answers': Sequence({
        'answer_start': tf.int32,
        'text': Text(shape=(), dtype=tf.string),
    }),
    'background': Text(shape=(), dtype=tf.string),
    'context': Text(shape=(), dtype=tf.string),
    'followup': Text(shape=(), dtype=tf.string),
    'orig_answer': FeaturesDict({
        'answer_start': tf.int32,
        'text': Text(shape=(), dtype=tf.string),
    }),
    'question': Text(shape=(), dtype=tf.string),
    'section_title': Text(shape=(), dtype=tf.string),
    'title': Text(shape=(), dtype=tf.string),
    'yesno': Text(shape=(), dtype=tf.string),
})
  • 引用
@article{choi2018quac,
  title={Quac: Question answering in context},
  author={Choi, Eunsol and He, He and Iyyer, Mohit and Yatskar, Mark and Yih, Wen-tau and Choi, Yejin and Liang, Percy and Zettlemoyer, Luke},
  journal={arXiv preprint arXiv:1808.07036},
  year={2018}
}