wiki_table_questions

  • 説明

データセットには、テーブルと質問のペアとそれぞれの回答が含まれています。質問には、多段階の推論と、比較、集計、算術計算などのさまざまなデータ操作が必要です。テーブルは、少なくとも8行5列のウィキペディアテーブルからランダムに選択されました。

(ドキュメントの使用上の注意による)

  • Dev:トレーニングデータの3つ(5つではない)の分割にわたる平均精度。つまり、「split- {1,2,3} -train」でトレーニングし、「split- {1,2,3} -dev」でテストしてから、精度を平均します。

  • テスト:「train」でトレーニングし、「test」でテストします。

  • ホームページhttps://ppasupat.github.io/WikiTableQuestions/#usage-notes

  • ソースコードtfds.structured.wiki_table_questions.WikiTableQuestions

  • バージョン

    • 1.0.0 (デフォルト):初期リリース。
  • ダウンロードサイズ65.36 MiB

  • データセットのサイズ237.24 MiB

  • オートキャッシュされたドキュメント):はい

  • スプリット

スプリット
'split-1-dev' 2,810
'split-1-train' 11,321
'split-2-dev' 2,838
'split-2-train' 11,312
'split-3-dev' 2,838
'split-3-train' 11,311
'test' 4,344
'train' 14,149
  • 特長
FeaturesDict({
    'input_text': FeaturesDict({
        'context': tf.string,
        'table': Sequence({
            'column_header': tf.string,
            'content': tf.string,
            'row_number': tf.int16,
        }),
    }),
    'target_text': tf.string,
})
  • 引用
@inproceedings{pasupat-liang-2015-compositional,
    title = "Compositional Semantic Parsing on Semi-Structured Tables",
    author = "Pasupat, Panupong  and
      Liang, Percy",
    booktitle = "Proceedings of the 53rd Annual Meeting of the Association for Computational Linguistics and the 7th International Joint Conference on Natural Language Processing (Volume 1: Long Papers)",
    month = jul,
    year = "2015",
    address = "Beijing, China",
    publisher = "Association for Computational Linguistics",
    url = "https://www.aclweb.org/anthology/P15-1142",
    doi = "10.3115/v1/P15-1142",
    pages = "1470--1480",
}