wiki_table_text

  • 説明:

少なくとも 3 行 2 列のウィキペディアの表、各表の 3 つのランダムな行が、さらに注釈を付けるために選択されました。各行は別の人によって注釈が付けられているため、データセットは (1 行のテーブル、テキストの説明) のペアで構成されています。注釈には行の少なくとも 2 つのセルが含まれますが、すべてを含める必要はありません。データセットは、標準化されたテーブル形式に従います。

スプリット
'test' 2,000
'train' 10,000
'validation' 1,318
  • 機能構造:
FeaturesDict({
    'input_text': FeaturesDict({
        'table': Sequence({
            'column_header': string,
            'content': string,
            'row_number': int16,
        }),
    }),
    'target_text': string,
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
入力テキスト特徴辞書
入力テキスト/テーブル順序
input_text/table/column_headerテンソルストリング
入力テキスト/テーブル/コンテンツテンソルストリング
入力テキスト/テーブル/行番号テンソルint16
target_textテンソルストリング
  • 引用
@inproceedings{bao2018table,
  title={Table-to-Text: Describing Table Region with Natural Language},
  author={Junwei Bao and Duyu Tang and Nan Duan and Zhao Yan and Yuanhua Lv and Ming Zhou and Tiejun Zhao},
  booktitle={AAAI},
  url={https://www.aaai.org/ocs/index.php/AAAI/AAAI18/paper/download/16138/16782},
  year={2018}
}