人種

  • 説明

Raceは、28,000を超えるパッセージと100,000近くの質問を含む大規模な読解データセットです。データセットは、中学生と高校生向けに設計された中国の英語試験から収集されています。データセットは、機械理解のためのトレーニングおよびテストセットとして使用できます。

  • コンフィグの説明:RACEデータセットのビルダーの設定。

  • ホームページhttps://www.cs.cmu.edu/~glai1/data/race/

  • ソースコードtfds.text.race.Race

  • バージョン

    • 1.0.0 :初期リリース。
    • 2.0.0 (デフォルト):事例IDを追加します。
  • ダウンロードサイズ24.26 MiB

  • オートキャッシュされたドキュメント):はい

  • 特長

FeaturesDict({
    'answers': Sequence(Text(shape=(), dtype=tf.string)),
    'article': Text(shape=(), dtype=tf.string),
    'example_id': Text(shape=(), dtype=tf.string),
    'options': Sequence(Sequence(Text(shape=(), dtype=tf.string))),
    'questions': Sequence(Text(shape=(), dtype=tf.string)),
})
@article{lai2017large,
    title={RACE: Large-scale ReAding Comprehension Dataset From Examinations},
    author={Lai, Guokun and Xie, Qizhe and Liu, Hanxiao and Yang, Yiming and Hovy, Eduard},
    journal={arXiv preprint arXiv:1704.04683},
    year={2017}
}

レース/ハイ(デフォルト設定)

  • データセットサイズ52.39 MiB

  • スプリット

スプリット
'dev' 1,021
'test' 1,045
'train' 18,728

レース/ミドル

  • データセットサイズ12.51 MiB

  • スプリット

スプリット
'dev' 368
'test' 362
'train' 6,409