xtreme_pawsx

  • 説明

このデータセットには、英語のPAWSトレーニングデータの機械翻訳が含まれています。翻訳はXTREMEベンチマークによって提供され、次の言語をカバーしています。

  • フランス語
  • スペイン語
  • ドイツ人
  • 中国語
  • 日本
  • 韓国語

PAWS:PAWSの詳細については、論文を参照してくださいにスクランブルWordから言い換え敵対https://arxiv.org/abs/1904.01130とPAWS-X:で言い換え識別のためのA言語横断敵対データセットのhttps:// arXivの。 org / abs / 1908.11828

XTREME:XTREMEに関連する詳細については、を参照してくださいに言語横断汎化を評価するためのA大規模多言語、マルチタスクのベンチマークhttps://arxiv.org/abs/2003.11080を

FeaturesDict({
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
    'sentence1': Text(shape=(), dtype=tf.string),
    'sentence2': Text(shape=(), dtype=tf.string),
})
@article{hu2020xtreme,
      author    = {Junjie Hu and Sebastian Ruder and Aditya Siddhant and Graham Neubig and Orhan Firat and Melvin Johnson},
      title     = {XTREME: A Massively Multilingual Multi-task Benchmark for Evaluating Cross-lingual Generalization},
      journal   = {CoRR},
      volume    = {abs/2003.11080},
      year      = {2020},
      archivePrefix = {arXiv},
      eprint    = {2003.11080}
}

xtreme_pawsx / de(デフォルト設定)

  • コンフィグの説明:デに翻訳

  • ダウンロードサイズ22.34 MiB

  • データセットサイズ14.19 MiB

  • スプリット

スプリット
'train' 49,340

xtreme_pawsx / es

  • コンフィグの説明:ESに翻訳

  • ダウンロードサイズ22.27 MiB

  • データセットサイズ14.09 MiB

  • スプリット

スプリット
'train' 49,244

xtreme_pawsx / fr

  • コンフィグの説明:FRに翻訳

  • ダウンロードサイズ22.70 MiB

  • データセットサイズ14.53 MiB

  • スプリット

スプリット
'train' 49,208

xtreme_pawsx / ja

  • コンフィグの説明:JAに翻訳

  • ダウンロードサイズ25.12 MiB

  • データセットサイズ16.98 MiB

  • スプリット

スプリット
'train' 49,086

xtreme_pawsx / ko

  • コンフィグの説明:KOに翻訳

  • ダウンロードサイズ22.99 MiB

  • データセットサイズ14.86 MiB

  • スプリット

スプリット
'train' 49,298

xtreme_pawsx / zh

  • コンフィグの説明:ZHに翻訳

  • ダウンロードサイズ21.45 MiB

  • データセットサイズ13.21 MiB

  • スプリット

スプリット
'train' 49,149