mtnt,mtnt

  • 説明:

MTNT: ノイズの多いテキストの機械翻訳

FeaturesDict({
    'dst': Text(shape=(), dtype=string),
    'src': Text(shape=(), dtype=string),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
dst文章ストリング
ソース文章ストリング
@InProceedings{michel2018mtnt,
  author    = {Michel, Paul  and  Neubig, Graham},
  title     = {MTNT: A Testbed for Machine Translation of Noisy Text},
  booktitle = {Proceedings of the 2018 Conference on Empirical Methods in Natural Language Processing}
}

mtnt/en-fr (デフォルト設定)

  • データセットサイズ: 11.33 MiB

  • スプリット:

スプリット
'test' 1,020
'train' 35,692
'valid' 811

mtnt/えんじゃ

  • データセットサイズ: 4.41 MiB

  • スプリット:

スプリット
'test' 946
'train' 5,746
'valid' 892

mtnt/fr-en

  • データセットサイズ: 8.28 MiB

  • スプリット:

スプリット
'test' 1,022人
'train' 18,942
'valid' 876