Pomoc chronić Wielkiej Rafy Koralowej z TensorFlow na Kaggle Dołącz Wyzwanie

wmt17_translate

  • opis:

Przetłumacz zbiór danych na podstawie danych ze statmt.org.

Wersje istnieją dla różnych lat przy użyciu kombinacji wielu źródeł danych. Podstawa wmt_translate pozwala stworzyć swój własny config, aby wybrać własną parę danych / języka poprzez tworzenie niestandardowych tfds.translate.wmt.WmtConfig .

config = tfds.translate.wmt.WmtConfig(
    version="0.0.1",
    language_pair=("fr", "de"),
    subsets={
        tfds.Split.TRAIN: ["commoncrawl_frde"],
        tfds.Split.VALIDATION: ["euelections_dev2019"],
    },
)
builder = tfds.builder("wmt_translate", config=config)
  • Strona domowa: http://www.statmt.org/wmt17/translation-task.html

  • Kod źródłowy: tfds.translate.Wmt17Translate

  • wersje:

    • 1.0.0 (domyślnie): Brak Uwagi do wydania.
  • Zbiór danych rozmiar: Unknown size

  • Ręczne pobieranie instrukcje: Ten zestaw danych wymaga, aby ręcznie pobrać dane źródłowe do download_config.manual_dir (domyślnie ~/tensorflow_datasets/downloads/manual/ )
    Niektóre konfiguracje wmt tutaj wymagają ręcznego pobrania. Proszę zajrzeć do wmt.py, aby zobaczyć dokładną ścieżkę (i nazwę pliku), który ma zostać pobrany.

  • Auto-buforowane ( dokumentacja ): Nieznany

  • Rysunek ( tfds.show_examples ): Nie jest obsługiwany.

  • cytat:

@InProceedings{bojar-EtAl:2017:WMT1,
  author    = {Bojar, Ond
{r}ej  and  Chatterjee, Rajen  and  Federmann, Christian  and  Graham, Yvette  and  Haddow, Barry  and  Huang, Shujian  and  Huck, Matthias  and  Koehn, Philipp  and  Liu, Qun  and  Logacheva, Varvara  and  Monz, Christof  and  Negri, Matteo  and  Post, Matt  and  Rubino, Raphael  and  Specia, Lucia  and  Turchi, Marco},
  title     = {Findings of the 2017 Conference on Machine Translation (WMT17)},
  booktitle = {Proceedings of the Second Conference on Machine Translation, Volume 2: Shared Task Papers},
  month     = {September},
  year      = {2017},
  address   = {Copenhagen, Denmark},
  publisher = {Association for Computational Linguistics},
  pages     = {169--214},
  url       = {http://www.aclweb.org/anthology/W17-4717}
}

wmt17_translate/cs-en (konfiguracja domyślna)

  • Opis config: WMT 2017 cs-en zbiorze zadań tłumaczenie.

  • Wielkość pliku: 1.66 GiB

  • dzieli:

Podział Przykłady
'test' 3005
'train' 15 851 649
'validation' 2999
  • Cechy:
Translation({
    'cs': Text(shape=(), dtype=tf.string),
    'en': Text(shape=(), dtype=tf.string),
})

wmt17_translate/de-en

  • Opis config: WMT 2017 de-en zbiorze zadań tłumaczenie.

  • Wielkość pliku: 1.81 GiB

  • dzieli:

Podział Przykłady
'test' 3004
'train' 5 906 184
'validation' 2999
  • Cechy:
Translation({
    'de': Text(shape=(), dtype=tf.string),
    'en': Text(shape=(), dtype=tf.string),
})

wmt17_translate/fi-pl

  • Opis config: WMT 2017 fi-en tłumaczenie Zadaniem zestawu danych.

  • Wielkość pliku: 414.10 MiB

  • dzieli:

Podział Przykłady
'test' 6004
'train' 2 656 542
'validation' 6000
  • Cechy:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'fi': Text(shape=(), dtype=tf.string),
})

wmt17_translate/lv-pl

  • Opis config: WMT 2017 lv-en tłumaczenie Zadaniem zestawu danych.

  • Wielkość pliku: 161.69 MiB

  • dzieli:

Podział Przykłady
'test' 2001
'train' 3 567 528
'validation' 2003
  • Cechy:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'lv': Text(shape=(), dtype=tf.string),
})

wmt17_translate/ru-en

  • Opis config: WMT 2017 ru-en zbiorze zadań tłumaczenie.

  • Wielkość pliku: 3.34 GiB

  • dzieli:

Podział Przykłady
'test' 3001
'train' 25 782 720
'validation' 2998
  • Cechy:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'ru': Text(shape=(), dtype=tf.string),
})

wmt17_translate/tr-en

  • Opis config: WMT 2017 tr-en tłumaczenie Zadaniem zestawu danych.

  • Wielkość pliku: 59.32 MiB

  • dzieli:

Podział Przykłady
'test' 3007
'train' 205 756
'validation' 3000
  • Cechy:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'tr': Text(shape=(), dtype=tf.string),
})

wmt17_translate/zh-en

  • Opis config: WMT 2017 pl-pl tłumaczenie Zadaniem zestawu danych.

  • Wielkość pliku: 2.16 GiB

  • dzieli:

Podział Przykłady
'test' 2001
'train' 25.136.609
'validation' 2002
  • Cechy:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'zh': Text(shape=(), dtype=tf.string),
})