Pomoc chronić Wielkiej Rafy Koralowej z TensorFlow na Kaggle Dołącz Wyzwanie

wmt16_translate

  • opis:

Przetłumacz zbiór danych na podstawie danych ze statmt.org.

Wersje istnieją dla różnych lat przy użyciu kombinacji wielu źródeł danych. Podstawa wmt_translate pozwala stworzyć swój własny config, aby wybrać własną parę danych / języka poprzez tworzenie niestandardowych tfds.translate.wmt.WmtConfig .

config = tfds.translate.wmt.WmtConfig(
    version="0.0.1",
    language_pair=("fr", "de"),
    subsets={
        tfds.Split.TRAIN: ["commoncrawl_frde"],
        tfds.Split.VALIDATION: ["euelections_dev2019"],
    },
)
builder = tfds.builder("wmt_translate", config=config)
  • Strona domowa: http://www.statmt.org/wmt16/translation-task.html

  • Kod źródłowy: tfds.translate.Wmt16Translate

  • wersje:

    • 1.0.0 (domyślnie): Brak Uwagi do wydania.
  • Zbiór danych rozmiar: Unknown size

  • Ręczne pobieranie instrukcje: Ten zestaw danych wymaga, aby ręcznie pobrać dane źródłowe do download_config.manual_dir (domyślnie ~/tensorflow_datasets/downloads/manual/ )
    Niektóre konfiguracje wmt tutaj wymagają ręcznego pobrania. Proszę zajrzeć do wmt.py, aby zobaczyć dokładną ścieżkę (i nazwę pliku), który ma zostać pobrany.

  • Auto-buforowane ( dokumentacja ): Nieznany

  • Rysunek ( tfds.show_examples ): Nie jest obsługiwany.

  • cytat:

@InProceedings{bojar-EtAl:2016:WMT1,
  author    = {Bojar, Ond
{r}ej  and  Chatterjee, Rajen  and  Federmann, Christian  and  Graham, Yvette  and  Haddow, Barry  and  Huck, Matthias  and  Jimeno Yepes, Antonio  and  Koehn, Philipp  and  Logacheva, Varvara  and  Monz, Christof  and  Negri, Matteo  and  Neveol, Aurelie  and  Neves, Mariana  and  Popel, Martin  and  Post, Matt  and  Rubino, Raphael  and  Scarton, Carolina  and  Specia, Lucia  and  Turchi, Marco  and  Verspoor, Karin  and  Zampieri, Marcos},
  title     = {Findings of the 2016 Conference on Machine Translation},
  booktitle = {Proceedings of the First Conference on Machine Translation},
  month     = {August},
  year      = {2016},
  address   = {Berlin, Germany},
  publisher = {Association for Computational Linguistics},
  pages     = {131--198},
  url       = {http://www.aclweb.org/anthology/W/W16/W16-2301}
}

wmt16_translate/cs-en (konfiguracja domyślna)

  • Opis config: WMT 2016 cs-en zbiorze zadań tłumaczenie.

  • Wielkość pliku: 1.57 GiB

  • dzieli:

Podział Przykłady
'test' 2999
'train' 52 335 651
'validation' 2656
  • Cechy:
Translation({
    'cs': Text(shape=(), dtype=tf.string),
    'en': Text(shape=(), dtype=tf.string),
})

wmt16_translate/de-en

  • Opis config: WMT 2016 de-en zbiorze zadań tłumaczenie.

  • Wielkość pliku: 1.57 GiB

  • dzieli:

Podział Przykłady
'test' 2999
'train' 4 548 885
'validation' 2169
  • Cechy:
Translation({
    'de': Text(shape=(), dtype=tf.string),
    'en': Text(shape=(), dtype=tf.string),
})

wmt16_translate/fi-pl

  • Opis config: WMT 2016 fi-en tłumaczenie Zadaniem zestawu danych.

  • Wielkość pliku: 260.51 MiB

  • dzieli:

Podział Przykłady
'test' 6000
'train' 2 073 394
'validation' 1370
  • Cechy:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'fi': Text(shape=(), dtype=tf.string),
})

wmt16_translate/ro-en

  • Opis config: WMT 2016 ro-en tłumaczenie Zadaniem zestawu danych.

  • Wielkość pliku: 273.83 MiB

  • dzieli:

Podział Przykłady
'test' 1999
'train' 610,320
'validation' 1999
  • Cechy:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'ro': Text(shape=(), dtype=tf.string),
})

wmt16_translate/ru-en

  • Opis config: WMT 2016 ru-en zbiorze zadań tłumaczenie.

  • Wielkość pliku: 993.38 MiB

  • dzieli:

Podział Przykłady
'test' 2998
'train' 2 516 162
'validation' 2818
  • Cechy:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'ru': Text(shape=(), dtype=tf.string),
})

wmt16_translate/tr-en

  • Opis config: WMT 2016 tr-en tłumaczenie Zadaniem zestawu danych.

  • Wielkość pliku: 59.32 MiB

  • dzieli:

Podział Przykłady
'test' 3000
'train' 205 756
'validation' 1001
  • Cechy:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'tr': Text(shape=(), dtype=tf.string),
})