O Google I / O retorna de 18 a 20 de maio! Reserve espaço e monte sua agenda Cadastre-se agora

ted_hrlr_translate

  • Descrição :

Conjuntos de dados derivados de transcrições de conversas TED para comparar pares de linguagens semelhantes, onde um tem alto recurso e o outro tem baixo.

@inproceedings{Ye2018WordEmbeddings,
  author  = {Ye, Qi and Devendra, Sachan and Matthieu, Felix and Sarguna, Padmanabhan and Graham, Neubig},
  title   = {When and Why are pre-trained word embeddings useful for Neural Machine Translation},
  booktitle = {HLT-NAACL},
  year    = {2018},
  }

ted_hrlr_translate / az_to_en (configuração padrão)

  • Descrição da configuração : conjunto de dados de tradução de az para en em texto simples.

  • Divisões :

Dividir Exemplos
'test' 903
'train' 5.946
'validation' 671
  • Características :
Translation({
    'az': Text(shape=(), dtype=tf.string),
    'en': Text(shape=(), dtype=tf.string),
})

ted_hrlr_translate / aztr_to_en

  • Descrição da configuração : conjunto de dados de tradução de az_tr para en em texto simples.

  • Divisões :

Dividir Exemplos
'test' 903
'train' 188.396
'validation' 671
  • Características :
Translation({
    'az_tr': Text(shape=(), dtype=tf.string),
    'en': Text(shape=(), dtype=tf.string),
})

ted_hrlr_translate / be_to_en

  • Descrição da configuração : conjunto de dados de tradução do início ao fim em texto simples.

  • Divisões :

Dividir Exemplos
'test' 664
'train' 4.509
'validation' 248
  • Características :
Translation({
    'be': Text(shape=(), dtype=tf.string),
    'en': Text(shape=(), dtype=tf.string),
})

ted_hrlr_translate / beru_to_en

  • Descrição da configuração : conjunto de dados de tradução de be_ru para en em texto simples.

  • Divisões :

Dividir Exemplos
'test' 664
'train' 212.614
'validation' 248
  • Características :
Translation({
    'be_ru': Text(shape=(), dtype=tf.string),
    'en': Text(shape=(), dtype=tf.string),
})

ted_hrlr_translate / es_to_pt

  • Descrição de configuração : conjunto de dados de tradução de es para pt em texto simples.

  • Divisões :

Dividir Exemplos
'test' 1.763
'train' 44.938
'validation' 1.016
  • Características :
Translation({
    'es': Text(shape=(), dtype=tf.string),
    'pt': Text(shape=(), dtype=tf.string),
})

ted_hrlr_translate / fr_to_pt

  • Descrição da configuração : conjunto de dados de tradução de fr para pt em texto simples.

  • Divisões :

Dividir Exemplos
'test' 1.494
'train' 43.873
'validation' 1.131
  • Características :
Translation({
    'fr': Text(shape=(), dtype=tf.string),
    'pt': Text(shape=(), dtype=tf.string),
})

ted_hrlr_translate / gl_to_en

  • Descrição da configuração : conjunto de dados de tradução de gl para en em texto simples.

  • Divisões :

Dividir Exemplos
'test' 1.007
'train' 10.017
'validation' 682
  • Características :
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'gl': Text(shape=(), dtype=tf.string),
})

ted_hrlr_translate / glpt_to_en

  • Descrição da configuração : conjunto de dados de tradução de gl_pt para en em texto simples.

  • Divisões :

Dividir Exemplos
'test' 1.007
'train' 61.802
'validation' 682
  • Características :
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'gl_pt': Text(shape=(), dtype=tf.string),
})

ted_hrlr_translate / he_to_pt

  • Descrição de configuração : conjunto de dados de tradução de he para pt em texto simples.

  • Divisões :

Dividir Exemplos
'test' 1.623
'train' 48.511
'validation' 1.145
  • Características :
Translation({
    'he': Text(shape=(), dtype=tf.string),
    'pt': Text(shape=(), dtype=tf.string),
})

ted_hrlr_translate / it_to_pt

  • Descrição da configuração : conjunto de dados de tradução dele para pt em texto simples.

  • Divisões :

Dividir Exemplos
'test' 1.669
'train' 46.259
'validation' 1.162
  • Características :
Translation({
    'it': Text(shape=(), dtype=tf.string),
    'pt': Text(shape=(), dtype=tf.string),
})

ted_hrlr_translate / pt_to_en

  • Descrição da configuração : conjunto de dados de tradução de pt para en em texto simples.

  • Divisões :

Dividir Exemplos
'test' 1.803
'train' 51.785
'validation' 1.193
  • Características :
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'pt': Text(shape=(), dtype=tf.string),
})

ted_hrlr_translate / ru_to_en

  • Descrição da configuração : conjunto de dados de tradução de ru para en em texto simples.

  • Divisões :

Dividir Exemplos
'test' 5.476
'train' 208.106
'validation' 4.805
  • Características :
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'ru': Text(shape=(), dtype=tf.string),
})

ted_hrlr_translate / ru_to_pt

  • Descrição da configuração : conjunto de dados de tradução de ru para pt em texto simples.

  • Divisões :

Dividir Exemplos
'test' 1.588
'train' 47.278
'validation' 1.184
  • Características :
Translation({
    'pt': Text(shape=(), dtype=tf.string),
    'ru': Text(shape=(), dtype=tf.string),
})

ted_hrlr_translate / tr_to_en

  • Descrição da configuração : conjunto de dados de tradução de tr para en em texto simples.

  • Divisões :

Dividir Exemplos
'test' 5.029
'train' 182.450
'validation' 4.045
  • Características :
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'tr': Text(shape=(), dtype=tf.string),
})