Aprenda o que há de mais recente em aprendizado de máquina, IA generativa e muito mais no WiML Symposium 2023 Registre-se

Esta página foi traduzida pela API Cloud Translation.

flores

Descrição :

Conjuntos de dados de avaliação para tradução automática de poucos recursos: nepalês-inglês e cingalês-inglês.

Documentação Adicional : Explore em Papers With Code
Página inicial : https://github.com/facebookresearch/flores/
Código fonte : tfds.translate.Flores
Versões :
- 1.2.0 (padrão): sem notas de versão.
Tamanho do download : 1.47 MiB
Cache automático ( documentação ): Sim
Figura ( tfds.show_examples ): Não suportado.
Citação :

@misc{guzmn2019new,
    title={Two New Evaluation Datasets for Low-Resource Machine Translation: Nepali-English and Sinhala-English},
    author={Francisco Guzman and Peng-Jen Chen and Myle Ott and Juan Pino and Guillaume Lample and Philipp Koehn and Vishrav Chaudhary and Marc'Aurelio Ranzato},
    year={2019},
    eprint={1902.01382},
    archivePrefix={arXiv},
    primaryClass={cs.CL}
}

flores/neen (configuração padrão)

Descrição da configuração : Conjunto de dados de tradução de ne para en.
Tamanho do conjunto de dados : 1.89 MiB
Divisões :

Dividir	Exemplos
`'test'`	2.835
`'validation'`	2.559

Estrutura de recursos :

Translation({
    'en': Text(shape=(), dtype=string),
    'ne': Text(shape=(), dtype=string),
})

Documentação do recurso:

Característica	Classe	Forma	Tipo D	Descrição
	Tradução
pt	Texto		corda
ne	Texto		corda

Chaves supervisionadas (Consulte as_supervised doc ): ('ne', 'en')
Exemplos ( tfds.as_dataframe ):

flores/sien

Descrição da configuração : Conjunto de dados de tradução de si para en.
Tamanho do conjunto de dados : 2.05 MiB
Divisões :

Dividir	Exemplos
`'test'`	2.766
`'validation'`	2.898

Estrutura de recursos :

Translation({
    'en': Text(shape=(), dtype=string),
    'si': Text(shape=(), dtype=string),
})

Documentação do recurso:

Característica	Classe	Forma	Tipo D	Descrição
	Tradução
pt	Texto		corda
si	Texto		corda

Chaves supervisionadas (Consulte as_supervised doc ): ('si', 'en')
Exemplos ( tfds.as_dataframe ):

Exceto em caso de indicação contrária, o conteúdo desta página é licenciado de acordo com a Licença de atribuição 4.0 do Creative Commons, e as amostras de código são licenciadas de acordo com a Licença Apache 2.0. Para mais detalhes, consulte as políticas do site do Google Developers. Java é uma marca registrada da Oracle e/ou afiliadas.

Última atualização 2022-12-06 UTC.