xnli

  • Descrição :

XNLI é um subconjunto de alguns milhares de exemplos de MNLI que foram traduzidos para 14 idiomas diferentes (alguns recursos de baixo custo). Tal como acontece com o MNLI, o objetivo é prever a vinculação textual (a frase A implica/contradiz/nem a frase B) e é uma tarefa de classificação (dadas duas frases, preveja um dos três rótulos).

Dividir Exemplos
'test' 5.010
'validation' 2.490
  • Estrutura de recursos :
FeaturesDict({
    'hypothesis': TranslationVariableLanguages({
        'language': Text(shape=(), dtype=string),
        'translation': Text(shape=(), dtype=string),
    }),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'premise': Translation({
        'ar': Text(shape=(), dtype=string),
        'bg': Text(shape=(), dtype=string),
        'de': Text(shape=(), dtype=string),
        'el': Text(shape=(), dtype=string),
        'en': Text(shape=(), dtype=string),
        'es': Text(shape=(), dtype=string),
        'fr': Text(shape=(), dtype=string),
        'hi': Text(shape=(), dtype=string),
        'ru': Text(shape=(), dtype=string),
        'sw': Text(shape=(), dtype=string),
        'th': Text(shape=(), dtype=string),
        'tr': Text(shape=(), dtype=string),
        'ur': Text(shape=(), dtype=string),
        'vi': Text(shape=(), dtype=string),
        'zh': Text(shape=(), dtype=string),
    }),
})
  • Documentação do recurso:
Característica Classe Forma Tipo D Descrição
RecursosDict
hipótese TranslationVariableLanguages
hipótese/linguagem Texto corda
hipótese/tradução Texto corda
etiqueta ClassLabel int64
premissa Tradução
premissa/ar Texto corda
premissa/bg Texto corda
premissa/de Texto corda
premissa/el Texto corda
premissa/pt Texto corda
premissa(s) Texto corda
premissa/fr Texto corda
premissa/oi Texto corda
premissa/ru Texto corda
premissa/sw Texto corda
premissa/th Texto corda
premissa/tr Texto corda
premissa/ur Texto corda
premissa/vi Texto corda
premissa/zh Texto corda
  • Citação :
@InProceedings{conneau2018xnli,
  author = "Conneau, Alexis
                 and Rinott, Ruty
                 and Lample, Guillaume
                 and Williams, Adina
                 and Bowman, Samuel R.
                 and Schwenk, Holger
                 and Stoyanov, Veselin",
  title = "XNLI: Evaluating Cross-lingual Sentence Representations",
  booktitle = "Proceedings of the 2018 Conference on Empirical Methods
               in Natural Language Processing",
  year = "2018",
  publisher = "Association for Computational Linguistics",
  location = "Brussels, Belgium",
}
,

  • Descrição :

XNLI é um subconjunto de alguns milhares de exemplos de MNLI que foram traduzidos para 14 idiomas diferentes (alguns recursos de baixo custo). Tal como acontece com o MNLI, o objetivo é prever a vinculação textual (a frase A implica/contradiz/nem a frase B) e é uma tarefa de classificação (dadas duas frases, preveja um dos três rótulos).

Dividir Exemplos
'test' 5.010
'validation' 2.490
  • Estrutura de recursos :
FeaturesDict({
    'hypothesis': TranslationVariableLanguages({
        'language': Text(shape=(), dtype=string),
        'translation': Text(shape=(), dtype=string),
    }),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'premise': Translation({
        'ar': Text(shape=(), dtype=string),
        'bg': Text(shape=(), dtype=string),
        'de': Text(shape=(), dtype=string),
        'el': Text(shape=(), dtype=string),
        'en': Text(shape=(), dtype=string),
        'es': Text(shape=(), dtype=string),
        'fr': Text(shape=(), dtype=string),
        'hi': Text(shape=(), dtype=string),
        'ru': Text(shape=(), dtype=string),
        'sw': Text(shape=(), dtype=string),
        'th': Text(shape=(), dtype=string),
        'tr': Text(shape=(), dtype=string),
        'ur': Text(shape=(), dtype=string),
        'vi': Text(shape=(), dtype=string),
        'zh': Text(shape=(), dtype=string),
    }),
})
  • Documentação do recurso:
Característica Classe Forma Tipo D Descrição
RecursosDict
hipótese TranslationVariableLanguages
hipótese/linguagem Texto corda
hipótese/tradução Texto corda
etiqueta ClassLabel int64
premissa Tradução
premissa/ar Texto corda
premissa/bg Texto corda
premissa/de Texto corda
premissa/el Texto corda
premissa/pt Texto corda
premissa(s) Texto corda
premissa/fr Texto corda
premissa/oi Texto corda
premissa/ru Texto corda
premissa/sw Texto corda
premissa/th Texto corda
premissa/tr Texto corda
premissa/ur Texto corda
premissa/vi Texto corda
premissa/zh Texto corda
  • Citação :
@InProceedings{conneau2018xnli,
  author = "Conneau, Alexis
                 and Rinott, Ruty
                 and Lample, Guillaume
                 and Williams, Adina
                 and Bowman, Samuel R.
                 and Schwenk, Holger
                 and Stoyanov, Veselin",
  title = "XNLI: Evaluating Cross-lingual Sentence Representations",
  booktitle = "Proceedings of the 2018 Conference on Empirical Methods
               in Natural Language Processing",
  year = "2018",
  publisher = "Association for Computational Linguistics",
  location = "Brussels, Belgium",
}