xnli

  • Descriptif :

XNLI est un sous-ensemble de quelques milliers d'exemples de MNLI qui a été traduit dans 14 langues différentes (certaines ressources de faible envergure). Comme avec MNLI, l'objectif est de prédire l'implication textuelle (la phrase A implique-t-elle/contredit-elle/aucune la phrase B) et est une tâche de classification (étant donné deux phrases, prédire l'une des trois étiquettes).

Diviser Exemples
'test' 5 010
'validation' 2 490
  • Structure des fonctionnalités :
FeaturesDict({
    'hypothesis': TranslationVariableLanguages({
        'language': Text(shape=(), dtype=string),
        'translation': Text(shape=(), dtype=string),
    }),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'premise': Translation({
        'ar': Text(shape=(), dtype=string),
        'bg': Text(shape=(), dtype=string),
        'de': Text(shape=(), dtype=string),
        'el': Text(shape=(), dtype=string),
        'en': Text(shape=(), dtype=string),
        'es': Text(shape=(), dtype=string),
        'fr': Text(shape=(), dtype=string),
        'hi': Text(shape=(), dtype=string),
        'ru': Text(shape=(), dtype=string),
        'sw': Text(shape=(), dtype=string),
        'th': Text(shape=(), dtype=string),
        'tr': Text(shape=(), dtype=string),
        'ur': Text(shape=(), dtype=string),
        'vi': Text(shape=(), dtype=string),
        'zh': Text(shape=(), dtype=string),
    }),
})
  • Documentation des fonctionnalités :
Caractéristique Classer Forme Dtype La description
FonctionnalitésDict
hypothèse TraductionVariableLanguages
hypothèse/langage Texte chaîne de caractères
hypothèse/traduction Texte chaîne de caractères
étiquette Étiquette de classe int64
prémisse Traduction
prémisse / ar Texte chaîne de caractères
prémisse/bg Texte chaîne de caractères
prémisse/de Texte chaîne de caractères
prémisse / el Texte chaîne de caractères
prémisse/fr Texte chaîne de caractères
prémisse(s) Texte chaîne de caractères
prémisse/en Texte chaîne de caractères
prémisse/salut Texte chaîne de caractères
prémisse/ru Texte chaîne de caractères
prémisse/sw Texte chaîne de caractères
prémisse/th Texte chaîne de caractères
prémisse/tr Texte chaîne de caractères
prémisse / votre Texte chaîne de caractères
prémisse/vi Texte chaîne de caractères
prémisse/zh Texte chaîne de caractères
  • Citation :
@InProceedings{conneau2018xnli,
  author = "Conneau, Alexis
                 and Rinott, Ruty
                 and Lample, Guillaume
                 and Williams, Adina
                 and Bowman, Samuel R.
                 and Schwenk, Holger
                 and Stoyanov, Veselin",
  title = "XNLI: Evaluating Cross-lingual Sentence Representations",
  booktitle = "Proceedings of the 2018 Conference on Empirical Methods
               in Natural Language Processing",
  year = "2018",
  publisher = "Association for Computational Linguistics",
  location = "Brussels, Belgium",
}
,

  • Descriptif :

XNLI est un sous-ensemble de quelques milliers d'exemples de MNLI qui a été traduit dans 14 langues différentes (certaines ressources de faible envergure). Comme avec MNLI, l'objectif est de prédire l'implication textuelle (la phrase A implique-t-elle/contredit-elle/aucune la phrase B) et est une tâche de classification (étant donné deux phrases, prédire l'une des trois étiquettes).

Diviser Exemples
'test' 5 010
'validation' 2 490
  • Structure des fonctionnalités :
FeaturesDict({
    'hypothesis': TranslationVariableLanguages({
        'language': Text(shape=(), dtype=string),
        'translation': Text(shape=(), dtype=string),
    }),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'premise': Translation({
        'ar': Text(shape=(), dtype=string),
        'bg': Text(shape=(), dtype=string),
        'de': Text(shape=(), dtype=string),
        'el': Text(shape=(), dtype=string),
        'en': Text(shape=(), dtype=string),
        'es': Text(shape=(), dtype=string),
        'fr': Text(shape=(), dtype=string),
        'hi': Text(shape=(), dtype=string),
        'ru': Text(shape=(), dtype=string),
        'sw': Text(shape=(), dtype=string),
        'th': Text(shape=(), dtype=string),
        'tr': Text(shape=(), dtype=string),
        'ur': Text(shape=(), dtype=string),
        'vi': Text(shape=(), dtype=string),
        'zh': Text(shape=(), dtype=string),
    }),
})
  • Documentation des fonctionnalités :
Caractéristique Classer Forme Dtype La description
FonctionnalitésDict
hypothèse TraductionVariableLanguages
hypothèse/langage Texte chaîne de caractères
hypothèse/traduction Texte chaîne de caractères
étiquette Étiquette de classe int64
prémisse Traduction
prémisse / ar Texte chaîne de caractères
prémisse/bg Texte chaîne de caractères
prémisse/de Texte chaîne de caractères
prémisse / el Texte chaîne de caractères
prémisse/fr Texte chaîne de caractères
prémisse(s) Texte chaîne de caractères
prémisse/en Texte chaîne de caractères
prémisse/salut Texte chaîne de caractères
prémisse/ru Texte chaîne de caractères
prémisse/sw Texte chaîne de caractères
prémisse/th Texte chaîne de caractères
prémisse/tr Texte chaîne de caractères
prémisse / votre Texte chaîne de caractères
prémisse/vi Texte chaîne de caractères
prémisse/zh Texte chaîne de caractères
  • Citation :
@InProceedings{conneau2018xnli,
  author = "Conneau, Alexis
                 and Rinott, Ruty
                 and Lample, Guillaume
                 and Williams, Adina
                 and Bowman, Samuel R.
                 and Schwenk, Holger
                 and Stoyanov, Veselin",
  title = "XNLI: Evaluating Cross-lingual Sentence Representations",
  booktitle = "Proceedings of the 2018 Conference on Empirical Methods
               in Natural Language Processing",
  year = "2018",
  publisher = "Association for Computational Linguistics",
  location = "Brussels, Belgium",
}