lambada

  • Descriptif :

L'ensemble de données LAMBADA évalue les capacités des modèles informatiques pour la compréhension de texte au moyen d'une tâche de prédiction de mots. LAMBADA est une collection de passages narratifs partageant la caractéristique que les sujets humains sont capables de deviner leur dernier mot s'ils sont exposés à l'ensemble du passage, mais pas s'ils ne voient que la dernière phrase précédant le mot cible

Diviser Exemples
'test' 5 153
'train' 4 869
  • Structure des fonctionnalités :
FeaturesDict({
    'passage': Text(shape=(), dtype=string),
})
  • Documentation des fonctionnalités :
Caractéristique Classer Forme Dtype La description
FonctionnalitésDict
passage Texte chaîne de caractères
  • Citation :
@inproceedings{paperno-etal-2016-lambada,
    title = "The {LAMBADA} dataset: Word prediction requiring a broad discourse context",
    author = "Paperno, Denis  and
      Kruszewski, Germ{\'a}n  and
      Lazaridou, Angeliki  and
      Pham, Ngoc Quan  and
      Bernardi, Raffaella  and
      Pezzelle, Sandro  and
      Baroni, Marco  and
      Boleda, Gemma  and
      Fern{\'a}ndez, Raquel",
    booktitle = "Proceedings of the 54th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers)",
    month = aug,
    year = "2016",
    address = "Berlin, Germany",
    publisher = "Association for Computational Linguistics",
    url = "https://www.aclweb.org/anthology/P16-1144",
    doi = "10.18653/v1/P16-1144",
    pages = "1525--1534",
}