lambada

  • Descrizione :

Il set di dati LAMBADA valuta le capacità dei modelli computazionali per la comprensione del testo mediante un'attività di previsione delle parole. LAMBADA è una raccolta di passaggi narrativi accomunati dalla caratteristica che i soggetti umani sono in grado di indovinare la loro ultima parola se sono esposti all'intero brano, ma non se vedono solo l'ultima frase che precede la parola bersaglio

Diviso Esempi
'test' 5.153
'train' 4.869
  • Struttura delle caratteristiche :
FeaturesDict({
    'passage': Text(shape=(), dtype=string),
})
  • Documentazione delle funzionalità :
Caratteristica Classe Forma Tipo D Descrizione
CaratteristicheDict
passaggio Testo corda
  • Citazione :
@inproceedings{paperno-etal-2016-lambada,
    title = "The {LAMBADA} dataset: Word prediction requiring a broad discourse context",
    author = "Paperno, Denis  and
      Kruszewski, Germ{\'a}n  and
      Lazaridou, Angeliki  and
      Pham, Ngoc Quan  and
      Bernardi, Raffaella  and
      Pezzelle, Sandro  and
      Baroni, Marco  and
      Boleda, Gemma  and
      Fern{\'a}ndez, Raquel",
    booktitle = "Proceedings of the 54th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers)",
    month = aug,
    year = "2016",
    address = "Berlin, Germany",
    publisher = "Association for Computational Linguistics",
    url = "https://www.aclweb.org/anthology/P16-1144",
    doi = "10.18653/v1/P16-1144",
    pages = "1525--1534",
}