wiki_dialog

  • Descriptif :

WikiDialog est un vaste ensemble de données de conversations de recherche d'informations générées de manière synthétique. Chaque conversation de l'ensemble de données contient deux locuteurs fondés sur un passage de Wikipédia en anglais : les énoncés d'un locuteur consistent en des phrases exactes du passage ; l'autre locuteur est généré par un grand modèle de langage.

Diviser Exemples
'train' 11 264 129
'validation' 113 822
  • Structure des fonctionnalités :
FeaturesDict({
    'author_num': Sequence(int32),
    'passage': Text(shape=(), dtype=string),
    'pid': Text(shape=(), dtype=string),
    'sentences': Sequence(Text(shape=(), dtype=string)),
    'title': Text(shape=(), dtype=string),
    'utterances': Sequence(Text(shape=(), dtype=string)),
})
  • Documentation des fonctionnalités :
Caractéristique Classer Forme Dtype La description
FonctionnalitésDict
num_auteur Séquence (tenseur) (Aucun,) int32
passage Texte chaîne de caractères
pid Texte chaîne de caractères
Phrases Séquence (texte) (Aucun,) chaîne de caractères
Titre Texte chaîne de caractères
énoncés Séquence (texte) (Aucun,) chaîne de caractères
  • Citation :
@inproceedings{dai2022dialoginpainting,
  title={Dialog Inpainting: Turning Documents to Dialogs},
  author={Dai, Zhuyun and Chaganty, Arun Tejasvi and Zhao, Vincent and Amini, Aida and Green, Mike and Rashid, Qazi and Guu, Kelvin},
  booktitle={International Conference on Machine Learning (ICML)},
  year={2022},
  organization={PMLR}
}

wiki_dialog/OQ (configuration par défaut)