wiki_dialog

  • Descrição :

WikiDialog é um grande conjunto de dados de conversas de busca de informações geradas sinteticamente. Cada conversa no conjunto de dados contém dois falantes fundamentados em uma passagem da Wikipedia em inglês: as declarações de um falante consistem em sentenças exatas da passagem; o outro falante é gerado por um grande modelo de linguagem.

Dividir Exemplos
'train' 11.264.129
'validation' 113.822
  • Estrutura de recursos :
FeaturesDict({
    'author_num': Sequence(int32),
    'passage': Text(shape=(), dtype=string),
    'pid': Text(shape=(), dtype=string),
    'sentences': Sequence(Text(shape=(), dtype=string)),
    'title': Text(shape=(), dtype=string),
    'utterances': Sequence(Text(shape=(), dtype=string)),
})
  • Documentação do recurso:
Característica Classe Forma Tipo D Descrição
RecursosDict
autor_num Sequência(Tensor) (Nenhum,) int32
passagem Texto corda
pid Texto corda
frases Sequência (Texto) (Nenhum,) corda
título Texto corda
enunciados Sequência (Texto) (Nenhum,) corda
  • Citação :
@inproceedings{dai2022dialoginpainting,
  title={Dialog Inpainting: Turning Documents to Dialogs},
  author={Dai, Zhuyun and Chaganty, Arun Tejasvi and Zhao, Vincent and Amini, Aida and Green, Mike and Rashid, Qazi and Guu, Kelvin},
  booktitle={International Conference on Machine Learning (ICML)},
  year={2022},
  organization={PMLR}
}

wiki_dialog/OQ (configuração padrão)