diálogo_wiki

  • Descripción :

WikiDialog es un gran conjunto de datos de conversaciones de búsqueda de información generadas sintéticamente. Cada conversación en el conjunto de datos contiene dos hablantes basados ​​en un pasaje de Wikipedia en inglés: las declaraciones de un hablante consisten en oraciones exactas del pasaje; el otro hablante es generado por un gran modelo de lenguaje.

Separar Ejemplos
'train' 11,264,129
'validation' 113,822
  • Estructura de características :
FeaturesDict({
    'author_num': Sequence(tf.int32),
    'passage': Text(shape=(), dtype=tf.string),
    'pid': Text(shape=(), dtype=tf.string),
    'sentences': Sequence(Text(shape=(), dtype=tf.string)),
    'title': Text(shape=(), dtype=tf.string),
    'utterances': Sequence(Text(shape=(), dtype=tf.string)),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
autor_num Secuencia (tensor) (Ninguna,) tf.int32
paso Texto tf.cadena
pid Texto tf.cadena
oraciones Secuencia (Texto) (Ninguna,) tf.cadena
título Texto tf.cadena
declaraciones Secuencia (Texto) (Ninguna,) tf.cadena
  • Cita :
@inproceedings{dai2022dialoginpainting,
  title={Dialog Inpainting: Turning Documents to Dialogs},
  author={Dai, Zhuyun and Chaganty, Arun Tejasvi and Zhao, Vincent and Amini, Aida and Green, Mike and Rashid, Qazi and Guu, Kelvin},
  booktitle={International Conference on Machine Learning (ICML)},
  year={2022},
  organization={PMLR}
}

wiki_dialog/OQ (configuración predeterminada)