wiki_table_text

  • Descripción :

Tablas de Wikipedia con al menos 3 filas y 2 columnas, se seleccionaron 3 filas aleatorias para cada tabla para su posterior anotación. Cada fila fue anotada por una persona diferente, por lo que el conjunto de datos está compuesto por pares (tabla de una fila, descripción de texto). Las anotaciones incluyen al menos 2 celdas de la fila, pero no es necesario incluirlas todas. El conjunto de datos sigue un formato de tabla estandarizado.

Separar Ejemplos
'test' 2,000
'train' 10,000
'validation' 1,318
  • Estructura de características :
FeaturesDict({
    'input_text': FeaturesDict({
        'table': Sequence({
            'column_header': string,
            'content': string,
            'row_number': int16,
        }),
    }),
    'target_text': string,
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
texto de entrada CaracterísticasDict
entrada_texto/tabla Secuencia
texto_de_entrada/tabla/encabezado_de_columna Tensor cuerda
entrada_texto/tabla/contenido Tensor cuerda
texto_de_entrada/tabla/número_de_fila Tensor int16
texto_objetivo Tensor cuerda
  • Cita :
@inproceedings{bao2018table,
  title={Table-to-Text: Describing Table Region with Natural Language},
  author={Junwei Bao and Duyu Tang and Nan Duan and Zhao Yan and Yuanhua Lv and Ming Zhou and Tiejun Zhao},
  booktitle={AAAI},
  url={https://www.aaai.org/ocs/index.php/AAAI/AAAI18/paper/download/16138/16782},
  year={2018}
}