¡El Día de la Comunidad de ML es el 9 de noviembre! Únase a nosotros para recibir actualizaciones de TensorFlow, JAX, y más Más información

wiki_table_text

  • Descripción:

Se seleccionaron tablas de Wikipedia con al menos 3 filas y 2 columnas, 3 filas aleatorias para cada tabla para anotación adicional. Cada fila fue anotada por una persona diferente, por lo que el conjunto de datos está compuesto por pares (tabla de una fila, descripción de texto). Las anotaciones incluyen al menos 2 celdas de la fila, pero no es necesario incluirlas todas. El conjunto de datos sigue un formato de tabla estandarizado.

Separar Ejemplos de
'test' 2.000
'train' 10,000
'validation' 1.318
  • características:
FeaturesDict({
    'input_text': FeaturesDict({
        'table': Sequence({
            'column_header': tf.string,
            'content': tf.string,
            'row_number': tf.int16,
        }),
    }),
    'target_text': tf.string,
})
  • Cita:
@inproceedings{bao2018table,
  title={Table-to-Text: Describing Table Region with Natural Language},
  author={Junwei Bao and Duyu Tang and Nan Duan and Zhao Yan and Yuanhua Lv and Ming Zhou and Tiejun Zhao},
  booktitle={AAAI},
  url={https://www.aaai.org/ocs/index.php/AAAI/AAAI18/paper/download/16138/16782},
  year={2018}
}