wiki_table_text

  • 설명 :

최소 3개의 행과 2개의 열이 있는 Wikipedia 테이블, 추가 주석을 위해 각 테이블에 대해 3개의 임의 행이 선택되었습니다. 각 행은 다른 사람이 주석을 달았으므로 데이터 세트는 (하나의 행 테이블, 텍스트 설명) 쌍으로 구성됩니다. 주석에는 행의 셀이 2개 이상 포함되지만 모두 포함할 필요는 없습니다. 데이터 세트는 표준화된 테이블 형식을 따릅니다.

나뉘다
'test' 2,000
'train' 10,000
'validation' 1,318
  • 기능 구조 :
FeaturesDict({
    'input_text': FeaturesDict({
        'table': Sequence({
            'column_header': string,
            'content': string,
            'row_number': int16,
        }),
    }),
    'target_text': string,
})
  • 기능 문서 :
특징 수업 모양 D타입 설명
풍모Dict
input_text 풍모Dict
입력_텍스트/테이블 순서
input_text/테이블/column_header 텐서
input_text/테이블/콘텐츠 텐서
입력_텍스트/테이블/행_번호 텐서 정수16
target_text 텐서
  • 인용 :
@inproceedings{bao2018table,
  title={Table-to-Text: Describing Table Region with Natural Language},
  author={Junwei Bao and Duyu Tang and Nan Duan and Zhao Yan and Yuanhua Lv and Ming Zhou and Tiejun Zhao},
  booktitle={AAAI},
  url={https://www.aaai.org/ocs/index.php/AAAI/AAAI18/paper/download/16138/16782},
  year={2018}
}