امروز برای رویداد محلی TensorFlow خود در همه جا پاسخ دهید!
این صفحه به‌وسیله ‏Cloud Translation API‏ ترجمه شده است.
Switch to English

wiki_table_text

  • توضیحات :

جداول ویکی پدیا با حداقل 3 ردیف و 2 ستون ، 3 ردیف تصادفی برای هر جدول برای حاشیه نویسی بیشتر انتخاب شدند. هر سطر توسط شخص دیگری حاشیه نویسی شده است ، بنابراین مجموعه داده توسط جفت های (یک جدول ردیف ، شرح متن) تشکیل شده است. حاشیه نویسی حداقل شامل 2 سلول از ردیف است ، اما نیازی به درج همه آنها نیست. مجموعه داده از قالب جدول استاندارد شده پیروی می کند.

شکاف مثال ها
'test' 2000
'train' 10000
'validation' 1،318
  • ویژگی ها :
FeaturesDict({
    'input_text': FeaturesDict({
        'table': Sequence({
            'column_header': tf.string,
            'content': tf.string,
            'row_number': tf.int16,
        }),
    }),
    'target_text': tf.string,
})
  • کلیدهای تحت نظارت (به as_supervised سند نظارت شده مراجعه کنید): ('input_text', 'target_text')

  • نقل قول :

@inproceedings{bao2018table,
  title={Table-to-Text: Describing Table Region with Natural Language},
  author={Junwei Bao and Duyu Tang and Nan Duan and Zhao Yan and Yuanhua Lv and Ming Zhou and Tiejun Zhao},
  booktitle={AAAI},
  url={https://www.aaai.org/ocs/index.php/AAAI/AAAI18/paper/download/16138/16782},
  year={2018}
}