एमएल समुदाय दिवस 9 नवंबर है! TensorFlow, JAX से नई जानकारी के लिए हमसे जुड़ें, और अधिक जानें

wiki_table_text

  • विवरण:

कम से कम ३ पंक्तियों और २ स्तंभों वाली विकिपीडिया तालिकाएँ, प्रत्येक तालिका के लिए ३ यादृच्छिक पंक्तियों को आगे की व्याख्या के लिए चुना गया था। प्रत्येक पंक्ति को एक अलग व्यक्ति द्वारा एनोटेट किया गया था, इसलिए डेटासेट (एक पंक्ति तालिका, पाठ विवरण) जोड़े द्वारा रचित है। एनोटेशन में पंक्ति के कम से कम 2 सेल शामिल होते हैं, लेकिन उन सभी को शामिल करने की आवश्यकता नहीं होती है। डेटासेट एक मानक तालिका प्रारूप का अनुसरण करता है।

विभाजित करना उदाहरण
'test' 2,000
'train' 10,000
'validation' 1,318
  • विशेषताएं:
FeaturesDict({
    'input_text': FeaturesDict({
        'table': Sequence({
            'column_header': tf.string,
            'content': tf.string,
            'row_number': tf.int16,
        }),
    }),
    'target_text': tf.string,
})
  • प्रशस्ति पत्र:
@inproceedings{bao2018table,
  title={Table-to-Text: Describing Table Region with Natural Language},
  author={Junwei Bao and Duyu Tang and Nan Duan and Zhao Yan and Yuanhua Lv and Ming Zhou and Tiejun Zhao},
  booktitle={AAAI},
  url={https://www.aaai.org/ocs/index.php/AAAI/AAAI18/paper/download/16138/16782},
  year={2018}
}