विकि_टेबल_प्रश्न

  • विवरण :

डेटासेट में जोड़े टेबल-प्रश्न और संबंधित उत्तर होते हैं। प्रश्नों के लिए बहु-चरण तर्क और विभिन्न डेटा संचालन जैसे तुलना, एकत्रीकरण और अंकगणितीय गणना की आवश्यकता होती है। तालिकाओं को कम से कम 8 पंक्तियों और 5 स्तंभों वाली विकिपीडिया तालिकाओं में यादृच्छिक रूप से चुना गया था।

(दस्तावेज़ीकरण उपयोग नोट्स के अनुसार)

विभाजित करना उदाहरण
'split-1-dev' 2,810
'split-1-train' 11,321
'split-2-dev' 2,838
'split-2-train' 11,312
'split-3-dev' 2,838
'split-3-train' 11,311
'test' 4,344
'train' 14,149
  • फ़ीचर संरचना :
FeaturesDict({
    'input_text': FeaturesDict({
        'context': string,
        'table': Sequence({
            'column_header': string,
            'content': string,
            'row_number': int16,
        }),
    }),
    'target_text': string,
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
विशेषताएं डिक्ट
इनपुट टेक्स्ट विशेषताएं डिक्ट
input_text/context टेन्सर डोरी
इनपुट_टेक्स्ट/टेबल क्रम
input_text/टेबल/column_header टेन्सर डोरी
input_text/तालिका/सामग्री टेन्सर डोरी
इनपुट_टेक्स्ट/टेबल/पंक्ति_नंबर टेन्सर int16
target_text टेन्सर डोरी
  • उद्धरण :
@inproceedings{pasupat-liang-2015-compositional,
    title = "Compositional Semantic Parsing on Semi-Structured Tables",
    author = "Pasupat, Panupong  and
      Liang, Percy",
    booktitle = "Proceedings of the 53rd Annual Meeting of the Association for Computational Linguistics and the 7th International Joint Conference on Natural Language Processing (Volume 1: Long Papers)",
    month = jul,
    year = "2015",
    address = "Beijing, China",
    publisher = "Association for Computational Linguistics",
    url = "https://www.aclweb.org/anthology/P15-1142",
    doi = "10.3115/v1/P15-1142",
    pages = "1470--1480",
}