امروز برای رویداد محلی TensorFlow خود در همه جا پاسخ دهید!
این صفحه به‌وسیله ‏Cloud Translation API‏ ترجمه شده است.
Switch to English

دارت

  • توضیحات :

DART (ضبط DAta به متن تولید) حاوی رابطه ذاتی RDF است که با توصیف جملات حاوی حاوی کل واقعیت ها در مجموعه سه گانه حاوی حاشیه است. DART با استفاده از مجموعه داده های موجود مانند: WikiTableQuestions ، WikiSQL ، WebNLG و Cleaned E2E ساخته شده است. جداول WikiTableQuestions و WikiSQL به سه گانه موضوع-محمول-شی تبدیل شدند و حاشیه نویسی متن آن عمدتا از MTurk جمع آوری شد. نمایش های معنادار در E2E نیز به سه برابر تبدیل شده و از توصیفات آن استفاده شده است ، برخی از آنها که نمی توانند تغییر کنند حذف شدند.

انشعابات مجموعه داده های E2E و WebNLG حفظ می شود و برای WikiTableQuestions و WikiSQL از شباهت Jaccard برای نگهداری جداول مشابه در همان مجموعه (train / dev / tes) استفاده می شود.

این مجموعه داده به دنبال قالب جدول استاندارد ساخته شده است.

شکاف مثال ها
'test' 12،552
'train' 62659
'validation' 6،980
  • ویژگی ها :
FeaturesDict({
    'input_text': FeaturesDict({
        'table': Sequence({
            'column_header': tf.string,
            'content': tf.string,
            'row_number': tf.int16,
        }),
    }),
    'target_text': tf.string,
})
  • کلیدهای تحت نظارت (به as_supervised سند نظارت شده مراجعه کنید): ('input_text', 'target_text')

  • نقل قول :

@article{radev2020dart,
  title={DART: Open-Domain Structured Data Record to Text Generation},
  author={Dragomir Radev and Rui Zhang and Amrit Rau and Abhinand Sivaprasad and Chiachun Hsieh and Nazneen Fatema Rajani and Xiangru Tang and Aadit Vyas and Neha Verma and Pranav Krishna and Yangxiaokang Liu and Nadia Irwanto and Jessica Pan and Faiaz Rahman and Ahmad Zaidi and Murori Mutuma and Yasin Tarabar and Ankit Gupta and Tao Yu and Yi Chern Tan and Xi Victoria Lin and Caiming Xiong and Richard Socher},
  journal={arXiv preprint arXiv:2007.02871},
  year={2020}