RSVP для вашего местного мероприятия TensorFlow Everywhere сегодня!
Эта страница переведена с помощью Cloud Translation API.
Switch to English

дротик

  • Описание :

DART (DAta Record to Text generation) содержит отношение сущностей RDF, аннотированное описаниями предложений, которые охватывают все факты в тройном наборе. DART был построен с использованием существующих наборов данных, таких как: WikiTableQuestions, WikiSQL, WebNLG и Cleaned E2E. Таблицы из WikiTableQuestions и WikiSQL были преобразованы в тройки субъект-предикат-объект, а их текстовые аннотации в основном собирались из MTurk. Значимые представления в E2E также были преобразованы в тройки, и были использованы их описания, некоторые из них, которые не могли быть преобразованы, были отброшены.

Разделение наборов данных E2E и WebNLG сохраняется, а для WikiTableQuestions и WikiSQL используется подобие Жаккарда для сохранения похожих таблиц в одном наборе (train / dev / tes).

Этот набор данных построен в соответствии со стандартизованным табличным форматом.

  • Домашняя страница : https://github.com/Yale-LILY/dart

  • Исходный код : tfds.structured.dart.Dart

  • Версии :

    • 0.1.0 (по умолчанию): без примечаний к выпуску.
  • Размер загрузки : 249.71 MiB

  • Размер набора данных : 38.83 MiB

  • Автоматическое кэширование ( документация ): Да

  • Сплит :

Трещина Примеры
'test' 12,552
'train' 62 659
'validation' 6 980
  • Особенности :
FeaturesDict({
    'input_text': FeaturesDict({
        'table': Sequence({
            'column_header': tf.string,
            'content': tf.string,
            'row_number': tf.int16,
        }),
    }),
    'target_text': tf.string,
})
  • Контролируемые ключи (см. as_supervised doc ): ('input_text', 'target_text')

  • Цитата :

@article{radev2020dart,
  title={DART: Open-Domain Structured Data Record to Text Generation},
  author={Dragomir Radev and Rui Zhang and Amrit Rau and Abhinand Sivaprasad and Chiachun Hsieh and Nazneen Fatema Rajani and Xiangru Tang and Aadit Vyas and Neha Verma and Pranav Krishna and Yangxiaokang Liu and Nadia Irwanto and Jessica Pan and Faiaz Rahman and Ahmad Zaidi and Murori Mutuma and Yasin Tarabar and Ankit Gupta and Tao Yu and Yi Chern Tan and Xi Victoria Lin and Caiming Xiong and Richard Socher},
  journal={arXiv preprint arXiv:2007.02871},
  year={2020}