امروز برای رویداد محلی TensorFlow خود در همه جا پاسخ دهید!
این صفحه به‌وسیله ‏Cloud Translation API‏ ترجمه شده است.
Switch to English

ویکی پدیای برجسته_سپان

  • توضیحات :

جملات ویکی پدیا با دهانه های برجسته برچسب خورده.

@article{guu2020realm,
    title={REALM: Retrieval-Augmented Language Model Pre-Training},
    author={Kelvin Guu and Kenton Lee and Zora Tung and Panupong Pasupat and Ming-Wei Chang},
    year={2020},
    journal = {arXiv e-prints},
    archivePrefix = {arXiv},
    eprint={2002.08909},
}

salient_span_wikipedia / جملات (پیکربندی پیش فرض)

  • شرح پیکربندی : مثالها جملات منفردی هستند که دارای موجودیت هستند.

  • اندازه مجموعه داده : 20.57 GiB

  • تقسیم :

شکاف مثال ها
'train' 82،291،706
  • ویژگی ها :
FeaturesDict({
    'spans': Sequence({
        'limit': tf.int32,
        'start': tf.int32,
        'type': tf.string,
    }),
    'text': Text(shape=(), dtype=tf.string),
    'title': Text(shape=(), dtype=tf.string),
})

spiral_span_wikipedia / اسناد

  • شرح پیکربندی : نمونه هایی از اسناد کامل.

  • اندازه مجموعه داده : 16.52 GiB

  • تقسیم :

شکاف مثال ها
'train' 13،353،718
  • ویژگی ها :
FeaturesDict({
    'sentences': Sequence({
        'limit': tf.int32,
        'start': tf.int32,
    }),
    'spans': Sequence({
        'limit': tf.int32,
        'start': tf.int32,
        'type': tf.string,
    }),
    'text': Text(shape=(), dtype=tf.string),
    'title': Text(shape=(), dtype=tf.string),
})