امروز برای رویداد محلی TensorFlow خود در همه جا پاسخ دهید!
این صفحه به‌وسیله ‏Cloud Translation API‏ ترجمه شده است.
Switch to English

ویکی پدیای برجسته_سپان

 • توضیحات :

جملات ویکی پدیا با دهانه های برجسته برچسب خورده.

@article{guu2020realm,
  title={REALM: Retrieval-Augmented Language Model Pre-Training},
  author={Kelvin Guu and Kenton Lee and Zora Tung and Panupong Pasupat and Ming-Wei Chang},
  year={2020},
  journal = {arXiv e-prints},
  archivePrefix = {arXiv},
  eprint={2002.08909},
}

salient_span_wikipedia / جملات (پیکربندی پیش فرض)

 • شرح پیکربندی : مثالها جملات منفردی هستند که دارای موجودیت هستند.

 • اندازه مجموعه داده : 20.57 GiB

 • تقسیم :

شکاف مثال ها
'train' 82،291،706
 • ویژگی ها :
FeaturesDict({
  'spans': Sequence({
    'limit': tf.int32,
    'start': tf.int32,
    'type': tf.string,
  }),
  'text': Text(shape=(), dtype=tf.string),
  'title': Text(shape=(), dtype=tf.string),
})

spiral_span_wikipedia / اسناد

 • شرح پیکربندی : نمونه هایی از اسناد کامل.

 • اندازه مجموعه داده : 16.52 GiB

 • تقسیم :

شکاف مثال ها
'train' 13،353،718
 • ویژگی ها :
FeaturesDict({
  'sentences': Sequence({
    'limit': tf.int32,
    'start': tf.int32,
  }),
  'spans': Sequence({
    'limit': tf.int32,
    'start': tf.int32,
    'type': tf.string,
  }),
  'text': Text(shape=(), dtype=tf.string),
  'title': Text(shape=(), dtype=tf.string),
})