امروز برای رویداد محلی TensorFlow خود در همه جا پاسخ دهید!
این صفحه به‌وسیله ‏Cloud Translation API‏ ترجمه شده است.
Switch to English

reddit_tifu

 • توضیحات :

مجموعه داده Reddit ، جایی که TIFU نام subbreddit / r / tifu را نشان می دهد. همانطور که در انتشارات تعریف شده است ، سبک کوتاه "کوتاه" از عنوان به عنوان خلاصه و "طولانی" از tldr به عنوان خلاصه استفاده می کند.

ویژگی ها شامل: - سند: ارسال متن بدون tldr. - tldr: خط tldr. - عنوان: عنوان کوتاه بدون tldr. - ups: رأی مثبت. - نمره: نمره. - num_comments: تعداد نظرات. - upvote_ratio: نسبت آرا.

FeaturesDict({
  'documents': Text(shape=(), dtype=tf.string),
  'num_comments': tf.float32,
  'score': tf.float32,
  'title': Text(shape=(), dtype=tf.string),
  'tldr': Text(shape=(), dtype=tf.string),
  'ups': tf.float32,
  'upvote_ratio': tf.float32,
})
 • نقل قول :
@misc{kim2018abstractive,
  title={Abstractive Summarization of Reddit Posts with Multi-level Memory Networks},
  author={Byeongchang Kim and Hyunwoo Kim and Gunhee Kim},
  year={2018},
  eprint={1811.00783},
  archivePrefix={arXiv},
  primaryClass={cs.CL}
}

reddit_tifu / short (پیکربندی پیش فرض)

 • شرح پیکربندی : استفاده از عنوان به عنوان خلاصه.

 • تقسیم :

شکاف مثال ها
'train' 79740

reddit_tifu / طولانی

 • شرح پیکربندی : استفاده از TLDR به عنوان خلاصه.

 • تقسیم :

شکاف مثال ها
'train' 42،139