امروز برای رویداد محلی TensorFlow خود در همه جا پاسخ دهید!
این صفحه به‌وسیله ‏Cloud Translation API‏ ترجمه شده است.
Switch to English

reddit_tifu

  • توضیحات :

مجموعه داده Reddit ، جایی که TIFU نام subbreddit / r / tifu را نشان می دهد. همانطور که در انتشارات تعریف شده است ، سبک کوتاه "کوتاه" از عنوان به عنوان خلاصه و "طولانی" از tldr به عنوان خلاصه استفاده می کند.

ویژگی ها شامل: - سند: ارسال متن بدون tldr. - tldr: خط tldr. - عنوان: عنوان کوتاه بدون tldr. - ups: رأی مثبت. - نمره: نمره. - num_comments: تعداد نظرات. - upvote_ratio: نسبت آرا.

FeaturesDict({
    'documents': Text(shape=(), dtype=tf.string),
    'num_comments': tf.float32,
    'score': tf.float32,
    'title': Text(shape=(), dtype=tf.string),
    'tldr': Text(shape=(), dtype=tf.string),
    'ups': tf.float32,
    'upvote_ratio': tf.float32,
})
  • نقل قول :
@misc{kim2018abstractive,
    title={Abstractive Summarization of Reddit Posts with Multi-level Memory Networks},
    author={Byeongchang Kim and Hyunwoo Kim and Gunhee Kim},
    year={2018},
    eprint={1811.00783},
    archivePrefix={arXiv},
    primaryClass={cs.CL}
}

reddit_tifu / short (پیکربندی پیش فرض)

  • شرح پیکربندی : استفاده از عنوان به عنوان خلاصه.

  • تقسیم :

شکاف مثال ها
'train' 79740

reddit_tifu / طولانی

  • شرح پیکربندی : استفاده از TLDR به عنوان خلاصه.

  • تقسیم :

شکاف مثال ها
'train' 42،139