لدي سؤال؟ تواصل مع المجتمع في منتدى زيارة منتدى TensorFlow

reddit_tifu

  • الوصف :

مجموعة بيانات Reddit ، حيث تشير TIFU إلى اسم subbreddit / r / tifu. كما هو محدد في المنشور ، يستخدم Styel "short" العنوان باعتباره ملخصًا و "long" يستخدم tldr كملخص.

تشمل الميزات: - المستند: نص آخر بدون tldr. - tldr: خط tldr. - العنوان: قص العنوان بدون tldr. - يو بي إس: التأييد. - النتيجة: النتيجة. - num_comments: عدد التعليقات. - upvote_ratio: نسبة التصويت الايجابي.

  • الصفحة الرئيسية : https://github.com/ctr4si/MMN

  • كود المصدر : tfds.summarization.RedditTifu

  • إصدارات :

    • 1.1.0 (افتراضي): لا توجد ملاحظات حول الإصدار.
  • حجم التحميل : 639.54 MiB

  • حجم مجموعة البيانات : Unknown size

  • التخزين المؤقت التلقائي ( الوثائق ): غير معروف

  • الميزات :

FeaturesDict({
    'documents': Text(shape=(), dtype=tf.string),
    'num_comments': tf.float32,
    'score': tf.float32,
    'title': Text(shape=(), dtype=tf.string),
    'tldr': Text(shape=(), dtype=tf.string),
    'ups': tf.float32,
    'upvote_ratio': tf.float32,
})
@misc{kim2018abstractive,
    title={Abstractive Summarization of Reddit Posts with Multi-level Memory Networks},
    author={Byeongchang Kim and Hyunwoo Kim and Gunhee Kim},
    year={2018},
    eprint={1811.00783},
    archivePrefix={arXiv},
    primaryClass={cs.CL}
}

reddit_tifu / short (التكوين الافتراضي)

  • وصف التكوين : استخدام العنوان كموجز.

  • الانقسامات :

انشق، مزق أمثلة
'train' 79.740

reddit_tifu / طويل

  • وصف التكوين : استخدام TLDR كملخص.

  • الانقسامات :

انشق، مزق أمثلة
'train' 42139