scicite

تنظيم صفحاتك في مجموعات يمكنك حفظ المحتوى وتصنيفه حسب إعداداتك المفضّلة.

  • الوصف :

هذه مجموعة بيانات لتصنيف نوايا الاقتباس في الأوراق الأكاديمية. يتم تحديد التسمية الرئيسية لهدف الاقتباس لكل كائن Json بمفتاح التسمية بينما يتم تحديد سياق الاقتباس بمفتاح سياق. مثال: {'string': 'في chacma baboons ، يمكن ربط العلاقات بين الذكور والرضع بكل من تكوين الصداقات ونجاح الأبوة [30 ، 31]. 'sectionName': 'مقدمة'، 'label': 'خلفية'، 'citingPaperId': '7a6b2d4b405439'، 'citedPaperId': '9d1abadc55b5e0'، ...} يمكنك الحصول على المعلومات الكاملة حول الورق باستخدام معرفات الورق المتوفرة باستخدام واجهة برمجة تطبيقات الباحث الدلالي ( https://api.semanticscholar.org/ ). الملصقات هي: الطريقة ، الخلفية ، النتيجة

  • الصفحة الرئيسية : https://github.com/allenai/scicite

  • كود المصدر : tfds.text.Scicite

  • الإصدارات :

    • 1.0.0 (افتراضي): لا توجد ملاحظات حول الإصدار.
  • حجم التحميل : 22.12 MiB

  • حجم مجموعة البيانات : Unknown size

  • التخزين المؤقت التلقائي ( الوثائق ): غير معروف

  • الانقسامات :

انشق، مزق أمثلة
'test' 1،859
'train' 8194
'validation' 916
  • هيكل الميزة :
FeaturesDict({
    'citeEnd': tf.int64,
    'citeStart': tf.int64,
    'citedPaperId': Text(shape=(), dtype=tf.string),
    'citingPaperId': Text(shape=(), dtype=tf.string),
    'excerpt_index': tf.int32,
    'id': Text(shape=(), dtype=tf.string),
    'isKeyCitation': tf.bool,
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
    'label2': ClassLabel(shape=(), dtype=tf.int64, num_classes=4),
    'label2_confidence': tf.float32,
    'label_confidence': tf.float32,
    'sectionName': Text(shape=(), dtype=tf.string),
    'source': ClassLabel(shape=(), dtype=tf.int64, num_classes=7),
    'string': Text(shape=(), dtype=tf.string),
})
  • وثائق الميزة :
ميزة فصل شكل نوع وصف
الميزات
استشهد موتر tf.int64
استشهد موتر tf.int64
تم الاستشهاد به نص tf.string
نقلاً عن PaperId نص tf.string
مقتطفات_الفهرس موتر tf.int32
هوية شخصية نص tf.string
هو المفتاح موتر tf.bool
ضع الكلمة المناسبة ClassLabel tf.int64
التسمية 2 ClassLabel tf.int64
Label2_confidence موتر tf.float32
الثقة التسمية موتر tf.float32
اسم القسم نص tf.string
مصدر ClassLabel tf.int64
سلسلة نص tf.string
  • الاقتباس :
@InProceedings{Cohan2019Structural,
  author={Arman Cohan and Waleed Ammar and Madeleine Van Zuylen and Field Cady},
  title={Structural Scaffolds for Citation Intent Classification in Scientific Publications},
  booktitle="NAACL",
  year="2019"
}