- توضیحات :
این یک مجموعه داده برای طبقه بندی اهداف استنادی در مقالات دانشگاهی است. برچسب اصلی استناد برای هر شی J Json با کلید برچسب مشخص می شود در حالی که متن استناد با یک کلید زمینه مشخص می شود. مثال: {'string': 'در پدربزرگهای چاکما ، روابط نر و نوزاد می تواند هم به شکل گیری دوستی و هم به موفقیت پدرانه مرتبط باشد [30،31].' 'sectionName': 'مقدمه' ، 'برچسب': 'پس زمینه' ، 'citingPaperId': '7a6b2d4b405439'، 'citedPaperId': '9d1abadc55b5e0'، ...} می توانید اطلاعات کامل مقاله را با استفاده از شناسه های کاغذی ارائه شده بدست آورید با Semantic Scholar API ( https://api.semanticscholar.org/ ). برچسب ها عبارتند از: روش ، زمینه ، نتیجه
صفحه اصلی : https://github.com/allenai/scicite
کد منبع :
tfds.text.Scicite
نسخه ها :
-
1.0.0
(پیش فرض): بدون یادداشت انتشار.
-
اندازه بارگیری :
22.12 MiB
اندازه مجموعه داده :
Unknown size
ذخیره خودکار ( مستندات ): ناشناخته است
تقسیم :
شکاف | مثال ها |
---|---|
'test' | 1،859 |
'train' | 8،194 |
'validation' | 916 |
- ویژگی ها :
FeaturesDict({
'citeEnd': tf.int64,
'citeStart': tf.int64,
'citedPaperId': Text(shape=(), dtype=tf.string),
'citingPaperId': Text(shape=(), dtype=tf.string),
'excerpt_index': tf.int32,
'id': Text(shape=(), dtype=tf.string),
'isKeyCitation': tf.bool,
'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
'label2': ClassLabel(shape=(), dtype=tf.int64, num_classes=4),
'label2_confidence': tf.float32,
'label_confidence': tf.float32,
'sectionName': Text(shape=(), dtype=tf.string),
'source': ClassLabel(shape=(), dtype=tf.int64, num_classes=7),
'string': Text(shape=(), dtype=tf.string),
})
کلیدهای تحت نظارت (به
as_supervised
سند نظارت شده مراجعه کنید):('string', 'label')
نقل قول :
@InProceedings{Cohan2019Structural,
author={Arman Cohan and Waleed Ammar and Madeleine Van Zuylen and Field Cady},
title={Structural Scaffolds for Citation Intent Classification in Scientific Publications},
booktitle="NAACL",
year="2019"
}
شکل ( tfds.show_examples ): پشتیبانی نمی شود.
مثالها ( tfds.as_dataframe ):