scicite

  • คำอธิบาย :

นี่คือชุดข้อมูลสำหรับจำแนกเจตนาของการอ้างอิงในเอกสารวิชาการ ป้ายกำกับการอ้างอิงหลักสำหรับออบเจ็กต์ Json แต่ละรายการระบุด้วยคีย์ป้ายกำกับในขณะที่ระบุบริบทการอ้างอิงด้วยคีย์บริบท ตัวอย่าง:

{
 'string': 'In chacma baboons, male-infant relationships can be linked to both
    formation of friendships and paternity success [30,31].'
 'sectionName': 'Introduction',
 'label': 'background',
 'citingPaperId': '7a6b2d4b405439',
 'citedPaperId': '9d1abadc55b5e0',
 ...
 }

คุณอาจได้รับข้อมูลทั้งหมดเกี่ยวกับเอกสารโดยใช้รหัสเอกสารที่ให้ไว้กับ Semantic Scholar API ( https://api.semanticscholar.org/ )

ป้ายกำกับคือ: วิธีการ พื้นหลัง ผลลัพธ์

แยก ตัวอย่าง
'test' 1,859
'train' 8,194
'validation' 916
  • โครงสร้างคุณลักษณะ :
FeaturesDict({
    'citeEnd': int64,
    'citeStart': int64,
    'citedPaperId': Text(shape=(), dtype=string),
    'citingPaperId': Text(shape=(), dtype=string),
    'excerpt_index': int32,
    'id': Text(shape=(), dtype=string),
    'isKeyCitation': bool,
    'label': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'label2': ClassLabel(shape=(), dtype=int64, num_classes=4),
    'label2_confidence': float32,
    'label_confidence': float32,
    'sectionName': Text(shape=(), dtype=string),
    'source': ClassLabel(shape=(), dtype=int64, num_classes=7),
    'string': Text(shape=(), dtype=string),
})
  • เอกสารคุณสมบัติ :
คุณสมบัติ ระดับ รูปร่าง Dประเภท คำอธิบาย
คุณสมบัติDict
อ้างอิงEnd เทนเซอร์ int64
อ้างเริ่มต้น เทนเซอร์ int64
อ้างถึง PaperId ข้อความ สตริง
อ้างถึง PaperId ข้อความ สตริง
excerpt_index เทนเซอร์ int32
รหัส ข้อความ สตริง
isKeyCitation เทนเซอร์ บูล
ฉลาก ป้ายกำกับคลาส int64
ป้ายกำกับ2 ป้ายกำกับคลาส int64
label2_confidence เทนเซอร์ ลอย32
label_confidence เทนเซอร์ ลอย32
ชื่อส่วน ข้อความ สตริง
แหล่งที่มา ป้ายกำกับคลาส int64
สตริง ข้อความ สตริง
  • การอ้างอิง :
@InProceedings{Cohan2019Structural,
  author={Arman Cohan and Waleed Ammar and Madeleine Van Zuylen and Field Cady},
  title={Structural Scaffolds for Citation Intent Classification in Scientific Publications},
  booktitle="NAACL",
  year="2019"
}