scicite

  • विवरण :

यह अकादमिक पत्रों में उद्धरण के उद्देश्यों को वर्गीकृत करने के लिए एक डेटासेट है। प्रत्येक Json ऑब्जेक्ट के लिए मुख्य उद्धरण आशय लेबल लेबल कुंजी के साथ निर्दिष्ट किया गया है जबकि उद्धरण संदर्भ संदर्भ कुंजी के साथ निर्दिष्ट किया गया है। उदाहरण:

{
 'string': 'In chacma baboons, male-infant relationships can be linked to both
    formation of friendships and paternity success [30,31].'
 'sectionName': 'Introduction',
 'label': 'background',
 'citingPaperId': '7a6b2d4b405439',
 'citedPaperId': '9d1abadc55b5e0',
 ...
 }

आप सिमेंटिक स्कॉलर एपीआई ( https://api.semanticscholar.org/ ) के साथ प्रदान की गई पेपर आईडी का उपयोग करके पेपर के बारे में पूरी जानकारी प्राप्त कर सकते हैं।

लेबल हैं: विधि, पृष्ठभूमि, परिणाम

विभाजित करना उदाहरण
'test' 1,859
'train' 8,194
'validation' 916
  • फ़ीचर संरचना :
FeaturesDict({
    'citeEnd': int64,
    'citeStart': int64,
    'citedPaperId': Text(shape=(), dtype=string),
    'citingPaperId': Text(shape=(), dtype=string),
    'excerpt_index': int32,
    'id': Text(shape=(), dtype=string),
    'isKeyCitation': bool,
    'label': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'label2': ClassLabel(shape=(), dtype=int64, num_classes=4),
    'label2_confidence': float32,
    'label_confidence': float32,
    'sectionName': Text(shape=(), dtype=string),
    'source': ClassLabel(shape=(), dtype=int64, num_classes=7),
    'string': Text(shape=(), dtype=string),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
विशेषताएं डिक्ट
उद्धृत अंत टेन्सर int64
citeStart टेन्सर int64
उद्धृत पेपरआईडी मूलपाठ डोरी
पेपरआईडी का हवाला देते हुए मूलपाठ डोरी
अंश_सूचकांक टेन्सर int32
पहचान मूलपाठ डोरी
isKeyCation टेन्सर बूल
लेबल क्लासलेबल int64
लेबल2 क्लासलेबल int64
लेबल2_आत्मविश्वास टेन्सर फ्लोट32
लेबल_आत्मविश्वास टेन्सर फ्लोट32
अनुभाग का नाम मूलपाठ डोरी
स्रोत क्लासलेबल int64
डोरी मूलपाठ डोरी
  • उद्धरण :
@InProceedings{Cohan2019Structural,
  author={Arman Cohan and Waleed Ammar and Madeleine Van Zuylen and Field Cady},
  title={Structural Scaffolds for Citation Intent Classification in Scientific Publications},
  booktitle="NAACL",
  year="2019"
}