- Описание :
Это набор данных для классификации целей цитирования в научных статьях. Основная метка цели цитирования для каждого объекта Json указывается с помощью ключа метки, а контекст цитирования указывается с помощью ключа контекста. Пример: {'string': 'У павианов чакма отношения самца и младенца могут быть связаны как с формированием дружеских отношений, так и с успехом отцовства [30,31] ». 'sectionName': 'Introduction', 'label': 'background', 'citingPaperId': '7a6b2d4b405439', 'citedPaperId': '9d1abadc55b5e0', ...} Вы можете получить полную информацию о бумаге, используя предоставленные идентификаторы бумаги. с помощью Semantic Scholar API ( https://api.semanticscholar.org/ ). Ярлыки: Метод, Фон, Результат.
Домашняя страница : https://github.com/allenai/scicite
Исходный код :
tfds.text.Scicite
Версии :
-
1.0.0
(по умолчанию): без примечаний к выпуску.
-
Размер загрузки :
22.12 MiB
Размер набора данных :
Unknown size
Автоматическое кэширование ( документация ): неизвестно
Сплит :
Трещина | Примеры |
---|---|
'test' | 1,859 |
'train' | 8 194 |
'validation' | 916 |
- Особенности :
FeaturesDict({
'citeEnd': tf.int64,
'citeStart': tf.int64,
'citedPaperId': Text(shape=(), dtype=tf.string),
'citingPaperId': Text(shape=(), dtype=tf.string),
'excerpt_index': tf.int32,
'id': Text(shape=(), dtype=tf.string),
'isKeyCitation': tf.bool,
'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
'label2': ClassLabel(shape=(), dtype=tf.int64, num_classes=4),
'label2_confidence': tf.float32,
'label_confidence': tf.float32,
'sectionName': Text(shape=(), dtype=tf.string),
'source': ClassLabel(shape=(), dtype=tf.int64, num_classes=7),
'string': Text(shape=(), dtype=tf.string),
})
Контролируемые ключи (см.
as_supervised
):('string', 'label')
Цитата :
@InProceedings{Cohan2019Structural,
author={Arman Cohan and Waleed Ammar and Madeleine Van Zuylen and Field Cady},
title={Structural Scaffolds for Citation Intent Classification in Scientific Publications},
booktitle="NAACL",
year="2019"
}
Рисунок ( tfds.show_examples ): не поддерживается.
Примеры ( tfds.as_dataframe ):