- Açıklama:
CORD-19, COVID-19, SARS-CoV-2 ve ilgili koronavirüsler hakkında 33.000'den fazla tam metin içeren 45.000'den fazla bilimsel makalenin bulunduğu bir kaynaktır.
Soyutlayıcı özetleme yoluyla COVID-19'un bilimsel literatürlerindeki bilgilerin düzenlenmesine yardımcı olmak. Bu veri seti, bu makaleleri belge çiftlerine ve tam metin-özet veya giriş-özet özetlerine ayrıştırır.
Özellikler şunları içerir: özet, tam_metin, sha (pdf karma), kaynak_x (yayın kaynağı), başlık, doi (dijital nesne tanımlayıcı), lisans, yazarlar, yayın_zamanı, dergi, url.
Anasayfa: https://www.kaggle.com/allen-institute-for-ai/CORD-19-research-challenge
Kaynak kodu:
tfds.summarization.Covid19sum
sürümleri:
-
1.0.0
(varsayılan): Hayır sürüm notları.
-
İndirme boyutu:
Unknown size
Veri kümesi boyutu:
Unknown size
Manuel indirme talimatları: Bu veri kümesi içine elle kaynak verileri indirmenizi gerektirir
download_config.manual_dir
(varsayılan olarak~/tensorflow_datasets/downloads/manual/
):
Bu veri kümesi gerek el ile indirilecek kaggle api:kaggle datasets download allen-institute-for-ai/CORD-19-research-challenge
Yeri manuel klasöründe zip dosyasını indirdim.Otomatik önbelleğe ( dokümantasyon ): Bilinmeyen
Splits:
Bölünmüş | Örnekler |
---|
- Özellikler:
FeaturesDict({
'abstract': tf.string,
'authors': tf.string,
'body_text': Sequence({
'section': tf.string,
'text': tf.string,
}),
'doi': tf.string,
'journal': tf.string,
'license': tf.string,
'publish_time': tf.string,
'sha': tf.string,
'source_x': tf.string,
'title': tf.string,
'url': tf.string,
})
Denetimli tuşları (Bkz
as_supervised
doc ):('body_text', 'abstract')
Şekil ( tfds.show_examples ): desteklenmez.
Örnekler ( tfds.as_dataframe ): eksik.
Citation:
@ONLINE {CORD-19-research-challenge,
author = "An AI challenge with AI2, CZI, MSR, Georgetown, NIH & The White House",
title = "COVID-19 Open Research Dataset Challenge (CORD-19)",
month = "april",
year = "2020",
url = "https://www.kaggle.com/allen-institute-for-ai/CORD-19-research-challenge"
}