- תיאור:
CORD-19 הוא משאב של למעלה מ- 45,000 מאמרים מלומדים, כולל למעלה מ- 33,000 עם טקסט מלא, אודות COVID-19, SARS-CoV-2 וקורונווירוסים קשורים.
כדי לסייע בארגון מידע בספרות מדעיות של COVID-19 באמצעות סיכום מופשט. מערך נתונים זה מנתח את המאמרים האלה לזוגות מסמכים וסיכומים של טקסט מלא-מופשט או מבוא-מופשט.
התכונות כוללות מחרוזות של: מופשט, טקסט מלא, sha (hash של pdf), source_x (מקור פרסום), כותרת, doi (מזהה אובייקט דיגיטלי), רישיון, מחברים, publish_time, יומן, url.
דף הבית: https://www.kaggle.com/allen-institute-for-ai/CORD-19-research-challenge
קוד מקור:
tfds.summarization.Covid19sum
גרסאות:
-
1.0.0
(ברירת המחדל): הערות השחרור לא.
-
גודל ההורדה:
Unknown size
גודל בסיס הנתונים:
Unknown size
הוראות הורדה ידנית: מערך נתונים זה מחייב אותך להוריד את נתוני המקור באופן ידני לתוך
download_config.manual_dir
(ברירת המחדל היא~/tensorflow_datasets/downloads/manual/
):
הצורך במערך זה כדי להוריד באופן ידני באמצעות kaggle API:kaggle datasets download allen-institute-for-ai/CORD-19-research-challenge
מקום שהורדו קובץ zip בתיקיה ידנית.Auto-במטמון ( תיעוד ): לא ידוע
פיצולים:
לְפַצֵל | דוגמאות |
---|
- מאפיינים:
FeaturesDict({
'abstract': tf.string,
'authors': tf.string,
'body_text': Sequence({
'section': tf.string,
'text': tf.string,
}),
'doi': tf.string,
'journal': tf.string,
'license': tf.string,
'publish_time': tf.string,
'sha': tf.string,
'source_x': tf.string,
'title': tf.string,
'url': tf.string,
})
מפתחות השגחה (ראה
as_supervised
doc ):('body_text', 'abstract')
איור ( tfds.show_examples ): לא נתמך.
דוגמאות ( tfds.as_dataframe ): חסר.
ציטוט:
@ONLINE {CORD-19-research-challenge,
author = "An AI challenge with AI2, CZI, MSR, Georgetown, NIH & The White House",
title = "COVID-19 Open Research Dataset Challenge (CORD-19)",
month = "april",
year = "2020",
url = "https://www.kaggle.com/allen-institute-for-ai/CORD-19-research-challenge"
}