- תיאור :
CORD-19 הוא משאב של למעלה מ-45,000 מאמרים אקדמיים, כולל למעלה מ-33,000 עם טקסט מלא, על COVID-19, SARS-CoV-2 וקורונה קשורה.
לעזור לארגן מידע בספרות מדעית של COVID-19 באמצעות סיכום מופשט. מערך הנתונים הזה מנתח את המאמרים האלה לזוגות של מסמכים וסיכומים של תקציר מלא_טקסט או תקציר מבוא.
התכונות כוללות מחרוזות של: תקציר, טקסט מלא, sha (hash של pdf), source_x (מקור פרסום), כותרת, doi (מזהה אובייקט דיגיטלי), רישיון, מחברים, זמן פרסום, כתב עת, כתובת אתר.
תיעוד נוסף : חקור על ניירות עם קוד
דף הבית : https://www.kaggle.com/allen-institute-for-ai/CORD-19-research-challenge
קוד מקור :
tfds.summarization.Covid19sum
גרסאות :
-
1.0.0
(ברירת מחדל): אין הערות שחרור.
-
גודל הורדה :
Unknown size
גודל ערכת נתונים :
Unknown size
הוראות הורדה ידניות : מערך נתונים זה מחייב אותך להוריד את נתוני המקור באופן ידני אל
download_config.manual_dir
(ברירת המחדל היא~/tensorflow_datasets/downloads/manual/
):
יש להוריד את מערך הנתונים הזה באופן ידני דרך kaggle api:kaggle datasets download allen-institute-for-ai/CORD-19-research-challenge
הנח את קובץ ה-zip שהורדת בתיקייה הידנית.שמור אוטומטי במטמון ( תיעוד ): לא ידוע
פיצולים :
לְפַצֵל | דוגמאות |
---|
- מבנה תכונה :
FeaturesDict({
'abstract': string,
'authors': string,
'body_text': Sequence({
'section': string,
'text': string,
}),
'doi': string,
'journal': string,
'license': string,
'publish_time': string,
'sha': string,
'source_x': string,
'title': string,
'url': string,
})
- תיעוד תכונה :
תכונה | מעמד | צוּרָה | Dtype | תיאור |
---|---|---|---|---|
FeaturesDict | ||||
תַקצִיר | מוֹתֵחַ | חוּט | ||
מחברים | מוֹתֵחַ | חוּט | ||
body_text | סדר פעולות | |||
body_text/קטע | מוֹתֵחַ | חוּט | ||
body_text/טקסט | מוֹתֵחַ | חוּט | ||
דוי | מוֹתֵחַ | חוּט | ||
כתב עת | מוֹתֵחַ | חוּט | ||
רישיון | מוֹתֵחַ | חוּט | ||
זמן_פרסום | מוֹתֵחַ | חוּט | ||
שא | מוֹתֵחַ | חוּט | ||
source_x | מוֹתֵחַ | חוּט | ||
כותרת | מוֹתֵחַ | חוּט | ||
כתובת אתר | מוֹתֵחַ | חוּט |
מפתחות בפיקוח (ראה כמסמך בפיקוח): ('
as_supervised
('body_text', 'abstract')
איור ( tfds.show_examples ): לא נתמך.
דוגמאות ( tfds.as_dataframe ): חסר.
ציטוט :
@ONLINE {CORD-19-research-challenge,
author = "An AI challenge with AI2, CZI, MSR, Georgetown, NIH & The White House",
title = "COVID-19 Open Research Dataset Challenge (CORD-19)",
month = "april",
year = "2020",
url = "https://www.kaggle.com/allen-institute-for-ai/CORD-19-research-challenge"
}