covid19sum

  • תיאור:

CORD-19 הוא משאב של למעלה מ- 45,000 מאמרים מלומדים, כולל למעלה מ- 33,000 עם טקסט מלא, אודות COVID-19, SARS-CoV-2 וקורונווירוסים קשורים.

כדי לסייע בארגון מידע בספרות מדעיות של COVID-19 באמצעות סיכום מופשט. מערך נתונים זה מנתח את המאמרים האלה לזוגות מסמכים וסיכומים של טקסט מלא-מופשט או מבוא-מופשט.

התכונות כוללות מחרוזות של: מופשט, טקסט מלא, sha (hash של pdf), source_x (מקור פרסום), כותרת, doi (מזהה אובייקט דיגיטלי), רישיון, מחברים, publish_time, יומן, url.

  • דף הבית: https://www.kaggle.com/allen-institute-for-ai/CORD-19-research-challenge

  • קוד מקור: tfds.summarization.Covid19sum

  • גרסאות:

    • 1.0.0 (ברירת המחדל): הערות השחרור לא.
  • גודל ההורדה: Unknown size

  • גודל בסיס הנתונים: Unknown size

  • הוראות הורדה ידנית: מערך נתונים זה מחייב אותך להוריד את נתוני המקור באופן ידני לתוך download_config.manual_dir (ברירת המחדל היא ~/tensorflow_datasets/downloads/manual/ ):
    הצורך במערך זה כדי להוריד באופן ידני באמצעות kaggle API: kaggle datasets download allen-institute-for-ai/CORD-19-research-challenge מקום שהורדו קובץ zip בתיקיה ידנית.

  • Auto-במטמון ( תיעוד ): לא ידוע

  • פיצולים:

לְפַצֵל דוגמאות
  • מאפיינים:
FeaturesDict({
    'abstract': tf.string,
    'authors': tf.string,
    'body_text': Sequence({
        'section': tf.string,
        'text': tf.string,
    }),
    'doi': tf.string,
    'journal': tf.string,
    'license': tf.string,
    'publish_time': tf.string,
    'sha': tf.string,
    'source_x': tf.string,
    'title': tf.string,
    'url': tf.string,
})
@ONLINE {CORD-19-research-challenge,
    author = "An AI challenge with AI2, CZI, MSR, Georgetown, NIH & The White House",
    title  = "COVID-19 Open Research Dataset Challenge (CORD-19)",
    month  = "april",
    year   = "2020",
    url    = "https://www.kaggle.com/allen-institute-for-ai/CORD-19-research-challenge"
}