covid19somme

  • Description:

CORD-19 est une ressource de plus de 45 000 articles scientifiques, dont plus de 33 000 avec texte intégral, sur le COVID-19, le SRAS-CoV-2 et les coronavirus associés.

Pour aider à organiser l'information dans les littératures scientifiques de COVID-19 par le biais d'un résumé abstrait. Cet ensemble de données analyse ces articles en paires de documents et de résumés de full_text-abstract ou introduction-abstract.

Les fonctionnalités incluent des chaînes de : abstract, full_text, sha (hachage du pdf), source_x (source de publication), titre, doi (identifiant d'objet numérique), licence, auteurs, publish_time, journal, url

  • Page d' accueil: https://www.kaggle.com/allen-institute-for-ai/CORD-19-research-challenge

  • Code source: tfds.summarization.Covid19sum

  • versions:

    • 1.0.0 (par défaut): Aucune note de version.
  • Taille du téléchargement: Unknown size

  • Taille Dataset: Unknown size

  • Instructions de téléchargement Manuel: Cet ensemble de données , vous devez télécharger les données source manuellement dans download_config.manual_dir (par défaut ~/tensorflow_datasets/downloads/manual/ ):
    Ce besoin de jeu de données à télécharger manuellement via Kaggle api: kaggle datasets download allen-institute-for-ai/CORD-19-research-challenge de kaggle datasets download allen-institute-for-ai/CORD-19-research-challenge Placez le fichier téléchargé zip dans le dossier manuel.

  • Mis en cache automatique ( documentation ): Inconnu

  • scissions:

Diviser Exemples
  • Caractéristiques:
FeaturesDict({
    'abstract': tf.string,
    'authors': tf.string,
    'body_text': Sequence({
        'section': tf.string,
        'text': tf.string,
    }),
    'doi': tf.string,
    'journal': tf.string,
    'license': tf.string,
    'publish_time': tf.string,
    'sha': tf.string,
    'source_x': tf.string,
    'title': tf.string,
    'url': tf.string,
})
@ONLINE {CORD-19-research-challenge,
    author = "An AI challenge with AI2, CZI, MSR, Georgetown, NIH & The White House",
    title  = "COVID-19 Open Research Dataset Challenge (CORD-19)",
    month  = "april",
    year   = "2020",
    url    = "https://www.kaggle.com/allen-institute-for-ai/CORD-19-research-challenge"
}