covid19sum

  • Descrizione :

CORD-19 è una risorsa di oltre 45.000 articoli accademici, di cui oltre 33.000 con testo completo, su COVID-19, SARS-CoV-2 e relativi coronavirus.

Aiutare a organizzare le informazioni nelle letterature scientifiche di COVID-19 attraverso il riepilogo astrattivo. Questo set di dati analizza quegli articoli in coppie di documenti e riepiloghi di testo completo-abstract o introduzione-abstract.

Le funzionalità includono stringhe di: abstract, full_text, sha (hash di pdf), source_x (fonte di pubblicazione), titolo, doi (identificatore di oggetto digitale), licenza, autori, ora di pubblicazione, rivista, url.

  • Documentazione aggiuntiva : Esplora documenti con codice

  • Pagina iniziale : https://www.kaggle.com/allen-institute-for-ai/CORD-19-research-challenge

  • Codice sorgente : tfds.summarization.Covid19sum

  • Versioni :

    • 1.0.0 (impostazione predefinita): nessuna nota di rilascio.
  • Dimensioni del download : Unknown size

  • Dimensioni del set di dati : Unknown size

  • Istruzioni per il download manuale : questo set di dati richiede di scaricare manualmente i dati di origine in download_config.manual_dir (il valore predefinito ~/tensorflow_datasets/downloads/manual/ ):
    Questo set di dati deve essere scaricato manualmente tramite kaggle api: kaggle datasets download allen-institute-for-ai/CORD-19-research-challenge Posiziona il file zip scaricato nella cartella manual.

  • Cache automatica ( documentazione ): Sconosciuto

  • Divisioni :

Diviso Esempi
  • Struttura delle caratteristiche :
FeaturesDict({
    'abstract': string,
    'authors': string,
    'body_text': Sequence({
        'section': string,
        'text': string,
    }),
    'doi': string,
    'journal': string,
    'license': string,
    'publish_time': string,
    'sha': string,
    'source_x': string,
    'title': string,
    'url': string,
})
  • Documentazione delle funzionalità :
Caratteristica Classe Forma Tipo D Descrizione
CaratteristicheDict
astratto Tensore corda
autori Tensore corda
corpo del testo Sequenza
corpo_testo/sezione Tensore corda
corpo_testo/testo Tensore corda
doi Tensore corda
rivista Tensore corda
licenza Tensore corda
pubblicazione_ora Tensore corda
sha Tensore corda
fonte_x Tensore corda
titolo Tensore corda
URL Tensore corda
@ONLINE {CORD-19-research-challenge,
    author = "An AI challenge with AI2, CZI, MSR, Georgetown, NIH & The White House",
    title  = "COVID-19 Open Research Dataset Challenge (CORD-19)",
    month  = "april",
    year   = "2020",
    url    = "https://www.kaggle.com/allen-institute-for-ai/CORD-19-research-challenge"
}