soma covid19

  • Descrição :

CORD-19 é um recurso de mais de 45.000 artigos acadêmicos, incluindo mais de 33.000 com texto completo, sobre COVID-19, SARS-CoV-2 e coronavírus relacionados.

Ajudar a organizar informações em literaturas científicas do COVID-19 por meio de resumos abstratos. Este conjunto de dados analisa esses artigos em pares de documentos e resumos de texto completo-abstrato ou resumo-introdução.

Os recursos incluem strings de: abstract, full_text, sha (hash de pdf), source_x (fonte de publicação), título, doi (identificador de objeto digital), licença, autores, publish_time, revista, url.

  • Documentação Adicional : Explore em Papers With Code

  • Página inicial : https://www.kaggle.com/allen-institute-for-ai/CORD-19-research-challenge

  • Código -fonte: tfds.summarization.Covid19sum

  • Versões :

    • 1.0.0 (padrão): sem notas de versão.
  • Tamanho do download : Unknown size

  • Tamanho do conjunto de dados : Unknown size

  • Instruções de download manual : este conjunto de dados exige que você baixe os dados de origem manualmente em download_config.manual_dir (o padrão é ~/tensorflow_datasets/downloads/manual/ ):
    Este conjunto de dados precisa ser baixado manualmente por meio da kaggle api: kaggle datasets download allen-institute-for-ai/CORD-19-research-challenge Coloque o arquivo zip baixado na pasta manual.

  • Armazenado em cache automaticamente ( documentação ): Desconhecido

  • Divisões :

Dividir Exemplos
  • Estrutura de recursos :
FeaturesDict({
    'abstract': string,
    'authors': string,
    'body_text': Sequence({
        'section': string,
        'text': string,
    }),
    'doi': string,
    'journal': string,
    'license': string,
    'publish_time': string,
    'sha': string,
    'source_x': string,
    'title': string,
    'url': string,
})
  • Documentação do recurso:
Característica Classe Forma Tipo D Descrição
RecursosDict
abstrato tensor corda
autores tensor corda
Texto de corpo Seqüência
corpo_texto/seção tensor corda
corpo_texto/texto tensor corda
doi tensor corda
Diário tensor corda
licença tensor corda
publish_time tensor corda
sha tensor corda
source_x tensor corda
título tensor corda
url tensor corda
@ONLINE {CORD-19-research-challenge,
    author = "An AI challenge with AI2, CZI, MSR, Georgetown, NIH & The White House",
    title  = "COVID-19 Open Research Dataset Challenge (CORD-19)",
    month  = "april",
    year   = "2020",
    url    = "https://www.kaggle.com/allen-institute-for-ai/CORD-19-research-challenge"
}