O Dia da Comunidade de ML é dia 9 de novembro! Junte-nos para atualização de TensorFlow, JAX, e mais Saiba mais

covid19sum

  • Descrição:

CORD-19 é um recurso de mais de 45.000 artigos acadêmicos, incluindo mais de 33.000 com texto completo, sobre COVID-19, SARS-CoV-2 e coronavírus relacionados.

Para ajudar a organizar informações em literaturas científicas de COVID-19 por meio de sumarização abstrativa. Este conjunto de dados analisa esses artigos em pares de documentos e resumos de resumo de texto completo ou resumo de introdução.

Os recursos incluem sequências de: resumo, full_text, sha (hash de pdf), source_x (fonte de publicação), título, doi (identificador de objeto digital), licença, autores, publish_time, jornal, url.

  • Homepage: https://www.kaggle.com/allen-institute-for-ai/CORD-19-research-challenge

  • O código-fonte: tfds.summarization.Covid19sum

  • versões:

    • 1.0.0 (padrão): Não há notas de lançamento.
  • Tamanho do download: Unknown size

  • Tamanho do conjunto de dados: Unknown size

  • Instruções baixar o manual: Este conjunto de dados requer que você baixe os dados de origem manualmente para download_config.manual_dir (o padrão é ~/tensorflow_datasets/downloads/manual/ ):
    Esta necessidade conjunto de dados a ser baixado manualmente através Kaggle api: kaggle datasets download allen-institute-for-ai/CORD-19-research-challenge Coloque o baixado zip arquivo na pasta manual.

  • Cache-Auto ( documentação ): Desconhecido

  • desdobramentos:

Dividir Exemplos
  • Características:
FeaturesDict({
    'abstract': tf.string,
    'authors': tf.string,
    'body_text': Sequence({
        'section': tf.string,
        'text': tf.string,
    }),
    'doi': tf.string,
    'journal': tf.string,
    'license': tf.string,
    'publish_time': tf.string,
    'sha': tf.string,
    'source_x': tf.string,
    'title': tf.string,
    'url': tf.string,
})
@ONLINE {CORD-19-research-challenge,
    author = "An AI challenge with AI2, CZI, MSR, Georgetown, NIH & The White House",
    title  = "COVID-19 Open Research Dataset Challenge (CORD-19)",
    month  = "april",
    year   = "2020",
    url    = "https://www.kaggle.com/allen-institute-for-ai/CORD-19-research-challenge"
}