¡El Día de la Comunidad de ML es el 9 de noviembre! Únase a nosotros para recibir actualizaciones de TensorFlow, JAX, y más Más información

covid19sum

  • Descripción:

CORD-19 es un recurso de más de 45,000 artículos académicos, incluidos más de 33,000 con texto completo, sobre COVID-19, SARS-CoV-2 y coronavirus relacionados.

Ayudar a organizar la información en la literatura científica de COVID-19 a través del resumen abstractivo. Este conjunto de datos analiza esos artículos en pares de documentos y resúmenes de full_text-abstract o Introduction-Abstract.

Las características incluyen cadenas de: resumen, texto_completo, sha (hash de pdf), fuente_x (fuente de publicación), título, doi (identificador de objeto digital), licencia, autores, tiempo de publicación, revista, url.

  • Inicio: https://www.kaggle.com/allen-institute-for-ai/CORD-19-research-challenge

  • El código fuente: tfds.summarization.Covid19sum

  • versiones:

    • 1.0.0 (por defecto): No hay notas de la versión.
  • Tamaño del paquete: Unknown size

  • Tamaño de conjunto de datos: Unknown size

  • Las instrucciones de descarga manual: Este conjunto de datos se requiere para descargar los datos de origen manualmente en download_config.manual_dir (por defecto ~/tensorflow_datasets/downloads/manual/ ):
    Esta necesidad conjunto de datos para ser descargado manualmente a través de Kaggle api: kaggle datasets download allen-institute-for-ai/CORD-19-research-challenge Coloque la postal descargado el archivo en la carpeta manual.

  • Auto-caché ( documentación ): Desconocido

  • Fraccionamientos:

Separar Ejemplos de
  • características:
FeaturesDict({
    'abstract': tf.string,
    'authors': tf.string,
    'body_text': Sequence({
        'section': tf.string,
        'text': tf.string,
    }),
    'doi': tf.string,
    'journal': tf.string,
    'license': tf.string,
    'publish_time': tf.string,
    'sha': tf.string,
    'source_x': tf.string,
    'title': tf.string,
    'url': tf.string,
})
@ONLINE {CORD-19-research-challenge,
    author = "An AI challenge with AI2, CZI, MSR, Georgetown, NIH & The White House",
    title  = "COVID-19 Open Research Dataset Challenge (CORD-19)",
    month  = "april",
    year   = "2020",
    url    = "https://www.kaggle.com/allen-institute-for-ai/CORD-19-research-challenge"
}