Эта страница была переведа с помощью Cloud Translation API.
Switch to English

covid19sum

  • Описание :

CORD-19 - это ресурс, содержащий более 45 000 научных статей, в том числе более 33 000 с полными текстами, о COVID-19, SARS-CoV-2 и связанных с ними коронавирусах.

Чтобы помочь систематизировать информацию в научной литературе о COVID-19 посредством абстрактного обобщения. Этот набор данных анализирует эти статьи на пары документа и резюме full_text-abstract или Introduction-abstract.

Функции включают в себя строки: аннотация, полный_текст, sha (хэш PDF), source_x (источник публикации), заголовок, doi (идентификатор цифрового объекта), лицензия, авторы, время публикации, журнал, URL.

  • Домашняя страница : https://www.kaggle.com/allen-institute-for-ai/CORD-19-research-challenge

  • Исходный код : tfds.summarization.Covid19sum

  • Версии :

    • 1.0.0 (по умолчанию): без примечаний к выпуску.
  • Размер загрузки : Unknown size

  • Размер набора данных : Unknown size

  • Инструкции по загрузке вручную : для этого набора данных необходимо вручную загрузить исходные данные в download_config.manual_dir (по умолчанию ~/tensorflow_datasets/downloads/manual/ ):
    Этот набор данных необходимо загрузить вручную через kaggle api: kaggle datasets download allen-institute-for-ai/CORD-19-research-challenge Поместите загруженный zip-файл в папку с руководством.

  • Автоматическое кэширование ( документация ): неизвестно

  • Сплит :

Трещина Примеры
  • Особенности :
FeaturesDict({
    'abstract': tf.string,
    'authors': tf.string,
    'body_text': Sequence({
        'section': tf.string,
        'text': tf.string,
    }),
    'doi': tf.string,
    'journal': tf.string,
    'license': tf.string,
    'publish_time': tf.string,
    'sha': tf.string,
    'source_x': tf.string,
    'title': tf.string,
    'url': tf.string,
})
  • Контролируемые ключи (см. as_supervised doc ): ('body_text', 'abstract')

  • Цитата :

@ONLINE {CORD-19-research-challenge,
    author = "An AI challenge with AI2, CZI, MSR, Georgetown, NIH & The White House",
    title  = "COVID-19 Open Research Dataset Challenge (CORD-19)",
    month  = "april",
    year   = "2020",
    url    = "https://www.kaggle.com/allen-institute-for-ai/CORD-19-research-challenge"
}