كوفيد 19 سوم

  • الوصف :

CORD-19 هو مورد لأكثر من 45000 مقالة علمية ، بما في ذلك أكثر من 33000 مقالة بنص كامل ، حول COVID-19 و SARS-CoV-2 وفيروسات كورونا ذات الصلة.

للمساعدة في تنظيم المعلومات في الآداب العلمية لـ COVID-19 من خلال التلخيص التجريدي. تقوم مجموعة البيانات هذه بتحليل تلك المقالات إلى أزواج من المستندات وملخصات من full_text-abstract أو مقدمة-abstract.

تتضمن الميزات سلاسل: abstract ، full_text ، sha (تجزئة pdf) ، source_x (مصدر النشر) ، العنوان ، doi (معرف الكائن الرقمي) ، الترخيص ، المؤلفون ، وقت النشر ، المجلة ، url.

  • وثائق إضافية : استكشف في الأوراق باستخدام الرمز

  • الصفحة الرئيسية : https://www.kaggle.com/allen-institute-for-ai/CORD-19-research-challenge

  • كود المصدر : tfds.summarization.Covid19sum

  • إصدارات :

    • 1.0.0 (افتراضي): لا توجد ملاحظات حول الإصدار.
  • حجم التنزيل : Unknown size

  • حجم مجموعة البيانات : Unknown size

  • إرشادات التنزيل اليدوي : تتطلب مجموعة البيانات هذه تنزيل بيانات المصدر يدويًا إلى download_config.manual_dir (الإعدادات الافتراضية على ~/tensorflow_datasets/downloads/manual/ ):
    يجب تنزيل مجموعة البيانات هذه يدويًا من خلال kaggle api: kaggle datasets download allen-institute-for-ai/CORD-19-research-challenge ضع الملف المضغوط الذي تم تنزيله في المجلد اليدوي.

  • التخزين المؤقت التلقائي ( الوثائق ): غير معروف

  • الانقسامات :

انشق، مزق أمثلة
  • هيكل الميزة :
FeaturesDict({
    'abstract': string,
    'authors': string,
    'body_text': Sequence({
        'section': string,
        'text': string,
    }),
    'doi': string,
    'journal': string,
    'license': string,
    'publish_time': string,
    'sha': string,
    'source_x': string,
    'title': string,
    'url': string,
})
  • وثائق الميزة :
ميزة فصل شكل نوع وصف
الميزات
نبذة مختصرة موتر سلسلة
المؤلفون موتر سلسلة
body_text تسلسل
body_text / قسم موتر سلسلة
body_text / text موتر سلسلة
دوى موتر سلسلة
مجلة موتر سلسلة
رخصة موتر سلسلة
وقت النشر موتر سلسلة
شا موتر سلسلة
المصدر_x موتر سلسلة
لقب موتر سلسلة
عنوان url موتر سلسلة
@ONLINE {CORD-19-research-challenge,
    author = "An AI challenge with AI2, CZI, MSR, Georgetown, NIH & The White House",
    title  = "COVID-19 Open Research Dataset Challenge (CORD-19)",
    month  = "april",
    year   = "2020",
    url    = "https://www.kaggle.com/allen-institute-for-ai/CORD-19-research-challenge"
}