एमएल समुदाय दिवस 9 नवंबर है! TensorFlow, JAX से नई जानकारी के लिए हमसे जुड़ें, और अधिक जानें

covid19sum

  • विवरण:

CORD-19 45,000 से अधिक विद्वानों के लेखों का एक संसाधन है, जिसमें 33,000 से अधिक पूर्ण पाठ, COVID-19, SARS-CoV-2 और संबंधित कोरोनवीरस के बारे में शामिल हैं।

सार संक्षेप के माध्यम से COVID-19 के वैज्ञानिक साहित्य में जानकारी को व्यवस्थित करने में मदद करना। यह डेटासेट उन लेखों को दस्तावेज़ के जोड़े और full_text-abstract या परिचय-सार के सारांश में पार्स करता है।

सुविधाओं में शामिल हैं: सार, फुल_टेक्स्ट, शा (पीडीएफ का हैश), स्रोत_एक्स (प्रकाशन का स्रोत), शीर्षक, डोई (डिजिटल ऑब्जेक्ट आइडेंटिफायर), लाइसेंस, लेखक, पब्लिश_टाइम, जर्नल, यूआरएल।

  • होमपेज: https://www.kaggle.com/allen-institute-for-ai/CORD-19-research-challenge

  • स्रोत कोड: tfds.summarization.Covid19sum

  • संस्करण:

    • 1.0.0 (डिफ़ॉल्ट): नहीं रिलीज नोट्स।
  • डाउनलोड का आकार: Unknown size

  • डेटासेट का आकार: Unknown size

  • मैनुअल डाउनलोड के निर्देश: यह डेटासेट आप में मैन्युअल रूप से स्रोत डेटा डाउनलोड करने के लिए की आवश्यकता है download_config.manual_dir (करने के लिए डिफ़ॉल्ट ~/tensorflow_datasets/downloads/manual/ ):
    यह डेटासेट जरूरत मैन्युअल के माध्यम से डाउनलोड किया जा करने के लिए kaggle API: kaggle datasets download allen-institute-for-ai/CORD-19-research-challenge प्लेस पुस्तिका फ़ोल्डर में ज़िप फ़ाइल डाउनलोड।

  • ऑटो-कैश ( प्रलेखन ): अज्ञात

  • विभाजन:

विभाजित करें उदाहरण
  • विशेषताएं:
FeaturesDict({
    'abstract': tf.string,
    'authors': tf.string,
    'body_text': Sequence({
        'section': tf.string,
        'text': tf.string,
    }),
    'doi': tf.string,
    'journal': tf.string,
    'license': tf.string,
    'publish_time': tf.string,
    'sha': tf.string,
    'source_x': tf.string,
    'title': tf.string,
    'url': tf.string,
})
  • पर्यवेक्षित कुंजियों (देखें as_supervised डॉक ): ('body_text', 'abstract')

  • चित्रा ( tfds.show_examples ): समर्थित नहीं।

  • उदाहरण ( tfds.as_dataframe ): लापता।

  • प्रशस्ति पत्र:

@ONLINE {CORD-19-research-challenge,
    author = "An AI challenge with AI2, CZI, MSR, Georgetown, NIH & The White House",
    title  = "COVID-19 Open Research Dataset Challenge (CORD-19)",
    month  = "april",
    year   = "2020",
    url    = "https://www.kaggle.com/allen-institute-for-ai/CORD-19-research-challenge"
}