एमएल समुदाय दिवस 9 नवंबर है! TensorFlow, JAX से नई जानकारी के लिए हमसे जुड़ें, और अधिक जानें

पेंगुइन

  • विवरण:

पामर द्वीपसमूह, अंटार्कटिका में देखी गई तीन पेंगुइन प्रजातियों के लिए मापन।

साथ डॉ क्रिस्टन गोर्मन द्वारा 2009 - ये आंकड़े 2007 से एकत्र किए गए थे पामर स्टेशन लॉन्ग टर्म पारिस्थितिक अनुसंधान कार्यक्रम का हिस्सा अमेरिका लॉन्ग टर्म पारिस्थितिक अनुसंधान नेटवर्क । डेटा को मूल रूप से आयात किया गया पर्यावरण डाटा पहल (EDI) डाटा पोर्टल, और पामर स्टेशन डाटा नीति के अनुसार CC0 लाइसेंस ( "कोई अधिकार सुरक्षित") द्वारा उपयोग के लिए उपलब्ध हैं। यह प्रतिलिपि से आयात किया गया था एलीसन होर्स्ट के GitHub भंडार

@Manual{,
  title = {palmerpenguins: Palmer Archipelago (Antarctica) penguin data},
  author = {Allison Marie Horst and Alison Presmanes Hill and Kristen B Gorman},
  year = {2020},
  note = {R package version 0.1.0},
  doi = {10.5281/zenodo.3960218},
  url = {https://allisonhorst.github.io/palmerpenguins/},
}

पेंगुइन/संसाधित (डिफ़ॉल्ट कॉन्फ़िगरेशन)

  • कॉन्फ़िग विवरण: penguins/processed एक बूंद-इन के लिए प्रतिस्थापन है iris डाटासेट। इसमें 4 सामान्यीकृत संख्यात्मक विशेषताएं हैं जो एकल टेंसर के रूप में प्रस्तुत की जाती हैं, कोई लापता मान नहीं है और वर्ग लेबल (प्रजाति) को पूर्णांक (एन = 334) के रूप में प्रस्तुत किया जाता है।

  • डाउनलोड का आकार: 25.05 KiB

  • डेटासेट का आकार: 17.61 KiB

  • विभाजन:

विभाजित करना उदाहरण
'train' 334
  • विशेषताएं:
FeaturesDict({
    'features': Tensor(shape=(4,), dtype=tf.float32),
    'species': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
})

पेंगुइन/सरल

  • कॉन्फ़िग विवरण: penguins/simple कच्चे डाटासेट से संसाधित किया गया है, पाठ फ़ील्ड से आता सरलीकृत वर्ग लेबल के साथ, NaN / एनए के रूप में चिह्नित मान अनुपलब्ध और केवल 7 महत्वपूर्ण सुविधाओं (n = 344) बरकरार रखती है।

  • डाउनलोड का आकार: 13.20 KiB

  • डेटासेट का आकार: 56.10 KiB

  • विभाजन:

विभाजित करना उदाहरण
'train' 344
  • विशेषताएं:
FeaturesDict({
    'body_mass_g': tf.float32,
    'culmen_depth_mm': tf.float32,
    'culmen_length_mm': tf.float32,
    'flipper_length_mm': tf.float32,
    'island': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
    'sex': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
    'species': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
})
  • पर्यवेक्षित कुंजियों (देखें as_supervised डॉक ): ({'species': 'species', 'body_mass_g': 'body_mass_g', 'island': 'island', 'sex': 'sex', 'flipper_length_mm': 'flipper_length_mm', 'culmen_depth_mm': 'culmen_depth_mm', 'culmen_length_mm': 'culmen_length_mm'}, 'species')

  • उदाहरण ( tfds.as_dataframe ):

पेंगुइन/कच्चा

  • कॉन्फ़िग विवरण: penguins/raw मूल, @allisonhorst से असंसाधित प्रतिलिपि, सभी 17 सुविधाओं से युक्त, आंकिक प्रकार के रूप में या कच्चे पाठ (n = 344) के रूप में या तो प्रस्तुत है।

  • डाउनलोड का आकार: 49.72 KiB

  • डेटासेट का आकार: 164.51 KiB

  • विभाजन:

विभाजित करना उदाहरण
'train' 344
  • विशेषताएं:
FeaturesDict({
    'Body Mass (g)': tf.float32,
    'Clutch Completion': Text(shape=(), dtype=tf.string),
    'Comments': Text(shape=(), dtype=tf.string),
    'Culmen Depth (mm)': tf.float32,
    'Culmen Length (mm)': tf.float32,
    'Date Egg': Text(shape=(), dtype=tf.string),
    'Delta 13 C (o/oo)': tf.float32,
    'Delta 15 N (o/oo)': tf.float32,
    'Flipper Length (mm)': tf.float32,
    'Individual ID': Text(shape=(), dtype=tf.string),
    'Island': Text(shape=(), dtype=tf.string),
    'Region': Text(shape=(), dtype=tf.string),
    'Sample Number': tf.int32,
    'Sex': Text(shape=(), dtype=tf.string),
    'Species': Text(shape=(), dtype=tf.string),
    'Stage': Text(shape=(), dtype=tf.string),
    'studyName': Text(shape=(), dtype=tf.string),
})