09:00 पीएसटी पर एमएल संगोष्ठी इस मंगलवार, 19 अक्टूबर में पहले महिलाओं में ट्यून रजिस्टर अब

टाइटैनिक

  • विवरण:

टाइटैनिक पर अलग-अलग यात्रियों के जीवित रहने की स्थिति का वर्णन करने वाला डेटासेट। मूल डेटासेट में गुम मान ? का उपयोग करके दर्शाए जाते हैं। फ़्लोट और इंट गुम मानों को -1 से बदल दिया जाता है, स्ट्रिंग गुम मानों को 'अज्ञात' से बदल दिया जाता है।

  • होमपेज: https://www.openml.org/d/40945

  • स्रोत कोड: tfds.structured.Titanic

  • संस्करण:

    • 2.0.0 : नई विभाजन एपीआई ( https://tensorflow.org/datasets/splits )
    • 3.0.0 : डेटासेट के लिए सुविधाओं की एक मानक फ्लैट शब्दकोश का प्रयोग करें। उपयोग as_supervised=True एक में डाटासेट विभाजित करने के लिए (features_dict, survived) टपल।

    • 4.0.0 (डिफ़ॉल्ट) : उल्टे लेबल जो 3.0.0 में उल्टे थे ठीक करें।

  • डाउनलोड का आकार: 114.98 KiB

  • डेटासेट का आकार: 382.58 KiB

  • ऑटो-कैश ( प्रलेखन ): हाँ

  • विभाजन:

विभाजित करना उदाहरण
'train' 1,309
  • विशेषताएं:
FeaturesDict({
    'age': tf.float32,
    'boat': tf.string,
    'body': tf.int32,
    'cabin': tf.string,
    'embarked': ClassLabel(shape=(), dtype=tf.int64, num_classes=4),
    'fare': tf.float32,
    'home.dest': tf.string,
    'name': tf.string,
    'parch': tf.int32,
    'pclass': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
    'sex': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
    'sibsp': tf.int32,
    'survived': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
    'ticket': tf.string,
})
  • पर्यवेक्षित कुंजियों (देखें as_supervised डॉक ): ({'name': 'name', 'sex': 'sex', 'home.dest': 'home.dest', 'fare': 'fare', 'pclass': 'pclass', 'age': 'age', 'body': 'body', 'embarked': 'embarked', 'sibsp': 'sibsp', 'ticket': 'ticket', 'boat': 'boat', 'cabin': 'cabin', 'parch': 'parch'}, 'survived')

  • चित्रा ( tfds.show_examples ): समर्थित नहीं।

  • उदाहरण ( tfds.as_dataframe ):

  • प्रशस्ति पत्र:
@ONLINE {titanic,
author = "Frank E. Harrell Jr., Thomas Cason",
title  = "Titanic dataset",
month  = "oct",
year   = "2017",
url    = "https://www.openml.org/d/40945"
}