タイタニック

  • 説明

タイタニック号の個々の乗客の生存状況を説明するデータセット。元のデータセットに欠落している値は、?を使用して表されます。 Floatおよびintの欠落値は-1に置き換えられ、文字列の欠落値は「不明」に置き換えられます。

  • ホームページhttps://www.openml.org/d/40945

  • ソースコードtfds.structured.Titanic

  • バージョン

    • 2.0.0 :新しいスプリットAPI( https://tensorflow.org/datasets/splits
    • 3.0.0 :データセットの機能の標準フラット辞書を使用してください。使用はas_supervised=Trueにデータセットを分割する(features_dict, survived)タプルを。

    • 4.0.0 (デフォルト) :3.0.0で反転し、反転したラベルを修正。

  • ダウンロードサイズ114.98 KiB

  • データセットのサイズ382.58 KiB

  • オートキャッシュされたドキュメント):はい

  • スプリット

スプリット
'train' 1,309
  • 特長
FeaturesDict({
    'age': tf.float32,
    'boat': tf.string,
    'body': tf.int32,
    'cabin': tf.string,
    'embarked': ClassLabel(shape=(), dtype=tf.int64, num_classes=4),
    'fare': tf.float32,
    'home.dest': tf.string,
    'name': tf.string,
    'parch': tf.int32,
    'pclass': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
    'sex': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
    'sibsp': tf.int32,
    'survived': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
    'ticket': tf.string,
})
  • 教師付きキー(参照はas_supervisedドキュメントを): ({'body': 'body', 'ticket': 'ticket', 'embarked': 'embarked', 'sibsp': 'sibsp', 'home.dest': 'home.dest', 'pclass': 'pclass', 'parch': 'parch', 'age': 'age', 'boat': 'boat', 'cabin': 'cabin', 'name': 'name', 'fare': 'fare', 'sex': 'sex'}, 'survived')

  • tfds.show_examples ):サポートされていません。

  • tfds.as_dataframe ):

  • 引用
@ONLINE {titanic,
author = "Frank E. Harrell Jr., Thomas Cason",
title  = "Titanic dataset",
month  = "oct",
year   = "2017",
url    = "https://www.openml.org/d/40945"
}