タイタニック

  • 説明:

タイタニック号の個々の乗客の生存状況を説明するデータセット。元のデータセットの欠損値は、? を使用して表されます。 float と int の欠損値は -1 に置き換えられ、文字列の欠損値は「不明」に置き換えられます。

  • ホームページ: https://www.openml.org/d/40945

  • ソース コード: tfds.datasets.titanic.Builder

  • バージョン:

    • 2.0.0 : 新しい分割 API ( https://tensorflow.org/datasets/splits )
    • 3.0.0 : データセットのフィーチャの標準フラット ディクショナリを使用します。 as_supervised=Trueを使用して、データセットを(features_dict, survived)タプルに分割します。
    • 4.0.0 (デフォルト): 3.0.0 で反転されていた反転ラベルを修正します。
  • ダウンロードサイズ: 114.98 KiB

  • データセットサイズ: 382.58 KiB

  • 自動キャッシュ(ドキュメント): はい

  • スプリット:

スプリット
'train' 1,309
  • 機能構造:
FeaturesDict({
    'age': float32,
    'boat': string,
    'body': int32,
    'cabin': string,
    'embarked': ClassLabel(shape=(), dtype=int64, num_classes=4),
    'fare': float32,
    'home.dest': string,
    'name': string,
    'parch': int32,
    'pclass': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'sex': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'sibsp': int32,
    'survived': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'ticket': string,
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
テンソルfloat32
ボートテンソル
テンソルint32
キャビンテンソル
乗り出したクラスラベルint64
運賃テンソルfloat32
ホーム.宛先テンソル
名前テンソル
乾いたテンソルint32
pclassクラスラベルint64
セックスクラスラベルint64
シブスプテンソルint32
生き残ったクラスラベルint64
チケットテンソル
  • 監視キー( as_supervised docを参照): ({'age': 'age', 'boat': 'boat', 'body': 'body', 'cabin': 'cabin', 'embarked': 'embarked', 'fare': 'fare', 'home.dest': 'home.dest', 'name': 'name', 'parch': 'parch', 'pclass': 'pclass', 'sex': 'sex', 'sibsp': 'sibsp', 'ticket': 'ticket'}, 'survived')

  • ( tfds.show_examples ): サポートされていません。

  • ( tfds.as_dataframe ):

  • 引用
@ONLINE {titanic,
author = "Frank E. Harrell Jr., Thomas Cason",
title  = "Titanic dataset",
month  = "oct",
year   = "2017",
url    = "https://www.openml.org/d/40945"
}
,

  • 説明:

タイタニック号の個々の乗客の生存状況を説明するデータセット。元のデータセットの欠損値は、? を使用して表されます。 float と int の欠損値は -1 に置き換えられ、文字列の欠損値は「不明」に置き換えられます。

  • ホームページ: https://www.openml.org/d/40945

  • ソース コード: tfds.datasets.titanic.Builder

  • バージョン:

    • 2.0.0 : 新しい分割 API ( https://tensorflow.org/datasets/splits )
    • 3.0.0 : データセットのフィーチャの標準フラット ディクショナリを使用します。 as_supervised=Trueを使用して、データセットを(features_dict, survived)タプルに分割します。
    • 4.0.0 (デフォルト): 3.0.0 で反転されていた反転ラベルを修正します。
  • ダウンロードサイズ: 114.98 KiB

  • データセットサイズ: 382.58 KiB

  • 自動キャッシュ(ドキュメント): はい

  • スプリット:

スプリット
'train' 1,309
  • 機能構造:
FeaturesDict({
    'age': float32,
    'boat': string,
    'body': int32,
    'cabin': string,
    'embarked': ClassLabel(shape=(), dtype=int64, num_classes=4),
    'fare': float32,
    'home.dest': string,
    'name': string,
    'parch': int32,
    'pclass': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'sex': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'sibsp': int32,
    'survived': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'ticket': string,
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
テンソルfloat32
ボートテンソル
テンソルint32
キャビンテンソル
乗り出したクラスラベルint64
運賃テンソルfloat32
ホーム.宛先テンソル
名前テンソル
乾いたテンソルint32
pclassクラスラベルint64
セックスクラスラベルint64
シブスプテンソルint32
生き残ったクラスラベルint64
チケットテンソル
  • 監視キー( as_supervised docを参照): ({'age': 'age', 'boat': 'boat', 'body': 'body', 'cabin': 'cabin', 'embarked': 'embarked', 'fare': 'fare', 'home.dest': 'home.dest', 'name': 'name', 'parch': 'parch', 'pclass': 'pclass', 'sex': 'sex', 'sibsp': 'sibsp', 'ticket': 'ticket'}, 'survived')

  • ( tfds.show_examples ): サポートされていません。

  • ( tfds.as_dataframe ):

  • 引用
@ONLINE {titanic,
author = "Frank E. Harrell Jr., Thomas Cason",
title  = "Titanic dataset",
month  = "oct",
year   = "2017",
url    = "https://www.openml.org/d/40945"
}