シンプル

l10n-placeholder1 処理 == 1, 2, 1) テスト\\(treat <- ifelse(test\\)処理 == 1, 2, 1) トレーニング\\(y <- ifelse(train\\)y == 1, 2, 1) テスト\\(y <- ifelse(test\\)y == 1, 2, 1) train\\(ts = NULL test\\)ts = NULL ``` パラメーター: - `n` = サンプル数 - `p` = 予測変数の数 - `ro` = 予測変数間の共分散 - `sigma` = 誤差の乗数term - `beta.den` = beta は 1/beta.den で乗算されます 作成者: Leo Guelman leo.guelman@gmail.com このデータセットを使用するには: ```python import tensorflow_datasets as tfds ds = tfds.load('simpte' , split='train') for ex in ds.take(4): print(ex) ``` [tensorflow_datasets の詳細については、[ガイド](https://www.tensorflow.org/datasets/overview) を参照してください。 ](https://www.tensorflow.org/datasets)。 " />
  • 説明:

フルネーム: 個別治療効果のシミュレーション

R の Uplift パッケージで生成: https://rdrr.io/cran/uplift/man/sim_pte.html

パッケージはここからダウンロードできます: https://cran.r-project.org/src/contrib/Archive/uplift/

次のコードを使用して R バージョン 4.1.2 で生成されたデータセット:

  library(uplift)

  set.seed(123)

  train <- sim_pte(n = 1000, p = 20, rho = 0, sigma = sqrt(2), beta.den = 4)
  test <- sim_pte(n = 2000, p = 20, rho = 0, sigma = sqrt(2), beta.den = 4)

  train$treat <- ifelse(train$treat == 1, 2, 1)
  test$treat <- ifelse(test$treat == 1, 2, 1)

  train$y <- ifelse(train$y == 1, 2, 1)
  test$y <- ifelse(test$y == 1, 2, 1)

  train$ts = NULL
  test$ts = NULL

パラメーター:

  • n = サンプル数
  • p = 予測変数の数
  • ro = 予測変数間の共分散
  • sigma = 誤差項の乗数
  • beta.den = ベータに 1/beta.den を掛ける

作成者: レオ・ゲルマン leo.guelman@gmail.com

  • ホームページ: https://rdrr.io/cran/uplift/man/sim_pte.html

  • ソース コード: tfds.datasets.simpte.Builder

  • バージョン:

    • 1.0.0 (デフォルト): 初期リリース。
  • ダウンロードサイズ: サイズUnknown size

  • データセットサイズ: 1.04 MiB

  • 手動ダウンロードの手順: このデータセットでは、ソース データを手動でdownload_config.manual_dir (デフォルトは~/tensorflow_datasets/downloads/manual/ ) にダウンロードする必要があります。
    トレーニング データ: sim_pte_train.csv とテスト データ: sim_pte_test.csv を ~/tensorflow_datasets/downloads/manual/ にダウンロードしてください。

  • 自動キャッシュ(ドキュメント): はい

  • スプリット:

スプリット
'test' 2,000
'train' 1,000
  • 機能構造:
FeaturesDict({
    'X1': float32,
    'X10': float32,
    'X11': float32,
    'X12': float32,
    'X13': float32,
    'X14': float32,
    'X15': float32,
    'X16': float32,
    'X17': float32,
    'X18': float32,
    'X19': float32,
    'X2': float32,
    'X20': float32,
    'X3': float32,
    'X4': float32,
    'X5': float32,
    'X6': float32,
    'X7': float32,
    'X8': float32,
    'X9': float32,
    'treat': int32,
    'y': int32,
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
X1テンソルfloat32
X10テンソルfloat32
X11テンソルfloat32
X12テンソルfloat32
X13テンソルfloat32
X14テンソルfloat32
X15テンソルfloat32
X16テンソルfloat32
X17テンソルfloat32
X18テンソルfloat32
X19テンソルfloat32
X2テンソルfloat32
X20テンソルfloat32
X3テンソルfloat32
X4テンソルfloat32
X5テンソルfloat32
X6テンソルfloat32
X7テンソルfloat32
X8テンソルfloat32
X9テンソルfloat32
扱うテンソルint32
yテンソルint32
  • 監視キー( as_supervised docを参照): ({'X1': 'X1', 'X10': 'X10', 'X11': 'X11', 'X12': 'X12', 'X13': 'X13', 'X14': 'X14', 'X15': 'X15', 'X16': 'X16', 'X17': 'X17', 'X18': 'X18', 'X19': 'X19', 'X2': 'X2', 'X20': 'X20', 'X3': 'X3', 'X4': 'X4', 'X5': 'X5', 'X6': 'X6', 'X7': 'X7', 'X8': 'X8', 'X9': 'X9', 'treat': 'treat'}, 'y')

  • ( tfds.show_examples ): サポートされていません。

  • ( tfds.as_dataframe ):

  • 引用
@misc{https://doi.org/10.48550/arxiv.1212.2995,
  doi = {10.48550/ARXIV.1212.2995},
  url = {https://arxiv.org/abs/1212.2995},
  author = {Tian, Lu and Alizadeh, Ash and Gentles, Andrew and Tibshirani, Robert},
  keywords = {Methodology (stat.ME), FOS: Computer and information sciences, FOS: Computer and information sciences},
  title = {A Simple Method for Detecting Interactions between a Treatment and a Large Number of Covariates},
  publisher = {arXiv},
  year = {2012},
  copyright = {arXiv.org perpetual, non-exclusive license}
}