심플

l10n-자리 표시자1 처리 == 1, 2, 1) 테스트\\(treat <- ifelse(test\\)2 처리 == 1, 2, 1) 훈련\\(y <- ifelse(train\\)3 y == 1, 2, 1) 테스트\\(y <- ifelse(test\\)4 y == 1, 2, 1) train\\(ts = NULL test\\)ts = NULL ``` 매개변수: - `n` = 샘플 수 - `p` = 예측 변수 수 - `ro` = 예측 변수 간 공분산 - `sigma` = 오류 배수 용어 - `beta.den` = 베타가 1/beta.den에 의해 축소됨 작성자: Leo Guelman leo.guelman@gmail.com 이 데이터세트를 사용하려면: ```python import tensorflow_datasets as tfds ds = tfds.load('simpte' , split='train') for ex in ds.take(4): print(ex) ``` [tensorflow_datasets에 대한 자세한 내용은 [가이드](https://www.tensorflow.org/datasets/overview)를 참조하세요. ](https://www.tensorflow.org/datasets). " />
  • 설명 :

전체 이름: 개인화된 치료 효과를 위한 시뮬레이션

R의 Uplift 패키지로 생성됨: https://rdrr.io/cran/uplift/man/sim_pte.html

패키지는 여기에서 다운로드할 수 있습니다: https://cran.r-project.org/src/contrib/Archive/uplift/

다음 코드를 사용하여 R 버전 4.1.2에서 생성된 데이터 세트:

  library(uplift)

  set.seed(123)

  train <- sim_pte(n = 1000, p = 20, rho = 0, sigma = sqrt(2), beta.den = 4)
  test <- sim_pte(n = 2000, p = 20, rho = 0, sigma = sqrt(2), beta.den = 4)

  train$treat <- ifelse(train$treat == 1, 2, 1)
  test$treat <- ifelse(test$treat == 1, 2, 1)

  train$y <- ifelse(train$y == 1, 2, 1)
  test$y <- ifelse(test$y == 1, 2, 1)

  train$ts = NULL
  test$ts = NULL

매개변수:

  • n = 샘플 수
  • p = 예측 변수의 수
  • ro = 예측 변수 간의 공분산
  • sigma = 오류 항의 승수
  • beta.den = 베타가 1/beta.den으로 축소됨

작성자: 레오 Guelman leo.guelman@gmail.com

  • 홈페이지 : https://rdrr.io/cran/uplift/man/sim_pte.html

  • 소스 코드 : tfds.datasets.simpte.Builder

  • 버전 :

    • 1.0.0 (기본값): 최초 릴리스.
  • 다운로드 크기 : Unknown size

  • 데이터 세트 크기 : 1.04 MiB

  • 수동 다운로드 지침 : 이 데이터 세트는 원본 데이터를 download_config.manual_dir에 수동으로 download_config.manual_dir 해야 합니다(기본값은 ~/tensorflow_datasets/downloads/manual/ ).
    학습 데이터: sim_pte_train.csv 및 테스트 데이터: sim_pte_test.csv를 ~/tensorflow_datasets/downloads/manual/에 다운로드하십시오.

  • 자동 캐시 ( 문서 ): 예

  • 분할 :

나뉘다
'test' 2,000
'train' 1,000
  • 기능 구조 :
FeaturesDict({
    'X1': float32,
    'X10': float32,
    'X11': float32,
    'X12': float32,
    'X13': float32,
    'X14': float32,
    'X15': float32,
    'X16': float32,
    'X17': float32,
    'X18': float32,
    'X19': float32,
    'X2': float32,
    'X20': float32,
    'X3': float32,
    'X4': float32,
    'X5': float32,
    'X6': float32,
    'X7': float32,
    'X8': float32,
    'X9': float32,
    'treat': int32,
    'y': int32,
})
  • 기능 문서 :
특징 수업 모양 D타입 설명
풍모Dict
X1 텐서 float32
X10 텐서 float32
X11 텐서 float32
X12 텐서 float32
X13 텐서 float32
X14 텐서 float32
X15 텐서 float32
X16 텐서 float32
X17 텐서 float32
X18 텐서 float32
X19 텐서 float32
X2 텐서 float32
X20 텐서 float32
X3 텐서 float32
X4 텐서 float32
X5 텐서 float32
X6 텐서 float32
X7 텐서 float32
X8 텐서 float32
X9 텐서 float32
치료하다 텐서 int32
와이 텐서 int32
  • 감독된 키 ( as_supervised 문서 참조): ({'X1': 'X1', 'X10': 'X10', 'X11': 'X11', 'X12': 'X12', 'X13': 'X13', 'X14': 'X14', 'X15': 'X15', 'X16': 'X16', 'X17': 'X17', 'X18': 'X18', 'X19': 'X19', 'X2': 'X2', 'X20': 'X20', 'X3': 'X3', 'X4': 'X4', 'X5': 'X5', 'X6': 'X6', 'X7': 'X7', 'X8': 'X8', 'X9': 'X9', 'treat': 'treat'}, 'y')

  • 그림 ( tfds.show_examples ): 지원되지 않습니다.

  • ( tfds.as_dataframe ):

  • 인용 :
@misc{https://doi.org/10.48550/arxiv.1212.2995,
  doi = {10.48550/ARXIV.1212.2995},
  url = {https://arxiv.org/abs/1212.2995},
  author = {Tian, Lu and Alizadeh, Ash and Gentles, Andrew and Tibshirani, Robert},
  keywords = {Methodology (stat.ME), FOS: Computer and information sciences, FOS: Computer and information sciences},
  title = {A Simple Method for Detecting Interactions between a Treatment and a Large Number of Covariates},
  publisher = {arXiv},
  year = {2012},
  copyright = {arXiv.org perpetual, non-exclusive license}
}