סימפטי

l10n-placeholder1 treat == 1, 2, 1) test\\(treat <- ifelse(test\\)treat == 1, 2, 1) train\\(y <- ifelse(train\\)y == 1, 2, 1) test\\(y <- ifelse(test\\)y == 1, 2, 1) train\\(ts = NULL test\\)ts = NULL ``` פרמטרים: - `n` = מספר דגימות - `p` = מספר מנבאים - `ro` = משתנות בין מנבאים - `sigma` = מוכפל של השגיאה term - `beta.den` = בטא משותק על ידי 1/beta.den יוצר: Leo Guelman leo.guelman@gmail.com כדי להשתמש במערך הנתונים הזה: ```python יבא tensorflow_datasets כ-tfds ds = tfds.load('simpte' , split='train') עבור ex ב-ds.take(4): print(ex) ``` ראה [המדריך](https://www.tensorflow.org/datasets/overview) למידע נוסף על [tensorflow_datasets] ](https://www.tensorflow.org/datasets). " />
  • תיאור :

שם מלא: סימולציות לאפקטים של טיפול אישי

נוצר עם חבילת R's Uplift: https://rdrr.io/cran/uplift/man/sim_pte.html

ניתן להוריד את החבילה כאן: https://cran.r-project.org/src/contrib/Archive/uplift/

ערכת נתונים שנוצרה בגרסה R 4.1.2 עם הקוד הבא:

  library(uplift)

  set.seed(123)

  train <- sim_pte(n = 1000, p = 20, rho = 0, sigma = sqrt(2), beta.den = 4)
  test <- sim_pte(n = 2000, p = 20, rho = 0, sigma = sqrt(2), beta.den = 4)

  train$treat <- ifelse(train$treat == 1, 2, 1)
  test$treat <- ifelse(test$treat == 1, 2, 1)

  train$y <- ifelse(train$y == 1, 2, 1)
  test$y <- ifelse(test$y == 1, 2, 1)

  train$ts = NULL
  test$ts = NULL

פרמטרים:

  • n = מספר דגימות
  • p = מספר מנבאים
  • ro = שיתופיות בין מנבאים
  • sigma = משפיל של מונח השגיאה
  • beta.den = בטא מושתק ב-1/beta.den

יוצר: ליאו גואלמן leo.guelman@gmail.com

  • דף הבית : https://rdrr.io/cran/uplift/man/sim_pte.html

  • קוד מקור : tfds.datasets.simpte.Builder

  • גרסאות :

    • 1.0.0 (ברירת מחדל): שחרור ראשוני.
  • גודל הורדה : Unknown size

  • גודל מערך נתונים : 1.04 MiB

  • הוראות הורדה ידניות : מערך נתונים זה מחייב אותך להוריד את נתוני המקור באופן ידני אל download_config.manual_dir (ברירת המחדל היא ~/tensorflow_datasets/downloads/manual/ ):
    אנא הורד את נתוני ההדרכה: sim_pte_train.csv ונתוני הבדיקה: sim_pte_test.csv אל ~/tensorflow_datasets/downloads/manual/.

  • שמור אוטומטי במטמון ( תיעוד ): כן

  • פיצולים :

לְפַצֵל דוגמאות
'test' 2,000
'train' 1,000
  • מבנה תכונה :
FeaturesDict({
    'X1': float32,
    'X10': float32,
    'X11': float32,
    'X12': float32,
    'X13': float32,
    'X14': float32,
    'X15': float32,
    'X16': float32,
    'X17': float32,
    'X18': float32,
    'X19': float32,
    'X2': float32,
    'X20': float32,
    'X3': float32,
    'X4': float32,
    'X5': float32,
    'X6': float32,
    'X7': float32,
    'X8': float32,
    'X9': float32,
    'treat': int32,
    'y': int32,
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
X1 מוֹתֵחַ לצוף32
X10 מוֹתֵחַ לצוף32
X11 מוֹתֵחַ לצוף32
X12 מוֹתֵחַ לצוף32
X13 מוֹתֵחַ לצוף32
X14 מוֹתֵחַ לצוף32
X15 מוֹתֵחַ לצוף32
X16 מוֹתֵחַ לצוף32
X17 מוֹתֵחַ לצוף32
X18 מוֹתֵחַ לצוף32
X19 מוֹתֵחַ לצוף32
X2 מוֹתֵחַ לצוף32
X20 מוֹתֵחַ לצוף32
X3 מוֹתֵחַ לצוף32
X4 מוֹתֵחַ לצוף32
X5 מוֹתֵחַ לצוף32
X6 מוֹתֵחַ לצוף32
X7 מוֹתֵחַ לצוף32
X8 מוֹתֵחַ לצוף32
X9 מוֹתֵחַ לצוף32
טיפול מוֹתֵחַ int32
y מוֹתֵחַ int32
  • מפתחות בפיקוח (ראה as_supervised doc ): ({'X1': 'X1', 'X10': 'X10', 'X11': 'X11', 'X12': 'X12', 'X13': 'X13', 'X14': 'X14', 'X15': 'X15', 'X16': 'X16', 'X17': 'X17', 'X18': 'X18', 'X19': 'X19', 'X2': 'X2', 'X20': 'X20', 'X3': 'X3', 'X4': 'X4', 'X5': 'X5', 'X6': 'X6', 'X7': 'X7', 'X8': 'X8', 'X9': 'X9', 'treat': 'treat'}, 'y')

  • איור ( tfds.show_examples ): לא נתמך.

  • דוגמאות ( tfds.as_dataframe ):

  • ציטוט :
@misc{https://doi.org/10.48550/arxiv.1212.2995,
  doi = {10.48550/ARXIV.1212.2995},
  url = {https://arxiv.org/abs/1212.2995},
  author = {Tian, Lu and Alizadeh, Ash and Gentles, Andrew and Tibshirani, Robert},
  keywords = {Methodology (stat.ME), FOS: Computer and information sciences, FOS: Computer and information sciences},
  title = {A Simple Method for Detecting Interactions between a Treatment and a Large Number of Covariates},
  publisher = {arXiv},
  year = {2012},
  copyright = {arXiv.org perpetual, non-exclusive license}
}