simplement

l10n-placeholder1 traiter == 1, 2, 1) test\\(treat <- ifelse(test\\)traiter == 1, 2, 1) train\\(y <- ifelse(train\\)y == 1, 2, 1) test\\(y <- ifelse(test\\)y == 1, 2, 1) train\\(ts = NULL test\\)ts = NULL ``` Paramètres : - `n` = nombre d'échantillons - `p` = nombre de prédicteurs - `ro` = covariance entre prédicteurs - `sigma` = multiplicateur de l'erreur term - `beta.den` = beta est multiplié par 1/beta.den Créateur : Leo Guelman leo.guelman@gmail.com Pour utiliser cet ensemble de données : ```python import tensorflow_datasets as tfds ds = tfds.load('simpte' , split='train') pour ex dans ds.take(4): print(ex) ``` Voir [le guide](https://www.tensorflow.org/datasets/overview) pour plus d'informations sur [tensorflow_datasets ](https://www.tensorflow.org/datasets). " />
  • Descriptif :

Nom complet : Simulations pour des effets de traitement personnalisés

Généré avec le package R's Uplift : https://rdrr.io/cran/uplift/man/sim_pte.html

Le package peut être téléchargé ici : https://cran.r-project.org/src/contrib/Archive/uplift/

Jeu de données généré dans R version 4.1.2 avec le code suivant :

  library(uplift)

  set.seed(123)

  train <- sim_pte(n = 1000, p = 20, rho = 0, sigma = sqrt(2), beta.den = 4)
  test <- sim_pte(n = 2000, p = 20, rho = 0, sigma = sqrt(2), beta.den = 4)

  train$treat <- ifelse(train$treat == 1, 2, 1)
  test$treat <- ifelse(test$treat == 1, 2, 1)

  train$y <- ifelse(train$y == 1, 2, 1)
  test$y <- ifelse(test$y == 1, 2, 1)

  train$ts = NULL
  test$ts = NULL

Paramètres:

  • n = nombre d'échantillons
  • p = nombre de prédicteurs
  • ro = covariance entre les prédicteurs
  • sigma = multiplicateur du terme d'erreur
  • beta.den = beta est multiplié par 1/beta.den

Créateur : Léo Guelman leo.guelman@gmail.com

  • Page d' accueil : https://rdrr.io/cran/uplift/man/sim_pte.html

  • Code source : tfds.datasets.simpte.Builder

  • Versions :

    • 1.0.0 (par défaut) : version initiale.
  • Taille du téléchargement : Unknown size

  • Taille du jeu de données : 1.04 MiB

  • Instructions de téléchargement manuel : cet ensemble de données nécessite que vous téléchargiez manuellement les données sources dans download_config.manual_dir (par défaut ~/tensorflow_datasets/downloads/manual/ ) :
    Veuillez télécharger les données d'entraînement : sim_pte_train.csv et les données de test : sim_pte_test.csv vers ~/tensorflow_datasets/downloads/manual/.

  • Mise en cache automatique ( documentation ): Oui

  • Fractionnements :

Diviser Exemples
'test' 2 000
'train' 1 000
  • Structure des fonctionnalités :
FeaturesDict({
    'X1': float32,
    'X10': float32,
    'X11': float32,
    'X12': float32,
    'X13': float32,
    'X14': float32,
    'X15': float32,
    'X16': float32,
    'X17': float32,
    'X18': float32,
    'X19': float32,
    'X2': float32,
    'X20': float32,
    'X3': float32,
    'X4': float32,
    'X5': float32,
    'X6': float32,
    'X7': float32,
    'X8': float32,
    'X9': float32,
    'treat': int32,
    'y': int32,
})
  • Documentation des fonctionnalités :
Caractéristique Classe Façonner Dtype Description
FonctionnalitésDict
X1 Tenseur float32
X10 Tenseur float32
X11 Tenseur float32
X12 Tenseur float32
X13 Tenseur float32
X14 Tenseur float32
X15 Tenseur float32
X16 Tenseur float32
X17 Tenseur float32
X18 Tenseur float32
X19 Tenseur float32
X2 Tenseur float32
X20 Tenseur float32
X3 Tenseur float32
X4 Tenseur float32
X5 Tenseur float32
X6 Tenseur float32
X7 Tenseur float32
X8 Tenseur float32
X9 Tenseur float32
traiter Tenseur int32
y Tenseur int32
  • Clés supervisées (Voir as_supervised doc ): ({'X1': 'X1', 'X10': 'X10', 'X11': 'X11', 'X12': 'X12', 'X13': 'X13', 'X14': 'X14', 'X15': 'X15', 'X16': 'X16', 'X17': 'X17', 'X18': 'X18', 'X19': 'X19', 'X2': 'X2', 'X20': 'X20', 'X3': 'X3', 'X4': 'X4', 'X5': 'X5', 'X6': 'X6', 'X7': 'X7', 'X8': 'X8', 'X9': 'X9', 'treat': 'treat'}, 'y')

  • Figure ( tfds.show_examples ) : non pris en charge.

  • Exemples ( tfds.as_dataframe ):

  • Citation :
@misc{https://doi.org/10.48550/arxiv.1212.2995,
  doi = {10.48550/ARXIV.1212.2995},
  url = {https://arxiv.org/abs/1212.2995},
  author = {Tian, Lu and Alizadeh, Ash and Gentles, Andrew and Tibshirani, Robert},
  keywords = {Methodology (stat.ME), FOS: Computer and information sciences, FOS: Computer and information sciences},
  title = {A Simple Method for Detecting Interactions between a Treatment and a Large Number of Covariates},
  publisher = {arXiv},
  year = {2012},
  copyright = {arXiv.org perpetual, non-exclusive license}
}