qualité_du_vin

  • Descriptif :

Deux ensembles de données ont été créés, en utilisant des échantillons de vin rouge et blanc. Les entrées comprennent des tests objectifs (par exemple, les valeurs de PH) et la sortie est basée sur des données sensorielles (médiane d'au moins 3 évaluations faites par des experts en vin). Chaque expert a noté la qualité du vin entre 0 (très mauvais) et 10 (très excellent). Plusieurs méthodes d'exploration de données ont été appliquées pour modéliser ces ensembles de données selon une approche de régression. Le modèle de machine à vecteur de support a obtenu les meilleurs résultats. Plusieurs métriques ont été calculées : MAD, matrice de confusion pour une tolérance d'erreur fixe (T), etc. De plus, nous avons tracé les importances relatives des variables d'entrée (telles que mesurées par une procédure d'analyse de sensibilité).

Les deux ensembles de données sont liés aux variantes rouges et blanches du vin portugais "Vinho Verde". Pour plus de détails, consulter : http://www.vinhoverde.pt/en/ ou la référence [Cortez et al., 2009]. Pour des raisons de confidentialité et de logistique, seules les variables physico-chimiques (entrées) et sensorielles (sortie) sont disponibles (par exemple, il n'y a pas de données sur les types de raisins, la marque du vin, le prix de vente du vin, etc.).

Nombre d'instances : vin rouge - 1 599 ; vin blanc - 4898

Variables d'entrée (basées sur des tests physico-chimiques) :

  1. acidité fixe
  2. acidité volatile
  3. acide citrique
  4. sucre résiduel
  5. chlorures
  6. anhydride sulfureux libre
  7. dioxyde de soufre total
  8. densité
  9. pH
  10. sulfates
  11. de l'alcool

Variable de sortie (basée sur les données sensorielles) :

  1. qualité (note entre 0 et 10)
FeaturesDict({
    'features': FeaturesDict({
        'alcohol': float32,
        'chlorides': float32,
        'citric acid': float32,
        'density': float32,
        'fixed acidity': float32,
        'free sulfur dioxide': float32,
        'pH': float32,
        'residual sugar': float32,
        'sulphates': float64,
        'total sulfur dioxide': float32,
        'volatile acidity': float32,
    }),
    'quality': int32,
})
  • Documentation des fonctionnalités :
Caractéristique Classer Forme Dtype La description
FonctionnalitésDict
Caractéristiques FonctionnalitésDict
caractéristiques/alcool Tenseur float32
caractéristiques/chlorures Tenseur float32
caractéristiques/acide citrique Tenseur float32
caractéristiques/densité Tenseur float32
caractéristiques/acidité fixe Tenseur float32
caractéristiques/anhydride sulfureux libre Tenseur float32
caractéristiques/pH Tenseur float32
caractéristiques/sucre résiduel Tenseur float32
caractéristiques/sulfates Tenseur float64
caractéristiques/anhydride sulfureux total Tenseur float32
caractéristiques/acidité volatile Tenseur float32
qualité Tenseur int32
@ONLINE {cortezpaulo;cerdeiraantonio;almeidafernando;matostelmo;reisjose1999,
    author = "Cortez, Paulo; Cerdeira, Antonio; Almeida,Fernando;  Matos, Telmo;  Reis, Jose",
    title  = "Modeling wine preferences by data mining from physicochemical properties.",
    year   = "2009",
    url    = "https://archive.ics.uci.edu/ml/datasets/wine+quality"
}

wine_quality/white (configuration par défaut)

  • Description de la configuration : Vin blanc

  • Taille du téléchargement : 258.23 KiB

  • Taille du jeu de données : 1.87 MiB

  • Fractionnements :

Diviser Exemples
'train' 4 898

qualité_vin/rouge

  • Description de la configuration : Vin rouge

  • Taille du téléchargement : 82.23 KiB

  • Taille du jeu de données : 626.17 KiB

  • Fractionnements :

Diviser Exemples
'train' 1 599