qualité_vin

  • Description:

Deux ensembles de données ont été créés, en utilisant des échantillons de vin rouge et blanc. Les entrées comprennent des tests objectifs (par exemple des valeurs de PH) et la sortie est basée sur des données sensorielles (médiane d'au moins 3 évaluations faites par des experts en vin). Chaque expert a noté la qualité du vin entre 0 (très mauvais) et 10 (très excellent). Plusieurs méthodes d'exploration de données ont été appliquées pour modéliser ces ensembles de données dans le cadre d'une approche de régression. Le modèle de machine à vecteur de support a obtenu les meilleurs résultats. Plusieurs métriques ont été calculées : MAD, matrice de confusion pour une tolérance d'erreur fixe (T), etc. De plus, nous traçons les importances relatives des variables d'entrée (telles que mesurées par une procédure d'analyse de sensibilité).

Les deux ensembles de données sont liés aux variantes rouges et blanches du vin portugais "Vinho Verde". Pour plus de détails, consultez: http://www.vinhoverde.pt/en/ ou la référence [Cortez et al . , 2009]. En raison de problèmes de confidentialité et de logistique, seules les variables physico-chimiques (entrées) et sensorielles (sortie) sont disponibles (par exemple, il n'y a pas de données sur les types de raisin, la marque de vin, le prix de vente du vin, etc.).

Nombre d'instances : vin rouge - 1599 ; vin blanc - 4898

Variables d'entrée (basées sur des tests physico-chimiques) :

  1. acidité fixe
  2. acidité volatile
  3. acide citrique
  4. sucre résiduel
  5. chlorures
  6. dioxyde de soufre libre
  7. dioxyde de soufre total
  8. densité
  9. pH
  10. sulfates
  11. de l'alcool

Variable de sortie (basée sur des données sensorielles) :

  1. qualité (note entre 0 et 10)
FeaturesDict({
    'features': FeaturesDict({
        'alcohol': tf.float32,
        'chlorides': tf.float32,
        'citric acid': tf.float32,
        'density': tf.float32,
        'fixed acidity': tf.float32,
        'free sulfur dioxide': tf.float32,
        'pH': tf.float32,
        'residual sugar': tf.float32,
        'sulphates': tf.float64,
        'total sulfur dioxide': tf.float32,
        'volatile acidity': tf.float32,
    }),
    'quality': tf.int32,
})
@ONLINE {cortezpaulo;cerdeiraantonio;almeidafernando;matostelmo;reisjose1999,
    author = "Cortez, Paulo; Cerdeira, Antonio; Almeida,Fernando;  Matos, Telmo;  Reis, Jose",
    title  = "Modeling wine preferences by data mining from physicochemical properties.",
    year   = "2009",
    url    = "https://archive.ics.uci.edu/ml/datasets/wine+quality"
}

wine_quality/white (configuration par défaut)

  • Description Config: vin blanc

  • Taille du téléchargement: 258.23 KiB

  • Dataset Taille: 1.87 MiB

  • scissions:

Diviser Exemples
'train' 4 898

qualité_vin/rouge

  • Description Config: Vin rouge

  • Taille du téléchargement: 82.23 KiB

  • Dataset Taille: 626.17 KiB

  • scissions:

Diviser Exemples
'train' 1 599