vino_calidad

  • Descripción :

Se crearon dos conjuntos de datos, utilizando muestras de vino tinto y blanco. Las entradas incluyen pruebas objetivas (por ejemplo, valores de PH) y la salida se basa en datos sensoriales (mediana de al menos 3 evaluaciones realizadas por expertos en vinos). Cada experto calificó la calidad del vino entre 0 (muy mala) y 10 (muy excelente). Se aplicaron varios métodos de minería de datos para modelar estos conjuntos de datos bajo un enfoque de regresión. El modelo de máquina de vectores de soporte logró los mejores resultados. Se calcularon varias métricas: MAD, matriz de confusión para una tolerancia de error fija (T), etc. Además, trazamos las importancias relativas de las variables de entrada (medidas por un procedimiento de análisis de sensibilidad).

Los dos conjuntos de datos están relacionados con variantes rojas y blancas del vino portugués "Vinho Verde". Para más detalles, consulte: http://www.vinhoverde.pt/en/ o la referencia [Cortez et al., 2009]. Debido a cuestiones de privacidad y logística, solo están disponibles variables fisicoquímicas (entradas) y sensoriales (salida) (p. ej., no hay datos sobre tipos de uva, marca de vino, precio de venta del vino, etc.).

Número de instancias: vino tinto - 1599; vino blanco - 4898

Variables de entrada (basadas en pruebas fisicoquímicas):

  1. acidez fija
  2. acidez volátil
  3. ácido cítrico
  4. azúcar residual
  5. cloruros
  6. dióxido de azufre libre
  7. dióxido de azufre total
  8. densidad
  9. pH
  10. sulfatos
  11. alcohol

Variable de salida (basada en datos sensoriales):

  1. calidad (puntuación entre 0 y 10)
FeaturesDict({
    'features': FeaturesDict({
        'alcohol': tf.float32,
        'chlorides': tf.float32,
        'citric acid': tf.float32,
        'density': tf.float32,
        'fixed acidity': tf.float32,
        'free sulfur dioxide': tf.float32,
        'pH': tf.float32,
        'residual sugar': tf.float32,
        'sulphates': tf.float64,
        'total sulfur dioxide': tf.float32,
        'volatile acidity': tf.float32,
    }),
    'quality': tf.int32,
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
caracteristicas CaracterísticasDict
rasgos/alcohol Tensor tf.float32
características/cloruros Tensor tf.float32
características/ácido cítrico Tensor tf.float32
rasgos/densidad Tensor tf.float32
características/acidez fija Tensor tf.float32
características/dióxido de azufre libre Tensor tf.float32
caracteristicas/pH Tensor tf.float32
características/azúcar residual Tensor tf.float32
caracteristicas/sulfatos Tensor tf.float64
características/dióxido de azufre total Tensor tf.float32
características/acidez volátil Tensor tf.float32
calidad Tensor tf.int32
@ONLINE {cortezpaulo;cerdeiraantonio;almeidafernando;matostelmo;reisjose1999,
    author = "Cortez, Paulo; Cerdeira, Antonio; Almeida,Fernando;  Matos, Telmo;  Reis, Jose",
    title  = "Modeling wine preferences by data mining from physicochemical properties.",
    year   = "2009",
    url    = "https://archive.ics.uci.edu/ml/datasets/wine+quality"
}

vino_calidad/blanco (configuración predeterminada)

  • Descripción de la configuración : vino blanco

  • Tamaño de la descarga : 258.23 KiB

  • Tamaño del conjunto de datos : 1.87 MiB

  • Divisiones :

Separar Ejemplos
'train' 4,898

vino_calidad/tinto

  • Descripción de la configuración : vino tinto

  • Tamaño de la descarga : 82.23 KiB

  • Tamaño del conjunto de datos : 626.17 KiB

  • Divisiones :

Separar Ejemplos
'train' 1,599