Ayuda a proteger la Gran Barrera de Coral con TensorFlow en Kaggle Únete Challenge

vino_calidad

  • Descripción:

Se crearon dos conjuntos de datos, utilizando muestras de vino tinto y blanco. Las entradas incluyen pruebas objetivas (por ejemplo, valores de PH) y la salida se basa en datos sensoriales (mediana de al menos 3 evaluaciones realizadas por expertos en vino). Cada experto calificó la calidad del vino entre 0 (muy mala) y 10 (muy excelente). Se aplicaron varios métodos de minería de datos para modelar estos conjuntos de datos bajo un enfoque de regresión. El modelo de máquina de vectores de soporte obtuvo los mejores resultados. Se calcularon varias métricas: MAD, matriz de confusión para una tolerancia de error fija (T), etc. Además, graficamos la importancia relativa de las variables de entrada (medidas mediante un procedimiento de análisis de sensibilidad).

Los dos conjuntos de datos están relacionados con variantes rojas y blancas del vino portugués "Vinho Verde". Para más detalles, consultar: http://www.vinhoverde.pt/en/ o la referencia [Cortez et al., 2009]. Debido a cuestiones de privacidad y logística, solo están disponibles las variables fisicoquímicas (entradas) y sensoriales (la salida) (por ejemplo, no hay datos sobre los tipos de uva, la marca del vino, el precio de venta del vino, etc.).

Número de instancias: vino tinto - 1599; vino blanco - 4898

Variables de entrada (basadas en pruebas fisicoquímicas):

  1. acidez fija
  2. acidez volátil
  3. ácido cítrico
  4. azúcar residual
  5. cloruros
  6. dióxido de azufre libre
  7. dióxido de azufre total
  8. densidad
  9. pH
  10. sulfatos
  11. alcohol

Variable de salida (basada en datos sensoriales):

  1. calidad (puntuación entre 0 y 10)
FeaturesDict({
    'features': FeaturesDict({
        'alcohol': tf.float32,
        'chlorides': tf.float32,
        'citric acid': tf.float32,
        'density': tf.float32,
        'fixed acidity': tf.float32,
        'free sulfur dioxide': tf.float32,
        'pH': tf.float32,
        'residual sugar': tf.float32,
        'sulphates': tf.float64,
        'total sulfur dioxide': tf.float32,
        'volatile acidity': tf.float32,
    }),
    'quality': tf.int32,
})
@ONLINE {cortezpaulo;cerdeiraantonio;almeidafernando;matostelmo;reisjose1999,
    author = "Cortez, Paulo; Cerdeira, Antonio; Almeida,Fernando;  Matos, Telmo;  Reis, Jose",
    title  = "Modeling wine preferences by data mining from physicochemical properties.",
    year   = "2009",
    url    = "https://archive.ics.uci.edu/ml/datasets/wine+quality"
}

wine_quality / white (configuración predeterminada)

  • Descripción config: Vino blanco

  • Tamaño del paquete: 258.23 KiB

  • Conjunto de datos de tamaño: 1.87 MiB

  • Fraccionamientos:

Separar Ejemplos de
'train' 4.898

wine_quality / tinto

  • Descripción config: Vino Tinto

  • Tamaño del paquete: 82.23 KiB

  • Conjunto de datos de tamaño: 626.17 KiB

  • Fraccionamientos:

Separar Ejemplos de
'train' 1.599