O Dia da Comunidade de ML é dia 9 de novembro! Junte-nos para atualização de TensorFlow, JAX, e mais Saiba mais

wine_quality

  • Descrição:

Dois conjuntos de dados foram criados, usando amostras de vinho tinto e branco. As entradas incluem testes objetivos (por exemplo, valores de PH) e a saída é baseada em dados sensoriais (mediana de pelo menos 3 avaliações feitas por especialistas em vinho). Cada especialista avaliou a qualidade do vinho entre 0 (muito mau) e 10 (muito excelente). Vários métodos de mineração de dados foram aplicados para modelar esses conjuntos de dados sob uma abordagem de regressão. O modelo de máquina de vetores de suporte obteve os melhores resultados. Várias métricas foram calculadas: MAD, matriz de confusão para uma tolerância de erro fixa (T), etc. Além disso, traçamos as importâncias relativas das variáveis ​​de entrada (conforme medidas por um procedimento de análise de sensibilidade).

Os dois conjuntos de dados estão relacionados com as variantes tinto e branco do vinho "Vinho Verde" português. Para mais detalhes, consultar: http://www.vinhoverde.pt/en/ ou a referência [Cortez et al., 2009]. Devido a questões de privacidade e logística, apenas variáveis ​​físico-químicas (entradas) e sensoriais (saída) estão disponíveis (por exemplo, não há dados sobre os tipos de uva, marca do vinho, preço de venda do vinho, etc.).

Número de ocorrências: vinho tinto - 1599; vinho branco - 4898

Variáveis ​​de entrada (com base em testes físico-químicos):

  1. acidez fixa
  2. acidez volátil
  3. Ácido Cítrico
  4. açúcar residual
  5. cloretos
  6. dióxido de enxofre livre
  7. dióxido de enxofre total
  8. densidade
  9. pH
  10. sulfatos
  11. álcool

Variável de saída (com base em dados sensoriais):

  1. qualidade (pontuação entre 0 e 10)
FeaturesDict({
    'features': FeaturesDict({
        'alcohol': tf.float32,
        'chlorides': tf.float32,
        'citric acid': tf.float32,
        'density': tf.float32,
        'fixed acidity': tf.float32,
        'free sulfur dioxide': tf.float32,
        'pH': tf.float32,
        'residual sugar': tf.float32,
        'sulphates': tf.float64,
        'total sulfur dioxide': tf.float32,
        'volatile acidity': tf.float32,
    }),
    'quality': tf.int32,
})
@ONLINE {cortezpaulo;cerdeiraantonio;almeidafernando;matostelmo;reisjose1999,
    author = "Cortez, Paulo; Cerdeira, Antonio; Almeida,Fernando;  Matos, Telmo;  Reis, Jose",
    title  = "Modeling wine preferences by data mining from physicochemical properties.",
    year   = "2009",
    url    = "https://archive.ics.uci.edu/ml/datasets/wine+quality"
}

wine_quality / white (configuração padrão)

  • A inscrição Config: Vinho Branco

  • Tamanho do download: 258.23 KiB

  • Dataset tamanho: 1.87 MiB

  • desdobramentos:

Dividir Exemplos
'train' 4.898

wine_quality / tinto

  • A inscrição Config: Vinho Tinto

  • Tamanho do download: 82.23 KiB

  • Dataset size: 626.17 KiB

  • desdobramentos:

Dividir Exemplos
'train' 1.599