qualidade_vinho

  • Descrição :

Dois conjuntos de dados foram criados, usando amostras de vinho tinto e branco. As entradas incluem testes objetivos (por exemplo, valores de PH) e a saída é baseada em dados sensoriais (mediana de pelo menos 3 avaliações feitas por especialistas em vinhos). Cada especialista classificou a qualidade do vinho entre 0 (muito ruim) e 10 (muito excelente). Vários métodos de mineração de dados foram aplicados para modelar esses conjuntos de dados sob uma abordagem de regressão. O modelo de máquina de vetores de suporte obteve os melhores resultados. Várias métricas foram calculadas: MAD, matriz de confusão para uma tolerância de erro fixa (T), etc. Além disso, plotamos as importâncias relativas das variáveis ​​de entrada (medidas por um procedimento de análise de sensibilidade).

Os dois conjuntos de dados estão relacionados com as variantes tinto e branco do vinho português "Vinho Verde". Para mais detalhes, consulte: http://www.vinhoverde.pt/en/ ou a referência [Cortez et al., 2009]. Por questões de privacidade e logística, apenas estão disponíveis variáveis ​​físico-químicas (entradas) e sensoriais (saídas) (por exemplo, não há dados sobre tipos de uva, marca de vinho, preço de venda do vinho, etc.).

Número de instâncias: vinho tinto - 1599; vinho branco - 4898

Variáveis ​​de entrada (com base em testes físico-químicos):

  1. acidez fixa
  2. acidez volátil
  3. Ácido Cítrico
  4. açúcar residual
  5. cloretos
  6. dióxido de enxofre livre
  7. dióxido de enxofre total
  8. densidade
  9. pH
  10. sulfatos
  11. álcool

Variável de saída (com base em dados sensoriais):

  1. qualidade (pontuação entre 0 e 10)
FeaturesDict({
    'features': FeaturesDict({
        'alcohol': float32,
        'chlorides': float32,
        'citric acid': float32,
        'density': float32,
        'fixed acidity': float32,
        'free sulfur dioxide': float32,
        'pH': float32,
        'residual sugar': float32,
        'sulphates': float64,
        'total sulfur dioxide': float32,
        'volatile acidity': float32,
    }),
    'quality': int32,
})
  • Documentação do recurso:
Característica Classe Forma Tipo D Descrição
RecursosDict
recursos RecursosDict
características/álcool tensor float32
características/cloretos tensor float32
características/ácido cítrico tensor float32
características/densidade tensor float32
características/acidez fixa tensor float32
características/dióxido de enxofre livre tensor float32
características/pH tensor float32
características/açúcar residual tensor float32
características/sulfatos tensor float64
características/dióxido de enxofre total tensor float32
características/acidez volátil tensor float32
qualidade tensor int32
@ONLINE {cortezpaulo;cerdeiraantonio;almeidafernando;matostelmo;reisjose1999,
    author = "Cortez, Paulo; Cerdeira, Antonio; Almeida,Fernando;  Matos, Telmo;  Reis, Jose",
    title  = "Modeling wine preferences by data mining from physicochemical properties.",
    year   = "2009",
    url    = "https://archive.ics.uci.edu/ml/datasets/wine+quality"
}

wine_quality/white (configuração padrão)

  • Descrição da configuração : Vinho Branco

  • Tamanho do download : 258.23 KiB

  • Tamanho do conjunto de dados : 1.87 MiB

  • Divisões :

Dividir Exemplos
'train' 4.898

qualidade_vinho/tinto

  • Descrição da configuração : Vinho tinto

  • Tamanho do download : 82.23 KiB

  • Tamanho do conjunto de dados : 626.17 KiB

  • Divisões :

Dividir Exemplos
'train' 1.599