- Deskripsi :
Dua set data dibuat, menggunakan sampel anggur merah dan putih. Input termasuk tes objektif (misalnya nilai PH) dan output didasarkan pada data sensorik (median dari setidaknya 3 evaluasi yang dibuat oleh ahli wine). Setiap ahli menilai kualitas anggur antara 0 (sangat buruk) dan 10 (sangat baik). Beberapa metode data mining diterapkan untuk memodelkan dataset ini di bawah pendekatan regresi. Model mesin vektor dukungan mencapai hasil terbaik. Beberapa metrik telah dihitung: MAD, matriks kebingungan untuk toleransi kesalahan tetap (T), dll. Selain itu, kami memplot kepentingan relatif dari variabel input (yang diukur dengan prosedur analisis sensitivitas).
Kedua kumpulan data tersebut terkait dengan varian merah dan putih dari anggur Portugis "Vinho Verde". Untuk detail lebih lanjut, lihat: http://www.vinhoverde.pt/en/ atau referensi [Cortez et al., 2009]. Karena masalah privasi dan logistik, hanya variabel fisikokimia (masukan) dan sensorik (keluaran) yang tersedia (misalnya tidak ada data tentang jenis anggur, merek anggur, harga jual anggur, dll.).
Jumlah Contoh: anggur merah - 1599; anggur putih - 4898
Variabel masukan (berdasarkan uji fisikokimia):
- keasaman tetap
- keasaman volatil
- asam sitrat
- sisa gula
- klorida
- sulfur dioksida bebas
- sulfur dioksida total
- massa jenis
- pH
- sulfat
- alkohol
Variabel keluaran (berdasarkan data sensorik):
- kualitas (skor antara 0 dan 10)
Situs web : https://archive.ics.uci.edu/ml/datasets/wine+quality
Kode sumber :
tfds.structured.wine_quality.WineQuality
Versi :
-
1.0.0
(default): Tidak ada catatan rilis.
-
Cache otomatis ( dokumentasi ): Ya
Fitur :
FeaturesDict({
'features': FeaturesDict({
'alcohol': tf.float32,
'chlorides': tf.float32,
'citric acid': tf.float32,
'density': tf.float32,
'fixed acidity': tf.float32,
'free sulfur dioxide': tf.float32,
'pH': tf.float32,
'residual sugar': tf.float32,
'sulphates': tf.float64,
'total sulfur dioxide': tf.float32,
'volatile acidity': tf.float32,
}),
'quality': tf.int32,
})
Kunci yang diawasi (Lihat
as_supervised
doc ):('features', 'quality')
Kutipan :
@ONLINE {cortezpaulo;cerdeiraantonio;almeidafernando;matostelmo;reisjose1999,
author = "Cortez, Paulo; Cerdeira, Antonio; Almeida,Fernando; Matos, Telmo; Reis, Jose",
title = "Modeling wine preferences by data mining from physicochemical properties.",
year = "2009",
url = "https://archive.ics.uci.edu/ml/datasets/wine+quality"
}
- Gambar ( tfds.show_examples ): Tidak didukung.
wine_quality / putih (konfigurasi default)
Deskripsi konfigurasi : Anggur Putih
Ukuran download :
258.23 KiB
Ukuran set data :
1.87 MiB
Split :
Membagi | Contoh |
---|---|
'train' | 4.898 |
- Contoh ( tfds.as_dataframe ):
wine_quality / merah
Deskripsi konfigurasi : Anggur Merah
Ukuran download :
82.23 KiB
Ukuran
626.17 KiB
data :626.17 KiB
Split :
Membagi | Contoh |
---|---|
'train' | 1.599 |
- Contoh ( tfds.as_dataframe ):