- תיאור :
נוצרו שני מערכי נתונים, תוך שימוש בדגימות יין אדום ולבן. התשומות כוללות בדיקות אובייקטיביות (למשל ערכי PH) והפלט מבוסס על נתונים תחושתיים (חציון של לפחות 3 הערכות שנעשו על ידי מומחי יין). כל מומחה דירג את איכות היין בין 0 (גרוע מאוד) ל-10 (מעולה מאוד). מספר שיטות כריית נתונים יושמו למודל של מערכי נתונים אלה בגישת רגרסיה. דגם המכונה הווקטורית התמיכה השיג את התוצאות הטובות ביותר. חושבו מספר מדדים: MAD, מטריצת בלבול לסובלנות שגיאה קבועה (T) וכו'. כמו כן, אנו משרטטים את החשיבות היחסית של משתני הקלט (כפי שנמדדו על ידי הליך ניתוח רגישות).
שני מערכי הנתונים קשורים לגרסאות אדומות ולבנות של היין הפורטוגזי "Vinho Verde". לפרטים נוספים, עיין: http://www.vinhoverde.pt/en/ או הפניה [Cortez et al., 2009]. בשל בעיות פרטיות ולוגיסטיות, זמינים רק משתנים פיזיקוכימיים (תשומות) ותחושתיים (התפוקה) (למשל, אין נתונים לגבי סוגי ענבים, מותג יין, מחיר מכירת יין וכו').
מספר מקרים: יין אדום - 1599; יין לבן - 4898
משתני קלט (מבוסס על מבחנים פיזיקוכימיים):
- חומציות קבועה
- חומציות נדיפה
- חוּמצַת לִימוֹן
- שאריות סוכר
- כלורידים
- דו תחמוצת הגופרית החופשית
- סך גופרית דו חמצנית
- צְפִיפוּת
- pH
- סולפטים
- כּוֹהֶל
משתנה פלט (מבוסס על נתונים תחושתיים):
- איכות (ציון בין 0 ל-10)
דף הבית : https://archive.ics.uci.edu/ml/datasets/wine+quality
קוד מקור :
tfds.structured.wine_quality.WineQuality
גרסאות :
-
1.0.0
(ברירת מחדל): אין הערות שחרור.
-
שמור אוטומטי במטמון ( תיעוד ): כן
מבנה תכונה :
FeaturesDict({
'features': FeaturesDict({
'alcohol': tf.float32,
'chlorides': tf.float32,
'citric acid': tf.float32,
'density': tf.float32,
'fixed acidity': tf.float32,
'free sulfur dioxide': tf.float32,
'pH': tf.float32,
'residual sugar': tf.float32,
'sulphates': tf.float64,
'total sulfur dioxide': tf.float32,
'volatile acidity': tf.float32,
}),
'quality': tf.int32,
})
- תיעוד תכונה :
תכונה | מעמד | צוּרָה | Dtype | תיאור |
---|---|---|---|---|
FeaturesDict | ||||
תכונות | FeaturesDict | |||
תכונות/אלכוהול | מוֹתֵחַ | tf.float32 | ||
תכונות/כלורידים | מוֹתֵחַ | tf.float32 | ||
תכונות/חומצת לימון | מוֹתֵחַ | tf.float32 | ||
תכונות/צפיפות | מוֹתֵחַ | tf.float32 | ||
תכונות/חומציות קבועה | מוֹתֵחַ | tf.float32 | ||
תכונות / דו תחמוצת הגופרית ללא תשלום | מוֹתֵחַ | tf.float32 | ||
תכונות/pH | מוֹתֵחַ | tf.float32 | ||
תכונות/שאריות סוכר | מוֹתֵחַ | tf.float32 | ||
תכונות/סולפטים | מוֹתֵחַ | tf.float64 | ||
תכונות/סך הכל דו תחמוצת הגופרית | מוֹתֵחַ | tf.float32 | ||
תכונות/חומציות נדיפה | מוֹתֵחַ | tf.float32 | ||
איכות | מוֹתֵחַ | tf.int32 |
מפתחות בפיקוח (ראה
as_supervised
doc ):('features', 'quality')
איור ( tfds.show_examples ): לא נתמך.
דוגמאות ( tfds.as_dataframe ): חסר.
ציטוט :
@ONLINE {cortezpaulo;cerdeiraantonio;almeidafernando;matostelmo;reisjose1999,
author = "Cortez, Paulo; Cerdeira, Antonio; Almeida,Fernando; Matos, Telmo; Reis, Jose",
title = "Modeling wine preferences by data mining from physicochemical properties.",
year = "2009",
url = "https://archive.ics.uci.edu/ml/datasets/wine+quality"
}
wine_quality/white (תצורת ברירת מחדל)
תיאור תצורה : יין לבן
גודל הורדה :
258.23 KiB
גודל מערך נתונים :
1.87 MiB
פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'train' | 4,898 |
איכות_יין/אדום
תיאור תצורה : יין אדום
גודל הורדה :
82.23 KiB
גודל מערך נתונים :
626.17 KiB
פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'train' | 1,599 |