איכות_יין

 • תיאור :

נוצרו שני מערכי נתונים, תוך שימוש בדגימות יין אדום ולבן. התשומות כוללות בדיקות אובייקטיביות (למשל ערכי PH) והפלט מבוסס על נתונים תחושתיים (חציון של לפחות 3 הערכות שנעשו על ידי מומחי יין). כל מומחה דירג את איכות היין בין 0 (גרוע מאוד) ל-10 (מעולה מאוד). מספר שיטות כריית נתונים יושמו למודל של מערכי נתונים אלה בגישת רגרסיה. דגם המכונה הווקטורית התמיכה השיג את התוצאות הטובות ביותר. חושבו מספר מדדים: MAD, מטריצת בלבול לסובלנות שגיאה קבועה (T) וכו'. כמו כן, אנו משרטטים את החשיבות היחסית של משתני הקלט (כפי שנמדדו על ידי הליך ניתוח רגישות).

שני מערכי הנתונים קשורים לגרסאות אדומות ולבנות של היין הפורטוגזי "Vinho Verde". לפרטים נוספים, עיין: http://www.vinhoverde.pt/en/ או הפניה [Cortez et al., 2009]. בשל בעיות פרטיות ולוגיסטיות, זמינים רק משתנים פיזיקוכימיים (תשומות) ותחושתיים (התפוקה) (למשל, אין נתונים לגבי סוגי ענבים, מותג יין, מחיר מכירת יין וכו').

מספר מקרים: יין אדום - 1599; יין לבן - 4898

משתני קלט (מבוסס על מבחנים פיזיקוכימיים):

 1. חומציות קבועה
 2. חומציות נדיפה
 3. חוּמצַת לִימוֹן
 4. שאריות סוכר
 5. כלורידים
 6. דו תחמוצת הגופרית החופשית
 7. סך גופרית דו חמצנית
 8. צְפִיפוּת
 9. pH
 10. סולפטים
 11. כּוֹהֶל

משתנה פלט (מבוסס על נתונים תחושתיים):

 1. איכות (ציון בין 0 ל-10)
FeaturesDict({
  'features': FeaturesDict({
    'alcohol': tf.float32,
    'chlorides': tf.float32,
    'citric acid': tf.float32,
    'density': tf.float32,
    'fixed acidity': tf.float32,
    'free sulfur dioxide': tf.float32,
    'pH': tf.float32,
    'residual sugar': tf.float32,
    'sulphates': tf.float64,
    'total sulfur dioxide': tf.float32,
    'volatile acidity': tf.float32,
  }),
  'quality': tf.int32,
})
 • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
תכונות FeaturesDict
תכונות/אלכוהול מוֹתֵחַ tf.float32
תכונות/כלורידים מוֹתֵחַ tf.float32
תכונות/חומצת לימון מוֹתֵחַ tf.float32
תכונות/צפיפות מוֹתֵחַ tf.float32
תכונות/חומציות קבועה מוֹתֵחַ tf.float32
תכונות / דו תחמוצת הגופרית ללא תשלום מוֹתֵחַ tf.float32
תכונות/pH מוֹתֵחַ tf.float32
תכונות/שאריות סוכר מוֹתֵחַ tf.float32
תכונות/סולפטים מוֹתֵחַ tf.float64
תכונות/סך הכל דו תחמוצת הגופרית מוֹתֵחַ tf.float32
תכונות/חומציות נדיפה מוֹתֵחַ tf.float32
איכות מוֹתֵחַ tf.int32
@ONLINE {cortezpaulo;cerdeiraantonio;almeidafernando;matostelmo;reisjose1999,
  author = "Cortez, Paulo; Cerdeira, Antonio; Almeida,Fernando; Matos, Telmo; Reis, Jose",
  title = "Modeling wine preferences by data mining from physicochemical properties.",
  year  = "2009",
  url  = "https://archive.ics.uci.edu/ml/datasets/wine+quality"
}

wine_quality/white (תצורת ברירת מחדל)

 • תיאור תצורה : יין לבן

 • גודל הורדה : 258.23 KiB

 • גודל מערך נתונים : 1.87 MiB

 • פיצולים :

לְפַצֵל דוגמאות
'train' 4,898

איכות_יין/אדום

 • תיאור תצורה : יין אדום

 • גודל הורדה : 82.23 KiB

 • גודל מערך נתונים : 626.17 KiB

 • פיצולים :

לְפַצֵל דוגמאות
'train' 1,599