- תיאור :
זוהי משימת רגרסיה, כאשר המטרה היא לחזות את האזור השרוף של שריפות יער, באזור הצפון מזרחי של פורטוגל, על ידי שימוש בנתונים מטאורולוגיים ואחרים.
מידע מערך נתונים:
ב [Cortez and Morais, 2007], 'שטח' הפלט עבר טרנספורמציה לראשונה עם פונקציה ln(x+1). לאחר מכן, יושמו מספר שיטות כריית נתונים. לאחר התאמת המודלים, הפלטים עברו עיבוד לאחר היפוך של הטרנספורמציה ln(x+1). נעשה שימוש בארבע הגדרות קלט שונות. הניסויים נערכו באמצעות ריצות של פי 10 (אימות צולב) x 30. נמדדו שני מדדי רגרסיה: MAD ו-RMSE. מכונת וקטור תמיכה גאוסית (SVM) שהוזנה ב-4 תנאי מזג אוויר ישירים בלבד (טמפ', RH, רוח וגשם) השיגה את ערך ה-MAD הטוב ביותר: 12.71 +- 0.01 (ממוצע ורווח סמך בתוך 95% באמצעות התפלגות t-student). ה-RMSE הטוב ביותר הושג על ידי מנבא הממוצע הנאיבי. ניתוח של עקומת שגיאת הרגרסיה (REC) מראה שמודל SVM מנבא דוגמאות נוספות בתוך שגיאה מודה נמוכה יותר. למעשה, מודל ה-SVM מנבא שריפות קטנות טובות יותר, שהן הרוב.
מידע על תכונה:
למידע נוסף, קרא את [Cortez and Morais, 2007].
- קואורדינטה מרחבית של ציר X במפת פארק מונטסיניו: 1 עד 9
- קואורדינטה מרחבית של ציר Y - במפת פארק מונטסיניו: 2 עד 9
- חודש - חודש בשנה: 'jan' עד 'דצמבר'
- יום - יום בשבוע: 'ב' עד 'שמש'
- FFMC - אינדקס FFMC ממערכת FWI: 18.7 עד 96.20
- DMC - מדד DMC ממערכת FWI: 1.1 עד 291.3
- DC - DC index ממערכת FWI: 7.9 עד 860.6
- ISI - מדד ISI ממערכת FWI: 0.0 עד 56.10
- טמפ' - טמפרטורה במעלות צלזיוס: 2.2 עד 33.30
- RH - לחות יחסית באחוזים: 15.0 עד 100
- רוח - מהירות רוח בקמ"ש: 0.40 עד 9.40
- גשם - גשם בחוץ במ"מ/מ"ר: 0.0 עד 6.4
- שטח - השטח השרוף של היער (בה"א): 0.00 עד 1090.84 (משתנה פלט זה מוטה מאוד לכיוון 0.0, ולכן אולי הגיוני לעשות מודל עם טרנספורמציה לוגריתמית).
דף הבית : https://archive.ics.uci.edu/ml/datasets/Forest+Fires
קוד מקור :
tfds.structured.ForestFires
גרסאות :
-
0.0.1
(ברירת מחדל): אין הערות שחרור.
-
גודל הורדה :
24.88 KiB
גודל מערך נתונים :
162.07 KiB
שמור אוטומטי במטמון ( תיעוד ): כן
פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'train' | 517 |
- מבנה תכונה :
FeaturesDict({
'area': float32,
'features': FeaturesDict({
'DC': float32,
'DMC': float32,
'FFMC': float32,
'ISI': float32,
'RH': float32,
'X': uint8,
'Y': uint8,
'day': ClassLabel(shape=(), dtype=int64, num_classes=7),
'month': ClassLabel(shape=(), dtype=int64, num_classes=12),
'rain': float32,
'temp': float32,
'wind': float32,
}),
})
- תיעוד תכונה :
תכונה | מעמד | צוּרָה | Dtype | תיאור |
---|---|---|---|---|
FeaturesDict | ||||
אֵזוֹר | מוֹתֵחַ | לצוף32 | ||
תכונות | FeaturesDict | |||
תכונות/DC | מוֹתֵחַ | לצוף32 | ||
תכונות/DMC | מוֹתֵחַ | לצוף32 | ||
תכונות/FFMC | מוֹתֵחַ | לצוף32 | ||
תכונות/ISI | מוֹתֵחַ | לצוף32 | ||
תכונות/RH | מוֹתֵחַ | לצוף32 | ||
תכונות/X | מוֹתֵחַ | uint8 | ||
תכונות/Y | מוֹתֵחַ | uint8 | ||
תכונות/יום | ClassLabel | int64 | ||
תכונות/חודש | ClassLabel | int64 | ||
תכונות/גשם | מוֹתֵחַ | לצוף32 | ||
תכונות/טמפ' | מוֹתֵחַ | לצוף32 | ||
תכונות/רוח | מוֹתֵחַ | לצוף32 |
מפתחות בפיקוח (ראה
as_supervised
doc ):('area', 'features')
איור ( tfds.show_examples ): לא נתמך.
דוגמאות ( tfds.as_dataframe ):
- ציטוט :
@misc{Dua:2019 ,
author = "Dua, Dheeru and Graff, Casey",
year = "2017",
title = "{UCI} Machine Learning Repository",
url = "http://archive.ics.uci.edu/ml",
institution = "University of California, Irvine, School of Information and Computer Sciences" }
@article{cortez2007data,
title={A data mining approach to predict forest fires using meteorological data},
author={Cortez, Paulo and Morais, Anibal de Jesus Raimundo},
year={2007},
publisher={Associa{\c{c} }{\~a}o Portuguesa para a Intelig{\^e}ncia Artificial (APPIA)}
}