- תיאור :
מערך הנתונים של Yahoo Learning to Rank Challenge (נקרא גם "C14") הוא מערך נתונים של למידה לדירוג שפורסם על ידי Yahoo. מערך הנתונים מורכב מזוגות שאילתה-מסמכים המיוצגים בתור וקטורים של תכונה ותוויות שיפוט מתאימות של רלוונטיות.
מערך הנתונים מכיל שתי גרסאות:
-
set1
: מכיל 709,877 זוגות שאילתה-מסמכים. -
set2
: מכיל 172,870 זוגות שאילתה-מסמכים.
אתה יכול לציין אם להשתמש בגרסת set1
או set2
של מערך הנתונים באופן הבא:
ds = tfds.load("yahoo_ltrc/set1")
ds = tfds.load("yahoo_ltrc/set2")
אם צוין רק yahoo_ltrc
, האפשרות yahoo_ltrc/set1
נבחרה כברירת מחדל:
# This is the same as `tfds.load("yahoo_ltrc/set1")`
ds = tfds.load("yahoo_ltrc")
דף הבית : https://research.yahoo.com/datasets
קוד מקור :
tfds.ranking.yahoo_ltrc.YahooLTRC
גרסאות :
-
1.0.0
: שחרור ראשוני. -
1.1.0
(ברירת מחדל): הוסף מזהי שאילתה ומזהי מסמכים.
-
גודל הורדה :
Unknown size
הוראות הורדה ידניות : מערך נתונים זה מחייב אותך להוריד את נתוני המקור באופן ידני אל
download_config.manual_dir
(ברירת המחדל היא~/tensorflow_datasets/downloads/manual/
):
בקש גישה למערך הנתונים C14 Yahoo Learning To Rank Challenge ב- https://research.yahoo.com/datasets חלץ את הקובץdataset.tgz
שהורדת והצב את הקובץltrc_yahoo.tar.bz2
ב-manual_dir/
.מפתחות בפיקוח (ראה
as_supervised
doc ):None
איור ( tfds.show_examples ): לא נתמך.
ציטוט :
@inproceedings{chapelle2011yahoo,
title={Yahoo! learning to rank challenge overview},
author={Chapelle, Olivier and Chang, Yi},
booktitle={Proceedings of the learning to rank challenge},
pages={1--24},
year={2011},
organization={PMLR}
}
yahoo_ltrc/set1 (תצורת ברירת המחדל)
גודל מערך נתונים :
795.39 MiB
שמירה אוטומטית במטמון ( תיעוד ): לא
פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'test' | 6,983 |
'train' | 19,944 |
'vali' | 2,994 |
- מבנה תכונה :
FeaturesDict({
'doc_id': Tensor(shape=(None,), dtype=int64),
'float_features': Tensor(shape=(None, 699), dtype=float64),
'label': Tensor(shape=(None,), dtype=float64),
'query_id': Text(shape=(), dtype=string),
})
- תיעוד תכונה :
תכונה | מעמד | צוּרָה | Dtype | תיאור |
---|---|---|---|---|
FeaturesDict | ||||
doc_id | מוֹתֵחַ | (אף אחד,) | int64 | |
לצוף_תכונות | מוֹתֵחַ | (אין, 699) | לצוף64 | |
תווית | מוֹתֵחַ | (אף אחד,) | לצוף64 | |
query_id | טֶקסט | חוּט |
- דוגמאות ( tfds.as_dataframe ):
yahoo_ltrc/set2
גודל ערכת נתונים:
194.92 MiB
שמור אוטומטי במטמון ( תיעוד ): כן
פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'test' | 3,798 |
'train' | 1,266 |
'vali' | 1,266 |
- מבנה תכונה :
FeaturesDict({
'doc_id': Tensor(shape=(None,), dtype=int64),
'float_features': Tensor(shape=(None, 700), dtype=float64),
'label': Tensor(shape=(None,), dtype=float64),
'query_id': Text(shape=(), dtype=string),
})
- תיעוד תכונה :
תכונה | מעמד | צוּרָה | Dtype | תיאור |
---|---|---|---|---|
FeaturesDict | ||||
doc_id | מוֹתֵחַ | (אף אחד,) | int64 | |
לצוף_תכונות | מוֹתֵחַ | (אין, 700) | לצוף64 | |
תווית | מוֹתֵחַ | (אף אחד,) | לצוף64 | |
query_id | טֶקסט | חוּט |
- דוגמאות ( tfds.as_dataframe ):