yahoo_ltrc

  • תיאור :

מערך הנתונים של Yahoo Learning to Rank Challenge (נקרא גם "C14") הוא מערך נתונים של למידה לדירוג שפורסם על ידי Yahoo. מערך הנתונים מורכב מזוגות שאילתה-מסמכים המיוצגים בתור וקטורים של תכונה ותוויות שיפוט מתאימות של רלוונטיות.

מערך הנתונים מכיל שתי גרסאות:

  • set1 : מכיל 709,877 זוגות שאילתה-מסמכים.
  • set2 : מכיל 172,870 זוגות שאילתה-מסמכים.

אתה יכול לציין אם להשתמש בגרסת set1 או set2 של מערך הנתונים באופן הבא:

ds = tfds.load("yahoo_ltrc/set1")
ds = tfds.load("yahoo_ltrc/set2")

אם צוין רק yahoo_ltrc , האפשרות yahoo_ltrc/set1 נבחרה כברירת מחדל:

# This is the same as `tfds.load("yahoo_ltrc/set1")`
ds = tfds.load("yahoo_ltrc")
  • דף הבית : https://research.yahoo.com/datasets

  • קוד מקור : tfds.ranking.yahoo_ltrc.YahooLTRC

  • גרסאות :

    • 1.0.0 : שחרור ראשוני.
    • 1.1.0 (ברירת מחדל): הוסף מזהי שאילתה ומזהי מסמכים.
  • גודל הורדה : Unknown size

  • הוראות הורדה ידניות : מערך נתונים זה מחייב אותך להוריד את נתוני המקור באופן ידני אל download_config.manual_dir (ברירת המחדל היא ~/tensorflow_datasets/downloads/manual/ ):
    בקש גישה למערך הנתונים C14 Yahoo Learning To Rank Challenge ב- https://research.yahoo.com/datasets חלץ את הקובץ dataset.tgz שהורדת והצב את הקובץ ltrc_yahoo.tar.bz2 ב- manual_dir/ .

  • מפתחות בפיקוח (ראה as_supervised doc ): None

  • איור ( tfds.show_examples ): לא נתמך.

  • ציטוט :

@inproceedings{chapelle2011yahoo,
  title={Yahoo! learning to rank challenge overview},
  author={Chapelle, Olivier and Chang, Yi},
  booktitle={Proceedings of the learning to rank challenge},
  pages={1--24},
  year={2011},
  organization={PMLR}
}

yahoo_ltrc/set1 (תצורת ברירת המחדל)

  • גודל מערך נתונים : 795.39 MiB

  • שמירה אוטומטית במטמון ( תיעוד ): לא

  • פיצולים :

לְפַצֵל דוגמאות
'test' 6,983
'train' 19,944
'vali' 2,994
  • מבנה תכונה :
FeaturesDict({
    'doc_id': Tensor(shape=(None,), dtype=int64),
    'float_features': Tensor(shape=(None, 699), dtype=float64),
    'label': Tensor(shape=(None,), dtype=float64),
    'query_id': Text(shape=(), dtype=string),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
doc_id מוֹתֵחַ (אף אחד,) int64
לצוף_תכונות מוֹתֵחַ (אין, 699) לצוף64
תווית מוֹתֵחַ (אף אחד,) לצוף64
query_id טֶקסט חוּט

yahoo_ltrc/set2

  • גודל ערכת נתונים: 194.92 MiB

  • שמור אוטומטי במטמון ( תיעוד ): כן

  • פיצולים :

לְפַצֵל דוגמאות
'test' 3,798
'train' 1,266
'vali' 1,266
  • מבנה תכונה :
FeaturesDict({
    'doc_id': Tensor(shape=(None,), dtype=int64),
    'float_features': Tensor(shape=(None, 700), dtype=float64),
    'label': Tensor(shape=(None,), dtype=float64),
    'query_id': Text(shape=(), dtype=string),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
doc_id מוֹתֵחַ (אף אחד,) int64
לצוף_תכונות מוֹתֵחַ (אין, 700) לצוף64
תווית מוֹתֵחַ (אף אחד,) לצוף64
query_id טֶקסט חוּט