याहू_ltrc

  • विवरण :

Yahoo Learning to Rank Challenge डेटासेट (जिसे "C14" भी कहा जाता है) Yahoo द्वारा जारी किया गया एक लर्निंग-टू-रैंक डेटासेट है। डेटासेट में क्वेरी-दस्तावेज़ जोड़े होते हैं जो फ़ीचर वैक्टर और संबंधित प्रासंगिकता निर्णय लेबल के रूप में दर्शाए जाते हैं।

डेटासेट में दो संस्करण होते हैं:

  • सेट 1: set1 क्वेरी-दस्तावेज़ जोड़े शामिल हैं।
  • सेट 2: set2 क्वेरी-दस्तावेज़ जोड़े शामिल हैं।

आप इस प्रकार निर्दिष्ट कर सकते हैं कि set1 के सेट1 या set2 संस्करण का उपयोग करना है या नहीं:

ds = tfds.load("yahoo_ltrc/set1")
ds = tfds.load("yahoo_ltrc/set2")

यदि केवल yahoo_ltrc निर्दिष्ट किया गया है, तो yahoo_ltrc/set1 विकल्प डिफ़ॉल्ट रूप से चुना जाता है:

# This is the same as `tfds.load("yahoo_ltrc/set1")`
ds = tfds.load("yahoo_ltrc")
  • होमपेज : https://research.yahoo.com/datasets

  • स्रोत कोड : tfds.ranking.yahoo_ltrc.YahooLTRC

  • संस्करण :

    • 1.0.0 : प्रारंभिक रिलीज।
    • 1.1.0 (डिफ़ॉल्ट): क्वेरी और दस्तावेज़ पहचानकर्ता जोड़ें।
  • डाउनलोड आकार : Unknown size

  • मैन्युअल डाउनलोड निर्देश : इस डेटासेट के लिए आपको स्रोत डेटा को मैन्युअल रूप से download_config.manual_dir (डिफ़ॉल्ट रूप से ~/tensorflow_datasets/downloads/manual/ ) में डाउनलोड करना होगा:
    https://research.yahoo.com/datasets पर C14 Yahoo Learning To Rank Challenge डेटासेट के लिए एक्सेस का अनुरोध करें डाउनलोड की गई डेटासेट. ltrc_yahoo.tar.bz2 dataset.tgz को manual_dir/ में रखें।

  • पर्यवेक्षित कुंजियाँ ( as_supervised doc देखें): None

  • चित्र ( tfds.show_examples ): समर्थित नहीं है।

  • उद्धरण :

@inproceedings{chapelle2011yahoo,
  title={Yahoo! learning to rank challenge overview},
  author={Chapelle, Olivier and Chang, Yi},
  booktitle={Proceedings of the learning to rank challenge},
  pages={1--24},
  year={2011},
  organization={PMLR}
}

yahoo_ltrc/set1 (डिफ़ॉल्ट कॉन्फ़िगरेशन)

विभाजित करना उदाहरण
'test' 6,983
'train' 19,944
'vali' 2,994
  • फ़ीचर संरचना :
FeaturesDict({
    'doc_id': Tensor(shape=(None,), dtype=int64),
    'float_features': Tensor(shape=(None, 699), dtype=float64),
    'label': Tensor(shape=(None,), dtype=float64),
    'query_id': Text(shape=(), dtype=string),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
विशेषताएं डिक्ट
doc_id टेन्सर (कोई भी नहीं,) int64
फ्लोट_फीचर्स टेन्सर (कोई नहीं, 699) फ्लोट64
लेबल टेन्सर (कोई भी नहीं,) फ्लोट64
query_id लेख डोरी

याहू_एलटीआरसी/सेट2

विभाजित करना उदाहरण
'test' 3,798
'train' 1,266
'vali' 1,266
  • फ़ीचर संरचना :
FeaturesDict({
    'doc_id': Tensor(shape=(None,), dtype=int64),
    'float_features': Tensor(shape=(None, 700), dtype=float64),
    'label': Tensor(shape=(None,), dtype=float64),
    'query_id': Text(shape=(), dtype=string),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
विशेषताएं डिक्ट
doc_id टेन्सर (कोई भी नहीं,) int64
फ्लोट_फीचर्स टेन्सर (कोई नहीं, 700) फ्लोट64
लेबल टेन्सर (कोई भी नहीं,) फ्लोट64
query_id लेख डोरी