mslr_web

با مجموعه‌ها، منظم بمانید ذخیره و دسته‌بندی محتوا براساس اولویت‌های شما.

  • توضیحات :

MSLR-WEB دو مجموعه داده یادگیری به رتبه در مقیاس بزرگ هستند که توسط Microsoft Research منتشر شده اند. مجموعه داده اول (به نام "30k") شامل 30000 پرس و جو و مجموعه داده دوم (به نام "10k") شامل 10000 پرس و جو است. هر مجموعه داده شامل جفت‌های پرس و جو-سند است که به‌عنوان بردارهای ویژگی و برچسب‌های قضاوت مربوطه نشان داده می‌شوند.

شما می توانید تعیین کنید که آیا از نسخه "10k" یا "30k" مجموعه داده و یک فولد مربوطه استفاده شود، به صورت زیر:

ds = tfds.load("mslr_web/30k_fold1")

اگر فقط mslr_web مشخص شده باشد، گزینه mslr_web/10k_fold1 به طور پیش فرض انتخاب می شود:

# This is the same as `tfds.load("mslr_web/10k_fold1")`
ds = tfds.load("mslr_web")
FeaturesDict({
    'doc_id': Tensor(shape=(None,), dtype=int64),
    'float_features': Tensor(shape=(None, 136), dtype=float64),
    'label': Tensor(shape=(None,), dtype=float64),
    'query_id': Text(shape=(), dtype=string),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
doc_id تانسور (هیچ یک،) int64
float_features تانسور (هیچ، 136) float64
برچسب تانسور (هیچ یک،) float64
query_id متن رشته
@article{DBLP:journals/corr/QinL13,
  author    = {Tao Qin and Tie{-}Yan Liu},
  title     = {Introducing {LETOR} 4.0 Datasets},
  journal   = {CoRR},
  volume    = {abs/1306.2597},
  year      = {2013},
  url       = {http://arxiv.org/abs/1306.2597},
  timestamp = {Mon, 01 Jul 2013 20:31:25 +0200},
  biburl    = {http://dblp.uni-trier.de/rec/bib/journals/corr/QinL13},
  bibsource = {dblp computer science bibliography, http://dblp.org}
}

mslr_web/10k_fold1 (پیکربندی پیش‌فرض)

  • حجم دانلود : 1.15 GiB

  • حجم مجموعه داده : 310.08 MiB

  • تقسیم ها :

شکاف مثال ها
'test' 2000
'train' 6000
'vali' 2000

mslr_web/10k_fold2

  • حجم دانلود : 1.15 GiB

  • حجم مجموعه داده : 310.08 MiB

  • تقسیم ها :

شکاف مثال ها
'test' 2000
'train' 6000
'vali' 2000

mslr_web/10k_fold3

  • حجم دانلود : 1.15 GiB

  • حجم مجموعه داده : 310.08 MiB

  • تقسیم ها :

شکاف مثال ها
'test' 2000
'train' 6000
'vali' 2000

mslr_web/10k_fold4

  • حجم دانلود : 1.15 GiB

  • حجم مجموعه داده : 310.08 MiB

  • تقسیم ها :

شکاف مثال ها
'test' 2000
'train' 6000
'vali' 2000

mslr_web/10k_fold5

  • حجم دانلود : 1.15 GiB

  • حجم مجموعه داده : 310.08 MiB

  • تقسیم ها :

شکاف مثال ها
'test' 2000
'train' 6000
'vali' 2000

mslr_web/30k_fold1

  • حجم دانلود : 3.59 GiB

  • حجم مجموعه داده : 964.09 MiB

  • تقسیم ها :

شکاف مثال ها
'test' 6,306
'train' 18919
'vali' 6,306

mslr_web/30k_fold2

  • حجم دانلود : 3.59 GiB

  • حجم مجموعه داده : 964.09 MiB

  • تقسیم ها :

شکاف مثال ها
'test' 6,307
'train' 18918
'vali' 6,306

mslr_web/30k_fold3

  • حجم دانلود : 3.59 GiB

  • حجم مجموعه داده : 964.09 MiB

  • تقسیم ها :

شکاف مثال ها
'test' 6,306
'train' 18918
'vali' 6,307

mslr_web/30k_fold4

  • حجم دانلود : 3.59 GiB

  • حجم مجموعه داده : 964.09 MiB

  • تقسیم ها :

شکاف مثال ها
'test' 6,306
'train' 18919
'vali' 6,306

mslr_web/30k_fold5

  • حجم دانلود : 3.59 GiB

  • حجم مجموعه داده : 964.09 MiB

  • تقسیم ها :

شکاف مثال ها
'test' 6,306
'train' 18919
'vali' 6,306