mslr_web

  • Mô tả :

MSLR-WEB là hai bộ dữ liệu Học tập để Xếp hạng quy mô lớn do Microsoft Research phát hành. Tập dữ liệu đầu tiên (gọi là "30k") chứa 30.000 truy vấn và tập dữ liệu thứ hai (gọi là "10k") chứa 10.000 truy vấn. Mỗi tập dữ liệu bao gồm các cặp tài liệu truy vấn được biểu diễn dưới dạng vectơ đặc trưng và nhãn đánh giá mức độ phù hợp tương ứng.

Bạn có thể chỉ định nên sử dụng phiên bản "10k" hay "30k" của bộ dữ liệu và một nếp gấp tương ứng, như sau:

ds = tfds.load("mslr_web/30k_fold1")

Nếu chỉ mslr_web được chỉ định, tùy chọn mslr_web/10k_fold1 được chọn theo mặc định:

# This is the same as `tfds.load("mslr_web/10k_fold1")`
ds = tfds.load("mslr_web")
FeaturesDict({
    'doc_id': Tensor(shape=(None,), dtype=int64),
    'float_features': Tensor(shape=(None, 136), dtype=float64),
    'label': Tensor(shape=(None,), dtype=float64),
    'query_id': Text(shape=(), dtype=string),
})
  • Tài liệu tính năng :
Đặc tính Tầng lớp Hình dạng Dtype Sự miêu tả
Tính năngDict
doc_id tenxơ (Không có,) int64
float_features tenxơ (Không có, 136) phao64
nhãn tenxơ (Không có,) phao64
query_id Chữ chuỗi
@article{DBLP:journals/corr/QinL13,
  author    = {Tao Qin and Tie{-}Yan Liu},
  title     = {Introducing {LETOR} 4.0 Datasets},
  journal   = {CoRR},
  volume    = {abs/1306.2597},
  year      = {2013},
  url       = {http://arxiv.org/abs/1306.2597},
  timestamp = {Mon, 01 Jul 2013 20:31:25 +0200},
  biburl    = {http://dblp.uni-trier.de/rec/bib/journals/corr/QinL13},
  bibsource = {dblp computer science bibliography, http://dblp.org}
}

mslr_web/10k_fold1 (cấu hình mặc định)

  • Kích thước tải xuống : 1.15 GiB

  • Kích thước tập dữ liệu : 310.08 MiB

  • Chia tách :

Tách ra ví dụ
'test' 2.000
'train' 6.000
'vali' 2.000

mslr_web/10k_fold2

  • Kích thước tải xuống : 1.15 GiB

  • Kích thước tập dữ liệu : 310.08 MiB

  • Chia tách :

Tách ra ví dụ
'test' 2.000
'train' 6.000
'vali' 2.000

mslr_web/10k_fold3

  • Kích thước tải xuống : 1.15 GiB

  • Kích thước tập dữ liệu : 310.08 MiB

  • Chia tách :

Tách ra ví dụ
'test' 2.000
'train' 6.000
'vali' 2.000

mslr_web/10k_fold4

  • Kích thước tải xuống : 1.15 GiB

  • Kích thước tập dữ liệu : 310.08 MiB

  • Chia tách :

Tách ra ví dụ
'test' 2.000
'train' 6.000
'vali' 2.000

mslr_web/10k_fold5

  • Kích thước tải xuống : 1.15 GiB

  • Kích thước tập dữ liệu : 310.08 MiB

  • Chia tách :

Tách ra ví dụ
'test' 2.000
'train' 6.000
'vali' 2.000

mslr_web/30k_fold1

  • Kích thước tải xuống : 3.59 GiB

  • Kích thước tập dữ liệu : 964.09 MiB

  • Chia tách :

Tách ra ví dụ
'test' 6,306
'train' 18,919
'vali' 6,306

mslr_web/30k_fold2

  • Kích thước tải xuống : 3.59 GiB

  • Kích thước tập dữ liệu : 964.09 MiB

  • Chia tách :

Tách ra ví dụ
'test' 6,307
'train' 18,918
'vali' 6,306

mslr_web/30k_fold3

  • Kích thước tải xuống : 3.59 GiB

  • Kích thước tập dữ liệu : 964.09 MiB

  • Chia tách :

Tách ra ví dụ
'test' 6,306
'train' 18,918
'vali' 6,307

mslr_web/30k_fold4

  • Kích thước tải xuống : 3.59 GiB

  • Kích thước tập dữ liệu : 964.09 MiB

  • Chia tách :

Tách ra ví dụ
'test' 6,306
'train' 18,919
'vali' 6,306

mslr_web/30k_fold5

  • Kích thước tải xuống : 3.59 GiB

  • Kích thước tập dữ liệu : 964.09 MiB

  • Chia tách :

Tách ra ví dụ
'test' 6,306
'train' 18,919
'vali' 6,306