mlqa

  • Mô tả :

MLQA (Bộ dữ liệu trả lời câu hỏi đa ngôn ngữ) là bộ dữ liệu chuẩn để đánh giá hiệu suất trả lời câu hỏi đa ngôn ngữ. Bộ dữ liệu bao gồm 7 ngôn ngữ: Ả Rập, Đức, Tây Ban Nha, Anh, Hindi, Việt Nam, Trung Quốc.

FeaturesDict({
    'answers': Sequence({
        'answer_start': int32,
        'text': Text(shape=(), dtype=string),
    }),
    'context': Text(shape=(), dtype=string),
    'id': string,
    'question': Text(shape=(), dtype=string),
    'title': Text(shape=(), dtype=string),
})
  • Tài liệu tính năng :
Tính năng Lớp học Hình dạng Dtype Sự miêu tả
Tính năngDict
câu trả lời Sự liên tiếp
câu trả lời/answer_start tenxơ int32
câu trả lời/văn bản Chữ sợi dây
bối cảnh Chữ sợi dây
nhận dạng tenxơ sợi dây
câu hỏi Chữ sợi dây
tiêu đề Chữ sợi dây
@article{lewis2019mlqa,
  title={MLQA: Evaluating Cross-lingual Extractive Question Answering},
  author={Lewis, Patrick and Ouguz, Barlas and Rinott, Ruty and Riedel,   Sebastian and Schwenk, Holger},
  journal={arXiv preprint arXiv:1910.07475},
  year={2019}
}

mlqa/ar (cấu hình mặc định)

  • Mô tả cấu hình : Phân tách thử nghiệm và phát triển MLQA 'ar'.

  • Kích thước tập dữ liệu : 9.28 MiB

  • Chia tách :

Tách ra ví dụ
'test' 5,335
'validation' 517

mlqa/de

  • Mô tả cấu hình : MLQA 'de' dev và test splits.

  • Kích thước tập dữ liệu : 5.06 MiB

  • Chia tách :

Tách ra ví dụ
'test' 4,517
'validation' 512

mlqa/vi

  • Mô tả cấu hình : MLQA 'en' dev và test splits.

  • Kích thước tập dữ liệu : 15.72 MiB

  • Chia tách :

Tách ra ví dụ
'test' 11.590
'validation' 1.148

mlqa/es

  • Mô tả cấu hình : Các phần tách thử nghiệm và phát triển của MLQA 'es'.

  • Kích thước tập dữ liệu : 5.09 MiB

  • Chia tách :

Tách ra ví dụ
'test' 5,253
'validation' 500

mlqa/hi

  • Mô tả cấu hình : MLQA 'hi' dev và test splits.

  • Kích thước tập dữ liệu : 12.83 MiB

  • Chia tách :

Tách ra ví dụ
'test' 4.918
'validation' 507

mlqa/vi

  • Mô tả cấu hình : Phân tách thử nghiệm và phát triển 'vi' của MLQA.

  • Kích thước tập dữ liệu : 8.77 MiB

  • Chia tách :

Tách ra ví dụ
'test' 5,495
'validation' 511

mlqa/zh

  • Mô tả cấu hình : Phân tách thử nghiệm và phát triển MLQA 'zh'.

  • Kích thước tập dữ liệu : 5.13 MiB

  • Chia tách :

Tách ra ví dụ
'test' 5,137
'validation' 504