conll2003

 • Mô tả :

Nhiệm vụ chung của CoNLL-2003 liên quan đến nhận dạng thực thể được đặt tên độc lập với ngôn ngữ và tập trung vào bốn loại thực thể được đặt tên: người, địa điểm, tổ chức và tên của các thực thể linh tinh không thuộc ba nhóm trước đó.

Tách ra ví dụ
'dev' 3,251
'test' 3,454
'train' 14,042
 • Cấu trúc tính năng :
FeaturesDict({
  'chunks': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=23)),
  'ner': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=9)),
  'pos': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=47)),
  'tokens': Sequence(Text(shape=(), dtype=string)),
})
 • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự miêu tả
Tính năngDict
miếng, mảnh nhỏ Trình tự (Nhãn lớp) (Không có,) int64
ner Trình tự (Nhãn lớp) (Không có,) int64
tư thế Trình tự (Nhãn lớp) (Không có,) int64
mã thông báo Trình tự (Văn bản) (Không có,) chuỗi
 • trích dẫn :
@inproceedings{tjong-kim-sang-de-meulder-2003-introduction,
  title = "Introduction to the {C}o{NLL}-2003 Shared Task: Language-Independent Named Entity Recognition",
  author = "Tjong Kim Sang, Erik F. and
   De Meulder, Fien",
  booktitle = "Proceedings of the Seventh Conference on Natural Language Learning at {HLT}-{NAACL} 2003",
  year = "2003",
  url = "https://www.aclweb.org/anthology/W03-0419",
  pages = "142--147",
}

conll2003/conll2003 (cấu hình mặc định)

,

 • Mô tả :

Nhiệm vụ chung của CoNLL-2003 liên quan đến nhận dạng thực thể được đặt tên độc lập với ngôn ngữ và tập trung vào bốn loại thực thể được đặt tên: người, địa điểm, tổ chức và tên của các thực thể linh tinh không thuộc ba nhóm trước đó.

Tách ra ví dụ
'dev' 3,251
'test' 3,454
'train' 14,042
 • Cấu trúc tính năng :
FeaturesDict({
  'chunks': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=23)),
  'ner': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=9)),
  'pos': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=47)),
  'tokens': Sequence(Text(shape=(), dtype=string)),
})
 • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự miêu tả
Tính năngDict
miếng, mảnh nhỏ Trình tự (Nhãn lớp) (Không có,) int64
ner Trình tự (Nhãn lớp) (Không có,) int64
tư thế Trình tự (Nhãn lớp) (Không có,) int64
mã thông báo Trình tự (Văn bản) (Không có,) chuỗi
 • trích dẫn :
@inproceedings{tjong-kim-sang-de-meulder-2003-introduction,
  title = "Introduction to the {C}o{NLL}-2003 Shared Task: Language-Independent Named Entity Recognition",
  author = "Tjong Kim Sang, Erik F. and
   De Meulder, Fien",
  booktitle = "Proceedings of the Seventh Conference on Natural Language Learning at {HLT}-{NAACL} 2003",
  year = "2003",
  url = "https://www.aclweb.org/anthology/W03-0419",
  pages = "142--147",
}

conll2003/conll2003 (cấu hình mặc định)