conll2003

  • คำอธิบาย :

งานที่ใช้ร่วมกันของ CoNLL-2003 เกี่ยวข้องกับการรับรู้เอนทิตีที่มีชื่อโดยไม่ขึ้นกับภาษา และมุ่งเน้นไปที่เอนทิตีที่มีชื่อสี่ประเภท ได้แก่ บุคคล สถานที่ องค์กร และชื่อของเอนทิตีเบ็ดเตล็ดที่ไม่ได้อยู่ในสามกลุ่มก่อนหน้านี้

แยก ตัวอย่าง
'dev' 3,251
'test' 3,454
'train' 14,042
  • โครงสร้างคุณลักษณะ :
FeaturesDict({
    'chunks': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=23)),
    'ner': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=9)),
    'pos': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=47)),
    'tokens': Sequence(Text(shape=(), dtype=string)),
})
  • เอกสารคุณสมบัติ :
คุณสมบัติ ระดับ รูปร่าง Dประเภท คำอธิบาย
คุณสมบัติDict
ชิ้น ลำดับ (ClassLabel) (ไม่มี,) int64
เนิร์ด ลำดับ (ClassLabel) (ไม่มี,) int64
ตำแหน่ง ลำดับ (ClassLabel) (ไม่มี,) int64
โทเค็น ลำดับ (ข้อความ) (ไม่มี,) สตริง
  • การอ้างอิง :
@inproceedings{tjong-kim-sang-de-meulder-2003-introduction,
    title = "Introduction to the {C}o{NLL}-2003 Shared Task: Language-Independent Named Entity Recognition",
    author = "Tjong Kim Sang, Erik F.  and
      De Meulder, Fien",
    booktitle = "Proceedings of the Seventh Conference on Natural Language Learning at {HLT}-{NAACL} 2003",
    year = "2003",
    url = "https://www.aclweb.org/anthology/W03-0419",
    pages = "142--147",
}

conll2003/conll2003 (ค่าเริ่มต้น)

,

  • คำอธิบาย :

งานที่ใช้ร่วมกันของ CoNLL-2003 เกี่ยวข้องกับการรับรู้เอนทิตีที่มีชื่อโดยไม่ขึ้นกับภาษา และมุ่งเน้นไปที่เอนทิตีที่มีชื่อสี่ประเภท ได้แก่ บุคคล สถานที่ องค์กร และชื่อของเอนทิตีเบ็ดเตล็ดที่ไม่ได้อยู่ในสามกลุ่มก่อนหน้านี้

แยก ตัวอย่าง
'dev' 3,251
'test' 3,454
'train' 14,042
  • โครงสร้างคุณลักษณะ :
FeaturesDict({
    'chunks': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=23)),
    'ner': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=9)),
    'pos': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=47)),
    'tokens': Sequence(Text(shape=(), dtype=string)),
})
  • เอกสารคุณสมบัติ :
คุณสมบัติ ระดับ รูปร่าง Dประเภท คำอธิบาย
คุณสมบัติDict
ชิ้น ลำดับ (ClassLabel) (ไม่มี,) int64
เนิร์ด ลำดับ (ClassLabel) (ไม่มี,) int64
ตำแหน่ง ลำดับ (ClassLabel) (ไม่มี,) int64
โทเค็น ลำดับ (ข้อความ) (ไม่มี,) สตริง
  • การอ้างอิง :
@inproceedings{tjong-kim-sang-de-meulder-2003-introduction,
    title = "Introduction to the {C}o{NLL}-2003 Shared Task: Language-Independent Named Entity Recognition",
    author = "Tjong Kim Sang, Erik F.  and
      De Meulder, Fien",
    booktitle = "Proceedings of the Seventh Conference on Natural Language Learning at {HLT}-{NAACL} 2003",
    year = "2003",
    url = "https://www.aclweb.org/anthology/W03-0419",
    pages = "142--147",
}

conll2003/conll2003 (ค่าเริ่มต้น)