conll2003

  • الوصف :

تتعلق المهمة المشتركة لـ CoNLL-2003 بالتعرف على الكيانات المسماة المستقلة عن اللغة وتركز على أربعة أنواع من الكيانات المسماة: الأشخاص والمواقع والمؤسسات وأسماء الكيانات المتنوعة التي لا تنتمي إلى المجموعات الثلاث السابقة.

انشق، مزق أمثلة
'dev' 3،251
'test' 3،454
'train' 14،042
  • هيكل الميزة :
FeaturesDict({
    'chunks': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=23)),
    'ner': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=9)),
    'pos': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=47)),
    'tokens': Sequence(Text(shape=(), dtype=string)),
})
  • وثائق الميزة :
ميزة فصل شكل نوع وصف
الميزات
قطع تسلسل (ClassLabel) (لا أحد،) int64
نير تسلسل (ClassLabel) (لا أحد،) int64
نقاط البيع تسلسل (ClassLabel) (لا أحد،) int64
الرموز تسلسل (نص) (لا أحد،) سلسلة
  • الاقتباس :
@inproceedings{tjong-kim-sang-de-meulder-2003-introduction,
    title = "Introduction to the {C}o{NLL}-2003 Shared Task: Language-Independent Named Entity Recognition",
    author = "Tjong Kim Sang, Erik F.  and
      De Meulder, Fien",
    booktitle = "Proceedings of the Seventh Conference on Natural Language Learning at {HLT}-{NAACL} 2003",
    year = "2003",
    url = "https://www.aclweb.org/anthology/W03-0419",
    pages = "142--147",
}

conll2003 / conll2003 (التكوين الافتراضي)

و

  • الوصف :

تتعلق المهمة المشتركة لـ CoNLL-2003 بالتعرف على الكيانات المسماة المستقلة عن اللغة وتركز على أربعة أنواع من الكيانات المسماة: الأشخاص والمواقع والمؤسسات وأسماء الكيانات المتنوعة التي لا تنتمي إلى المجموعات الثلاث السابقة.

انشق، مزق أمثلة
'dev' 3،251
'test' 3،454
'train' 14،042
  • هيكل الميزة :
FeaturesDict({
    'chunks': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=23)),
    'ner': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=9)),
    'pos': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=47)),
    'tokens': Sequence(Text(shape=(), dtype=string)),
})
  • وثائق الميزة :
ميزة فصل شكل نوع وصف
الميزات
قطع تسلسل (ClassLabel) (لا أحد،) int64
نير تسلسل (ClassLabel) (لا أحد،) int64
نقاط البيع تسلسل (ClassLabel) (لا أحد،) int64
الرموز تسلسل (نص) (لا أحد،) سلسلة
  • الاقتباس :
@inproceedings{tjong-kim-sang-de-meulder-2003-introduction,
    title = "Introduction to the {C}o{NLL}-2003 Shared Task: Language-Independent Named Entity Recognition",
    author = "Tjong Kim Sang, Erik F.  and
      De Meulder, Fien",
    booktitle = "Proceedings of the Seventh Conference on Natural Language Learning at {HLT}-{NAACL} 2003",
    year = "2003",
    url = "https://www.aclweb.org/anthology/W03-0419",
    pages = "142--147",
}

conll2003 / conll2003 (التكوين الافتراضي)