conll2003

  • विवरण :

CoNLL-2003 का साझा कार्य भाषा-स्वतंत्र नामित इकाई मान्यता से संबंधित है और चार प्रकार की नामित संस्थाओं पर ध्यान केंद्रित करता है: व्यक्ति, स्थान, संगठन और विविध संस्थाओं के नाम जो पिछले तीन समूहों से संबंधित नहीं हैं।

विभाजित करना उदाहरण
'dev' 3,251
'test' 3,454
'train' 14,042
  • फ़ीचर संरचना :
FeaturesDict({
    'chunks': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=23)),
    'ner': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=9)),
    'pos': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=47)),
    'tokens': Sequence(Text(shape=(), dtype=string)),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
विशेषताएं डिक्ट
हिस्सा अनुक्रम (कक्षा लेबल) (कोई भी नहीं,) int64
नेर अनुक्रम (कक्षा लेबल) (कोई भी नहीं,) int64
स्थिति अनुक्रम (कक्षा लेबल) (कोई भी नहीं,) int64
टोकन अनुक्रम (पाठ) (कोई भी नहीं,) डोरी
  • उद्धरण :
@inproceedings{tjong-kim-sang-de-meulder-2003-introduction,
    title = "Introduction to the {C}o{NLL}-2003 Shared Task: Language-Independent Named Entity Recognition",
    author = "Tjong Kim Sang, Erik F.  and
      De Meulder, Fien",
    booktitle = "Proceedings of the Seventh Conference on Natural Language Learning at {HLT}-{NAACL} 2003",
    year = "2003",
    url = "https://www.aclweb.org/anthology/W03-0419",
    pages = "142--147",
}

conll2003/conll2003 (डिफ़ॉल्ट कॉन्फ़िगरेशन)

,

  • विवरण :

CoNLL-2003 का साझा कार्य भाषा-स्वतंत्र नामित इकाई मान्यता से संबंधित है और चार प्रकार की नामित संस्थाओं पर ध्यान केंद्रित करता है: व्यक्ति, स्थान, संगठन और विविध संस्थाओं के नाम जो पिछले तीन समूहों से संबंधित नहीं हैं।

विभाजित करना उदाहरण
'dev' 3,251
'test' 3,454
'train' 14,042
  • फ़ीचर संरचना :
FeaturesDict({
    'chunks': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=23)),
    'ner': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=9)),
    'pos': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=47)),
    'tokens': Sequence(Text(shape=(), dtype=string)),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
विशेषताएं डिक्ट
हिस्सा अनुक्रम (कक्षा लेबल) (कोई भी नहीं,) int64
नेर अनुक्रम (कक्षा लेबल) (कोई भी नहीं,) int64
स्थिति अनुक्रम (कक्षा लेबल) (कोई भी नहीं,) int64
टोकन अनुक्रम (पाठ) (कोई भी नहीं,) डोरी
  • उद्धरण :
@inproceedings{tjong-kim-sang-de-meulder-2003-introduction,
    title = "Introduction to the {C}o{NLL}-2003 Shared Task: Language-Independent Named Entity Recognition",
    author = "Tjong Kim Sang, Erik F.  and
      De Meulder, Fien",
    booktitle = "Proceedings of the Seventh Conference on Natural Language Learning at {HLT}-{NAACL} 2003",
    year = "2003",
    url = "https://www.aclweb.org/anthology/W03-0419",
    pages = "142--147",
}

conll2003/conll2003 (डिफ़ॉल्ट कॉन्फ़िगरेशन)