conll2003

  • বর্ণনা :

CoNLL-2003-এর ভাগ করা কাজটি ভাষা-স্বাধীন নামকৃত সত্তার স্বীকৃতি নিয়ে উদ্বিগ্ন এবং চার ধরনের নামধারী সত্তার উপর মনোনিবেশ করে: ব্যক্তি, অবস্থান, সংস্থা এবং বিবিধ সত্ত্বার নাম যা পূর্ববর্তী তিনটি গোষ্ঠীর অন্তর্গত নয়।

বিভক্ত উদাহরণ
'dev' 3,251
'test' ৩,৪৫৪
'train' 14,042
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'chunks': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=23)),
    'ner': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=9)),
    'pos': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=47)),
    'tokens': Sequence(Text(shape=(), dtype=string)),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
খণ্ড সিকোয়েন্স (ক্লাসলেবেল) (কোনটিই নয়,) int64
ner সিকোয়েন্স (ক্লাসলেবেল) (কোনটিই নয়,) int64
অবস্থান সিকোয়েন্স (ক্লাসলেবেল) (কোনটিই নয়,) int64
টোকেন ক্রম (পাঠ্য) (কোনটিই নয়,) স্ট্রিং
  • উদ্ধৃতি :
@inproceedings{tjong-kim-sang-de-meulder-2003-introduction,
    title = "Introduction to the {C}o{NLL}-2003 Shared Task: Language-Independent Named Entity Recognition",
    author = "Tjong Kim Sang, Erik F.  and
      De Meulder, Fien",
    booktitle = "Proceedings of the Seventh Conference on Natural Language Learning at {HLT}-{NAACL} 2003",
    year = "2003",
    url = "https://www.aclweb.org/anthology/W03-0419",
    pages = "142--147",
}

conll2003/conll2003 (ডিফল্ট কনফিগারেশন)

,

  • বর্ণনা :

CoNLL-2003-এর ভাগ করা কাজটি ভাষা-স্বাধীন নামকৃত সত্তার স্বীকৃতি নিয়ে উদ্বিগ্ন এবং চার ধরনের নামধারী সত্তার উপর মনোনিবেশ করে: ব্যক্তি, অবস্থান, সংস্থা এবং বিবিধ সত্ত্বার নাম যা পূর্ববর্তী তিনটি গোষ্ঠীর অন্তর্গত নয়।

বিভক্ত উদাহরণ
'dev' 3,251
'test' ৩,৪৫৪
'train' 14,042
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'chunks': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=23)),
    'ner': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=9)),
    'pos': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=47)),
    'tokens': Sequence(Text(shape=(), dtype=string)),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
খণ্ড সিকোয়েন্স (ক্লাসলেবেল) (কোনটিই নয়,) int64
ner সিকোয়েন্স (ক্লাসলেবেল) (কোনটিই নয়,) int64
অবস্থান সিকোয়েন্স (ক্লাসলেবেল) (কোনটিই নয়,) int64
টোকেন ক্রম (পাঠ্য) (কোনটিই নয়,) স্ট্রিং
  • উদ্ধৃতি :
@inproceedings{tjong-kim-sang-de-meulder-2003-introduction,
    title = "Introduction to the {C}o{NLL}-2003 Shared Task: Language-Independent Named Entity Recognition",
    author = "Tjong Kim Sang, Erik F.  and
      De Meulder, Fien",
    booktitle = "Proceedings of the Seventh Conference on Natural Language Learning at {HLT}-{NAACL} 2003",
    year = "2003",
    url = "https://www.aclweb.org/anthology/W03-0419",
    pages = "142--147",
}

conll2003/conll2003 (ডিফল্ট কনফিগারেশন)