zbierz2002

 • opis :

Wspólne zadanie CoNLL-2002 dotyczy niezależnego od języka rozpoznawania nazwanych jednostek. Typy nazwanych podmiotów obejmują: osoby, lokalizacje, organizacje oraz nazwy różnych podmiotów, które nie należą do poprzednich trzech grup. Uczestnikom wspólnego zadania zaproponowano szkolenie i dane testowe dla co najmniej dwóch języków. W tym zadaniu udostępnionym mogły zostać użyte źródła informacji inne niż dane szkoleniowe.

@inproceedings{tjong-kim-sang-2002-introduction,
  title = "Introduction to the {C}o{NLL}-2002 Shared Task: Language-Independent Named Entity Recognition",
  author = "Tjong Kim Sang, Erik F.",
  booktitle = "{COLING}-02: The 6th Conference on Natural Language Learning 2002 ({C}o{NLL}-2002)",
  year = "2002",
  url = "https://aclanthology.org/W02-2024",
}

conll2002/es (domyślna konfiguracja)

 • Rozmiar pliku do pobrania : 3.95 MiB

 • Rozmiar zestawu danych : 3.52 MiB

 • Podziały :

Podział Przykłady
'dev' 1916
'test' 1518
'train' 8324
 • Struktura funkcji :
FeaturesDict({
  'ner': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=9)),
  'pos': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=60)),
  'tokens': Sequence(Text(shape=(), dtype=string)),
})
 • Dokumentacja funkcji :
Funkcja Klasa Kształtować się Typ D Opis
FunkcjeDict
nie Sekwencja (etykieta klasy) (Nic,) int64
poz Sekwencja (etykieta klasy) (Nic,) int64
żetony Sekwencja (tekst) (Nic,) strunowy

conll2002/nl

 • Rozmiar pliku do pobrania : 3.47 MiB

 • Rozmiar zestawu danych : 3.55 MiB

 • Podziały :

Podział Przykłady
'dev' 2896
'test' 5196
'train' 15807
 • Struktura funkcji :
FeaturesDict({
  'ner': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=9)),
  'pos': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=12)),
  'tokens': Sequence(Text(shape=(), dtype=string)),
})
 • Dokumentacja funkcji :
Funkcja Klasa Kształtować się Typ D Opis
FunkcjeDict
nie Sekwencja (etykieta klasy) (Nic,) int64
poz Sekwencja (etykieta klasy) (Nic,) int64
żetony Sekwencja (tekst) (Nic,) strunowy