conll2003

  • 説明:

CoNLL-2003 の共有タスクは、言語に依存しない名前付きエンティティの認識に関係し、前の 3 つのグループに属さない個人、場所、組織、およびその他のエンティティの名前の 4 種類の名前付きエンティティに集中しています。

  • ホームページhttps ://www.aclweb.org/anthology/W03-0419/

  • ソースコード: tfds.text.conll2003.Conll2003

  • バージョン:

    • 1.0.0 (デフォルト): 初期リリース。
  • ダウンロードサイズ: 959.94 KiB

  • データセットのサイズ: 3.87 MiB

  • 自動キャッシュ(ドキュメント): はい

  • スプリット:

スプリット
'dev' 3,251
'test' 3,454
'train' 14,042
  • 機能構造:
FeaturesDict({
    'chunks': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=23)),
    'ner': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=9)),
    'pos': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=47)),
    'tokens': Sequence(Text(shape=(), dtype=string)),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
チャンクシーケンス(クラスラベル) (なし、) int64
ナーシーケンス(クラスラベル) (なし、) int64
位置シーケンス(クラスラベル) (なし、) int64
トークンシーケンス(テキスト) (なし、)ストリング
  • 引用
@inproceedings{tjong-kim-sang-de-meulder-2003-introduction,
    title = "Introduction to the {C}o{NLL}-2003 Shared Task: Language-Independent Named Entity Recognition",
    author = "Tjong Kim Sang, Erik F.  and
      De Meulder, Fien",
    booktitle = "Proceedings of the Seventh Conference on Natural Language Learning at {HLT}-{NAACL} 2003",
    year = "2003",
    url = "https://www.aclweb.org/anthology/W03-0419",
    pages = "142--147",
}

conll2003/conll2003 (デフォルト設定)

  • 説明:

CoNLL-2003 の共有タスクは、言語に依存しない名前付きエンティティの認識に関係し、前の 3 つのグループに属さない個人、場所、組織、およびその他のエンティティの名前の 4 種類の名前付きエンティティに集中しています。

  • ホームページhttps ://www.aclweb.org/anthology/W03-0419/

  • ソースコード: tfds.text.conll2003.Conll2003

  • バージョン:

    • 1.0.0 (デフォルト): 初期リリース。
  • ダウンロードサイズ: 959.94 KiB

  • データセットのサイズ: 3.87 MiB

  • 自動キャッシュ(ドキュメント): はい

  • スプリット:

スプリット
'dev' 3,251
'test' 3,454
'train' 14,042
  • 機能構造:
FeaturesDict({
    'chunks': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=23)),
    'ner': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=9)),
    'pos': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=47)),
    'tokens': Sequence(Text(shape=(), dtype=string)),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
チャンクシーケンス(クラスラベル) (なし、) int64
ナーシーケンス(クラスラベル) (なし、) int64
位置シーケンス(クラスラベル) (なし、) int64
トークンシーケンス(テキスト) (なし、)ストリング
  • 引用
@inproceedings{tjong-kim-sang-de-meulder-2003-introduction,
    title = "Introduction to the {C}o{NLL}-2003 Shared Task: Language-Independent Named Entity Recognition",
    author = "Tjong Kim Sang, Erik F.  and
      De Meulder, Fien",
    booktitle = "Proceedings of the Seventh Conference on Natural Language Learning at {HLT}-{NAACL} 2003",
    year = "2003",
    url = "https://www.aclweb.org/anthology/W03-0419",
    pages = "142--147",
}

conll2003/conll2003 (デフォルト設定)