익스트림_포스

  • 설명 :

UD(Universal Dependencies)는 다양한 인간 언어에 걸쳐 문법(품사, 형태적 특징 및 구문 종속성)의 일관된 주석을 위한 프레임워크입니다. UD는 70개 이상의 언어로 100개 이상의 트리뱅크를 제작하는 200명 이상의 기여자가 참여하는 개방형 커뮤니티 노력입니다. UD를 처음 사용하는 경우 짧은 소개의 첫 번째 부분을 읽은 다음 주석 지침을 검색하는 것으로 시작해야 합니다.

FeaturesDict({
    'tokens': Sequence(Text(shape=(), dtype=string)),
    'upos': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=18)),
})
  • 기능 문서 :
특징 수업 모양 D타입 설명
풍모Dict
토큰 시퀀스(텍스트) (없음,)
우포스 시퀀스(클래스 레이블) (없음,) int64
@article{nivre2018universal,
  title={Universal Dependencies 2.2},
  author={Nivre, Joakim and Abrams, Mitchell and Agi{'c}, {
{Z} }eljko
  and Ahrenberg, Lars and Antonsen, Lene and Aranzabe, Maria Jesus and
  Arutie, Gashaw and Asahara, Masayuki and Ateyah, Luma and Attia,
  Mohammed and others},
  year={2018}
}

xtreme_pos/xtreme_pos_af(기본 구성)

  • 데이터 세트 크기 : 445.94 KiB

  • 분할 :

나뉘다
'dev' 194
'test' 425
'train' 1,315

xtreme_pos/xtreme_pos_ar

  • 데이터 세트 크기 : 3.35 MiB

  • 분할 :

나뉘다
'dev' 909
'test' 1,680
'train' 6,075

xtreme_pos/xtreme_pos_bg

  • 데이터 세트 크기 : 2.14 MiB

  • 분할 :

나뉘다
'dev' 1,115
'test' 1,116
'train' 8,907

xtreme_pos/xtreme_pos_de

  • 데이터 세트 크기 : 37.62 MiB

  • 분할 :

나뉘다
'dev' 19,233
'test' 22,458
'train' 166,849

xtreme_pos/xtreme_pos_el

  • 데이터 세트 크기 : 7.17 MiB

  • 분할 :

나뉘다
'dev' 2,559
'test' 2,809
'train' 28,152

xtreme_pos/xtreme_pos_en

  • 데이터 세트 크기 : 4.67 MiB

  • 분할 :

나뉘다
'dev' 4,699
'test' 6,165
'train' 26,825

xtreme_pos/xtreme_pos_es

  • 데이터 세트 크기 : 8.26 MiB

  • 분할 :

나뉘다
'dev' 3,054
'test' 3,147
'train' 28,492

xtreme_pos/xtreme_pos_et

  • 데이터 세트 크기 : 4.84 MiB

  • 분할 :

나뉘다
'dev' 3,125
'test' 3,760
'train' 25,749

xtreme_pos/xtreme_pos_eu

  • 데이터 세트 크기 : 1.27 MiB

  • 분할 :

나뉘다
'dev' 1,798
'test' 1,799
'train' 5,396

xtreme_pos/xtreme_pos_fa

  • 데이터 세트 크기 : 1.73 MiB

  • 분할 :

나뉘다
'dev' 599
'test' 600
'train' 4,798

xtreme_pos/xtreme_pos_fi

  • 데이터 세트 크기 : 4.48 MiB

  • 분할 :

나뉘다
'dev' 3,239
'test' 4,422
'train' 27,198

xtreme_pos/xtreme_pos_fr

  • 데이터 세트 크기 : 7.28 MiB

  • 분할 :

나뉘다
'dev' 5,979
'test' 9,465
'train' 47,308

xtreme_pos/xtreme_pos_he

  • 데이터 세트 크기 : 1.57 MiB

  • 분할 :

나뉘다
'dev' 484
'test' 491
'train' 5,241

xtreme_pos/xtreme_pos_hi

  • 데이터 세트 크기 : 5.78 MiB

  • 분할 :

나뉘다
'dev' 1,884
'test' 2,909
'train' 14,752

xtreme_pos/xtreme_pos_hu

  • 데이터 세트 크기 : 438.07 KiB

  • 분할 :

나뉘다
'dev' 441
'test' 449
'train' 910

xtreme_pos/xtreme_pos_id

  • 데이터 세트 크기 : 1.31 MiB

  • 분할 :

나뉘다
'dev' 559
'test' 1,557
'train' 4,477

xtreme_pos/xtreme_pos_it

  • 데이터 세트 크기 : 6.85 MiB

  • 분할 :

나뉘다
'dev' 2,278
'test' 3,518
'train' 29,685

xtreme_pos/xtreme_pos_ja

  • 데이터 세트 크기 : 3.57 MiB

  • 분할 :

나뉘다
'dev' 8,938
'test' 10,253
'train' 47,926

xtreme_pos/xtreme_pos_kk

  • 데이터 세트 크기 : 167.15 KiB

  • 분할 :

나뉘다
'test' 1,047
'train' 31

xtreme_pos/xtreme_pos_ko

  • 데이터 세트 크기 : 5.82 MiB

  • 분할 :

나뉘다
'dev' 3,016
'test' 4,276
'train' 27,410

xtreme_pos/xtreme_pos_mr

  • 데이터 세트 크기 : 56.14 KiB

  • 분할 :

나뉘다
'dev' 46
'test' 47
'train' 373

xtreme_pos/xtreme_pos_nl

  • 데이터 세트 크기 : 2.90 MiB

  • 분할 :

나뉘다
'dev' 1,394
'test' 1,471
'train' 18,051

xtreme_pos/xtreme_pos_pt

  • 데이터 세트 크기 : 4.65 MiB

  • 분할 :

나뉘다
'dev' 1,770
'test' 2,681
'train' 17,992

xtreme_pos/xtreme_pos_ru

  • 데이터 세트 크기 : 20.25 MiB

  • 분할 :

나뉘다
'dev' 9,960
'test' 11,336
'train' 67,435

xtreme_pos/xtreme_pos_ta

  • 데이터 세트 크기 : 3.65 KiB

  • 분할 :

나뉘다
'test' 55

xtreme_pos/xtreme_pos_te

  • 데이터 세트 크기 : 143.77 KiB

  • 분할 :

나뉘다
'dev' 131
'test' 146
'train' 1,051

xtreme_pos/xtreme_pos_th

  • 데이터 세트 크기 : 377.24 KiB

  • 분할 :

나뉘다
'test' 1,000

xtreme_pos/xtreme_pos_tl

  • 데이터 세트 크기 : 228.78 KiB

  • 분할 :

나뉘다
'dev' 80
'test' 120
'train' 400

xtreme_pos/xtreme_pos_tr

  • 데이터 세트 크기 : 1.06 MiB

  • 분할 :

나뉘다
'dev' 988
'test' 4,785
'train' 3,664

xtreme_pos/xtreme_pos_ur

  • 데이터 세트 크기 : 1.50 MiB

  • 분할 :

나뉘다
'dev' 552
'test' 535
'train' 4,043

xtreme_pos/xtreme_pos_vi

  • 데이터 세트 크기 : 454.32 KiB

  • 분할 :

나뉘다
'dev' 800
'test' 800
'train' 1,400

xtreme_pos/xtreme_pos_yo

  • 데이터 세트 크기 : 22.65 KiB

  • 분할 :

나뉘다
'test' 100

xtreme_pos/xtreme_pos_zh

  • 데이터 세트 크기 : 3.29 MiB

  • 분할 :

나뉘다
'dev' 3,038
'test' 5,528
'train' 18,998