타토에바

  • 설명 :

이 데이터는 2018/11/17 토요일 날짜의 Tatoeba 말뭉치에서 추출되었습니다.

각 언어에 대해 가능한 경우 1000개의 영어 문장과 해당 번역을 선택했습니다. 언어, 어족, 스크립트 및 기본 결과에 대한 설명은 이 문서를 확인하십시오.

영어 문장은 모든 언어 쌍에서 동일하지 않습니다. 이는 결과가 언어 간에 직접 비교할 수 없음을 의미합니다.

FeaturesDict({
    'source_language': Text(shape=(), dtype=string),
    'source_sentence': Text(shape=(), dtype=string),
    'target_language': Text(shape=(), dtype=string),
    'target_sentence': Text(shape=(), dtype=string),
})
  • 기능 문서 :
특징 수업 모양 D타입 설명
풍모Dict
source_language 텍스트
source_sentence 텍스트
대상 언어 텍스트
target_sentence 텍스트
@article{tatoeba,
          title={Massively Multilingual Sentence Embeddings for Zero-Shot
                   Cross-Lingual Transfer and Beyond},
          author={Mikel, Artetxe and Holger, Schwenk,},
          journal={arXiv:1812.10464v2},
          year={2018}
}

@InProceedings{TIEDEMANN12.463,
  author = {J{\"o}rg}rg Tiedemann},
  title = {Parallel Data, Tools and Interfaces in OPUS},
  booktitle = {Proceedings of the Eight International Conference on Language Resources and Evaluation (LREC'12)},
  year = {2012},
  month = {may},
  date = {23-25},
  address = {Istanbul, Turkey},
  editor = {Nicoletta Calzolari (Conference Chair) and Khalid Choukri and Thierry Declerck and Mehmet Ugur Dogan and Bente Maegaard and Joseph Mariani and Jan Odijk and Stelios Piperidis},
  publisher = {European Language Resources Association (ELRA)},
  isbn = {978-2-9517408-7-7},
  language = {english}
}

tatoeba/tatoeba_af(기본 구성)

  • 다운로드 크기 : 58.24 KiB

  • 데이터 세트 크기 : 162.74 KiB

  • 분할 :

나뉘다
'train' 1,000

타토에바/tatoeba_ar

  • 다운로드 크기 : 70.95 KiB

  • 데이터 세트 크기 : 175.46 KiB

  • 분할 :

나뉘다
'train' 1,000

tatoeba/tatoeba_bg

  • 다운로드 크기 : 99.88 KiB

  • 데이터 세트 크기 : 204.64 KiB

  • 분할 :

나뉘다
'train' 1,000

타토에바/tatoeba_bn

  • 다운로드 크기 : 89.55 KiB

  • 데이터 세트 크기 : 194.24 KiB

  • 분할 :

나뉘다
'train' 1,000

타토에바/tatoeba_de

  • 다운로드 크기 : 103.09 KiB

  • 데이터 세트 크기 : 207.93 KiB

  • 분할 :

나뉘다
'train' 1,000

타토에바/tatoeba_el

  • 다운로드 크기 : 77.11 KiB

  • 데이터 세트 크기 : 181.65 KiB

  • 분할 :

나뉘다
'train' 1,000

타토에바/tatoeba_es

  • 다운로드 크기 : 70.57 KiB

  • 데이터 세트 크기 : 175.12 KiB

  • 분할 :

나뉘다
'train' 1,000

tatoeba/tatoeba_et

  • 다운로드 크기 : 58.33 KiB

  • 데이터 세트 크기 : 162.85 KiB

  • 분할 :

나뉘다
'train' 1,000

타토에바/tatoeba_eu

  • 다운로드 크기 : 64.52 KiB

  • 데이터 세트 크기 : 169.02 KiB

  • 분할 :

나뉘다
'train' 1,000

타토에바/tatoeba_fa

  • 다운로드 크기 : 91.52 KiB

  • 데이터 세트 크기 : 196.15 KiB

  • 분할 :

나뉘다
'train' 1,000

타토에바/tatoeba_fi

  • 다운로드 크기 : 73.90 KiB

  • 데이터 세트 크기 : 178.47 KiB

  • 분할 :

나뉘다
'train' 1,000

타토에바/tatoeba_fr

  • 다운로드 크기 : 78.14 KiB

  • 데이터 세트 크기 : 182.68 KiB

  • 분할 :

나뉘다
'train' 1,000

타토에바/tatoeba_he

  • 다운로드 크기 : 81.54 KiB

  • 데이터 세트 크기 : 186.15 KiB

  • 분할 :

나뉘다
'train' 1,000

타토에바/tatoeba_hi

  • 다운로드 크기 : 119.69 KiB

  • 데이터 세트 크기 : 224.89 KiB

  • 분할 :

나뉘다
'train' 1,000

타토에바/tatoeba_hu

  • 다운로드 크기 : 67.27 KiB

  • 데이터 세트 크기 : 171.78 KiB

  • 분할 :

나뉘다
'train' 1,000

타토에바/tatoeba_id

  • 다운로드 크기 : 73.09 KiB

  • 데이터 세트 크기 : 177.61 KiB

  • 분할 :

나뉘다
'train' 1,000

타토에바/tatoeba_it

  • 다운로드 크기 : 64.29 KiB

  • 데이터 세트 크기 : 168.81 KiB

  • 분할 :

나뉘다
'train' 1,000

tatoeba/tatoeba_ja

  • 다운로드 크기 : 90.90 KiB

  • 데이터 세트 크기 : 195.53 KiB

  • 분할 :

나뉘다
'train' 1,000

타토에바/tatoeba_jv

  • 다운로드 크기 : 13.59 KiB

  • 데이터 세트 크기 : 35.01 KiB

  • 분할 :

나뉘다
'train' 205

타토에바/tatoeba_ka

  • 다운로드 크기 : 70.47 KiB

  • 데이터 세트 크기 : 148.67 KiB

  • 분할 :

나뉘다
'train' 746

tatoeba/tatoeba_kk

  • 다운로드 크기 : 46.07 KiB

  • 데이터 세트 크기 : 106.25 KiB

  • 분할 :

나뉘다
'train' 575

tatoeba/tatoeba_ko

  • 다운로드 크기 : 77.28 KiB

  • 데이터 세트 크기 : 181.88 KiB

  • 분할 :

나뉘다
'train' 1,000

타토에바/tatoeba_ml

  • 다운로드 크기 : 92.50 KiB

  • 데이터 세트 크기 : 165.14 KiB

  • 분할 :

나뉘다
'train' 687

타토에바/tatoeba_mr

  • 다운로드 크기 : 98.19 KiB

  • 데이터 세트 크기 : 202.96 KiB

  • 분할 :

나뉘다
'train' 1,000

tatoeba/tatoeba_nl

  • 다운로드 크기 : 71.55 KiB

  • 데이터 세트 크기 : 176.10 KiB

  • 분할 :

나뉘다
'train' 1,000

tatoeba/tatoeba_pt

  • 다운로드 크기 : 73.42 KiB

  • 데이터 세트 크기 : 177.95 KiB

  • 분할 :

나뉘다
'train' 1,000

tatoeba/tatoeba_ru

  • 다운로드 크기 : 90.30 KiB

  • 데이터 세트 크기 : 194.92 KiB

  • 분할 :

나뉘다
'train' 1,000

tatoeba/tatoeba_sw

  • 다운로드 크기 : 19.99 KiB

  • 데이터 세트 크기 : 60.75 KiB

  • 분할 :

나뉘다
'train' 390

타토에바/tatoeba_ta

  • 다운로드 크기 : 38.52 KiB

  • 데이터 세트 크기 : 70.93 KiB

  • 분할 :

나뉘다
'train' 307

타토에바/tatoeba_te

  • 다운로드 크기 : 24.55 KiB

  • 데이터 세트 크기 : 49.07 KiB

  • 분할 :

나뉘다
'train' 234

타토에바/tatoeba_th

  • 다운로드 크기 : 61.72 KiB

  • 데이터 세트 크기 : 119.32 KiB

  • 분할 :

나뉘다
'train' 548

타토에바/tatoeba_tl

  • 다운로드 크기 : 66.54 KiB

  • 데이터 세트 크기 : 171.04 KiB

  • 분할 :

나뉘다
'train' 1,000

타토에바/tatoeba_tr

  • 다운로드 크기 : 70.20 KiB

  • 데이터 세트 크기 : 174.70 KiB

  • 분할 :

나뉘다
'train' 1,000

타토에바/tatoeba_ur

  • 다운로드 크기 : 86.63 KiB

  • 데이터 세트 크기 : 191.20 KiB

  • 분할 :

나뉘다
'train' 1,000

타토에바/tatoeba_vi

  • 다운로드 크기 : 89.26 KiB

  • 데이터 세트 크기 : 193.89 KiB

  • 분할 :

나뉘다
'train' 1,000

타토에바/tatoeba_zh

  • 다운로드 크기 : 67.32 KiB

  • 데이터 세트 크기 : 171.85 KiB

  • 분할 :

나뉘다
'train' 1,000
,

  • 설명 :

이 데이터는 2018/11/17 토요일 날짜의 Tatoeba 말뭉치에서 추출되었습니다.

각 언어에 대해 가능한 경우 1000개의 영어 문장과 해당 번역을 선택했습니다. 언어, 어족, 스크립트 및 기본 결과에 대한 설명은 이 문서를 확인하십시오.

영어 문장은 모든 언어 쌍에서 동일하지 않습니다. 이는 결과가 언어 간에 직접 비교할 수 없음을 의미합니다.

FeaturesDict({
    'source_language': Text(shape=(), dtype=string),
    'source_sentence': Text(shape=(), dtype=string),
    'target_language': Text(shape=(), dtype=string),
    'target_sentence': Text(shape=(), dtype=string),
})
  • 기능 문서 :
특징 수업 모양 D타입 설명
풍모Dict
source_language 텍스트
source_sentence 텍스트
대상 언어 텍스트
target_sentence 텍스트
@article{tatoeba,
          title={Massively Multilingual Sentence Embeddings for Zero-Shot
                   Cross-Lingual Transfer and Beyond},
          author={Mikel, Artetxe and Holger, Schwenk,},
          journal={arXiv:1812.10464v2},
          year={2018}
}

@InProceedings{TIEDEMANN12.463,
  author = {J{\"o}rg}rg Tiedemann},
  title = {Parallel Data, Tools and Interfaces in OPUS},
  booktitle = {Proceedings of the Eight International Conference on Language Resources and Evaluation (LREC'12)},
  year = {2012},
  month = {may},
  date = {23-25},
  address = {Istanbul, Turkey},
  editor = {Nicoletta Calzolari (Conference Chair) and Khalid Choukri and Thierry Declerck and Mehmet Ugur Dogan and Bente Maegaard and Joseph Mariani and Jan Odijk and Stelios Piperidis},
  publisher = {European Language Resources Association (ELRA)},
  isbn = {978-2-9517408-7-7},
  language = {english}
}

tatoeba/tatoeba_af(기본 구성)

  • 다운로드 크기 : 58.24 KiB

  • 데이터 세트 크기 : 162.74 KiB

  • 분할 :

나뉘다
'train' 1,000

타토에바/tatoeba_ar

  • 다운로드 크기 : 70.95 KiB

  • 데이터 세트 크기 : 175.46 KiB

  • 분할 :

나뉘다
'train' 1,000

tatoeba/tatoeba_bg

  • 다운로드 크기 : 99.88 KiB

  • 데이터 세트 크기 : 204.64 KiB

  • 분할 :

나뉘다
'train' 1,000

타토에바/tatoeba_bn

  • 다운로드 크기 : 89.55 KiB

  • 데이터 세트 크기 : 194.24 KiB

  • 분할 :

나뉘다
'train' 1,000

타토에바/tatoeba_de

  • 다운로드 크기 : 103.09 KiB

  • 데이터 세트 크기 : 207.93 KiB

  • 분할 :

나뉘다
'train' 1,000

타토에바/tatoeba_el

  • 다운로드 크기 : 77.11 KiB

  • 데이터 세트 크기 : 181.65 KiB

  • 분할 :

나뉘다
'train' 1,000

타토에바/tatoeba_es

  • 다운로드 크기 : 70.57 KiB

  • 데이터 세트 크기 : 175.12 KiB

  • 분할 :

나뉘다
'train' 1,000

tatoeba/tatoeba_et

  • 다운로드 크기 : 58.33 KiB

  • 데이터 세트 크기 : 162.85 KiB

  • 분할 :

나뉘다
'train' 1,000

타토에바/tatoeba_eu

  • 다운로드 크기 : 64.52 KiB

  • 데이터 세트 크기 : 169.02 KiB

  • 분할 :

나뉘다
'train' 1,000

타토에바/tatoeba_fa

  • 다운로드 크기 : 91.52 KiB

  • 데이터 세트 크기 : 196.15 KiB

  • 분할 :

나뉘다
'train' 1,000

타토에바/tatoeba_fi

  • 다운로드 크기 : 73.90 KiB

  • 데이터 세트 크기 : 178.47 KiB

  • 분할 :

나뉘다
'train' 1,000

타토에바/tatoeba_fr

  • 다운로드 크기 : 78.14 KiB

  • 데이터 세트 크기 : 182.68 KiB

  • 분할 :

나뉘다
'train' 1,000

타토에바/tatoeba_he

  • 다운로드 크기 : 81.54 KiB

  • 데이터 세트 크기 : 186.15 KiB

  • 분할 :

나뉘다
'train' 1,000

타토에바/tatoeba_hi

  • 다운로드 크기 : 119.69 KiB

  • 데이터 세트 크기 : 224.89 KiB

  • 분할 :

나뉘다
'train' 1,000

타토에바/tatoeba_hu

  • 다운로드 크기 : 67.27 KiB

  • 데이터 세트 크기 : 171.78 KiB

  • 분할 :

나뉘다
'train' 1,000

타토에바/tatoeba_id

  • 다운로드 크기 : 73.09 KiB

  • 데이터 세트 크기 : 177.61 KiB

  • 분할 :

나뉘다
'train' 1,000

타토에바/tatoeba_it

  • 다운로드 크기 : 64.29 KiB

  • 데이터 세트 크기 : 168.81 KiB

  • 분할 :

나뉘다
'train' 1,000

tatoeba/tatoeba_ja

  • 다운로드 크기 : 90.90 KiB

  • 데이터 세트 크기 : 195.53 KiB

  • 분할 :

나뉘다
'train' 1,000

타토에바/tatoeba_jv

  • 다운로드 크기 : 13.59 KiB

  • 데이터 세트 크기 : 35.01 KiB

  • 분할 :

나뉘다
'train' 205

타토에바/tatoeba_ka

  • 다운로드 크기 : 70.47 KiB

  • 데이터 세트 크기 : 148.67 KiB

  • 분할 :

나뉘다
'train' 746

tatoeba/tatoeba_kk

  • 다운로드 크기 : 46.07 KiB

  • 데이터 세트 크기 : 106.25 KiB

  • 분할 :

나뉘다
'train' 575

tatoeba/tatoeba_ko

  • 다운로드 크기 : 77.28 KiB

  • 데이터 세트 크기 : 181.88 KiB

  • 분할 :

나뉘다
'train' 1,000

타토에바/tatoeba_ml

  • 다운로드 크기 : 92.50 KiB

  • 데이터 세트 크기 : 165.14 KiB

  • 분할 :

나뉘다
'train' 687

타토에바/tatoeba_mr

  • 다운로드 크기 : 98.19 KiB

  • 데이터 세트 크기 : 202.96 KiB

  • 분할 :

나뉘다
'train' 1,000

tatoeba/tatoeba_nl

  • 다운로드 크기 : 71.55 KiB

  • 데이터 세트 크기 : 176.10 KiB

  • 분할 :

나뉘다
'train' 1,000

tatoeba/tatoeba_pt

  • 다운로드 크기 : 73.42 KiB

  • 데이터 세트 크기 : 177.95 KiB

  • 분할 :

나뉘다
'train' 1,000

tatoeba/tatoeba_ru

  • 다운로드 크기 : 90.30 KiB

  • 데이터 세트 크기 : 194.92 KiB

  • 분할 :

나뉘다
'train' 1,000

tatoeba/tatoeba_sw

  • 다운로드 크기 : 19.99 KiB

  • 데이터 세트 크기 : 60.75 KiB

  • 분할 :

나뉘다
'train' 390

타토에바/tatoeba_ta

  • 다운로드 크기 : 38.52 KiB

  • 데이터 세트 크기 : 70.93 KiB

  • 분할 :

나뉘다
'train' 307

타토에바/tatoeba_te

  • 다운로드 크기 : 24.55 KiB

  • 데이터 세트 크기 : 49.07 KiB

  • 분할 :

나뉘다
'train' 234

타토에바/tatoeba_th

  • 다운로드 크기 : 61.72 KiB

  • 데이터 세트 크기 : 119.32 KiB

  • 분할 :

나뉘다
'train' 548

타토에바/tatoeba_tl

  • 다운로드 크기 : 66.54 KiB

  • 데이터 세트 크기 : 171.04 KiB

  • 분할 :

나뉘다
'train' 1,000

타토에바/tatoeba_tr

  • 다운로드 크기 : 70.20 KiB

  • 데이터 세트 크기 : 174.70 KiB

  • 분할 :

나뉘다
'train' 1,000

타토에바/tatoeba_ur

  • 다운로드 크기 : 86.63 KiB

  • 데이터 세트 크기 : 191.20 KiB

  • 분할 :

나뉘다
'train' 1,000

타토에바/tatoeba_vi

  • 다운로드 크기 : 89.26 KiB

  • 데이터 세트 크기 : 193.89 KiB

  • 분할 :

나뉘다
'train' 1,000

타토에바/tatoeba_zh

  • 다운로드 크기 : 67.32 KiB

  • 데이터 세트 크기 : 171.85 KiB

  • 분할 :

나뉘다
'train' 1,000