ted_hrlr

참고자료:

az_to_en

TFDS에 이 데이터세트를 로드하려면 다음 명령어를 사용하세요.

ds = tfds.load('huggingface:ted_hrlr/az_to_en')
  • 설명 :
Data sets derived from TED talk transcripts for comparing similar language pairs
where one is high resource and the other is low resource.
  • 라이센스 : 알려진 라이센스 없음
  • 버전 : 1.0.0
  • 분할 :
나뉘다
'test' 904
'train' 5947
'validation' 672
  • 특징 :
{
    "translation": {
        "languages": [
            "az",
            "en"
        ],
        "id": null,
        "_type": "Translation"
    }
}

aztr_to_en

TFDS에 이 데이터세트를 로드하려면 다음 명령어를 사용하세요.

ds = tfds.load('huggingface:ted_hrlr/aztr_to_en')
  • 설명 :
Data sets derived from TED talk transcripts for comparing similar language pairs
where one is high resource and the other is low resource.
  • 라이센스 : 알려진 라이센스 없음
  • 버전 : 1.0.0
  • 분할 :
나뉘다
'test' 904
'train' 188397
'validation' 672
  • 특징 :
{
    "translation": {
        "languages": [
            "az_tr",
            "en"
        ],
        "id": null,
        "_type": "Translation"
    }
}

be_to_en

TFDS에 이 데이터세트를 로드하려면 다음 명령어를 사용하세요.

ds = tfds.load('huggingface:ted_hrlr/be_to_en')
  • 설명 :
Data sets derived from TED talk transcripts for comparing similar language pairs
where one is high resource and the other is low resource.
  • 라이센스 : 알려진 라이센스 없음
  • 버전 : 1.0.0
  • 분할 :
나뉘다
'test' 665
'train' 4510
'validation' 249
  • 특징 :
{
    "translation": {
        "languages": [
            "be",
            "en"
        ],
        "id": null,
        "_type": "Translation"
    }
}

beru_to_en

TFDS에 이 데이터세트를 로드하려면 다음 명령어를 사용하세요.

ds = tfds.load('huggingface:ted_hrlr/beru_to_en')
  • 설명 :
Data sets derived from TED talk transcripts for comparing similar language pairs
where one is high resource and the other is low resource.
  • 라이센스 : 알려진 라이센스 없음
  • 버전 : 1.0.0
  • 분할 :
나뉘다
'test' 665
'train' 212615
'validation' 249
  • 특징 :
{
    "translation": {
        "languages": [
            "be_ru",
            "en"
        ],
        "id": null,
        "_type": "Translation"
    }
}

es_to_pt

TFDS에 이 데이터세트를 로드하려면 다음 명령어를 사용하세요.

ds = tfds.load('huggingface:ted_hrlr/es_to_pt')
  • 설명 :
Data sets derived from TED talk transcripts for comparing similar language pairs
where one is high resource and the other is low resource.
  • 라이센스 : 알려진 라이센스 없음
  • 버전 : 1.0.0
  • 분할 :
나뉘다
'test' 1764년
'train' 44939
'validation' 1017
  • 특징 :
{
    "translation": {
        "languages": [
            "es",
            "pt"
        ],
        "id": null,
        "_type": "Translation"
    }
}

fr_to_pt

TFDS에 이 데이터세트를 로드하려면 다음 명령어를 사용하세요.

ds = tfds.load('huggingface:ted_hrlr/fr_to_pt')
  • 설명 :
Data sets derived from TED talk transcripts for comparing similar language pairs
where one is high resource and the other is low resource.
  • 라이센스 : 알려진 라이센스 없음
  • 버전 : 1.0.0
  • 분할 :
나뉘다
'test' 1495
'train' 43874
'validation' 1132
  • 특징 :
{
    "translation": {
        "languages": [
            "fr",
            "pt"
        ],
        "id": null,
        "_type": "Translation"
    }
}

gl_to_en

TFDS에 이 데이터세트를 로드하려면 다음 명령어를 사용하세요.

ds = tfds.load('huggingface:ted_hrlr/gl_to_en')
  • 설명 :
Data sets derived from TED talk transcripts for comparing similar language pairs
where one is high resource and the other is low resource.
  • 라이센스 : 알려진 라이센스 없음
  • 버전 : 1.0.0
  • 분할 :
나뉘다
'test' 1008
'train' 10018
'validation' 683
  • 특징 :
{
    "translation": {
        "languages": [
            "gl",
            "en"
        ],
        "id": null,
        "_type": "Translation"
    }
}

glpt_to_en

TFDS에 이 데이터세트를 로드하려면 다음 명령어를 사용하세요.

ds = tfds.load('huggingface:ted_hrlr/glpt_to_en')
  • 설명 :
Data sets derived from TED talk transcripts for comparing similar language pairs
where one is high resource and the other is low resource.
  • 라이센스 : 알려진 라이센스 없음
  • 버전 : 1.0.0
  • 분할 :
나뉘다
'test' 1008
'train' 61803
'validation' 683
  • 특징 :
{
    "translation": {
        "languages": [
            "gl_pt",
            "en"
        ],
        "id": null,
        "_type": "Translation"
    }
}

he_to_pt

TFDS에 이 데이터세트를 로드하려면 다음 명령어를 사용하세요.

ds = tfds.load('huggingface:ted_hrlr/he_to_pt')
  • 설명 :
Data sets derived from TED talk transcripts for comparing similar language pairs
where one is high resource and the other is low resource.
  • 라이센스 : 알려진 라이센스 없음
  • 버전 : 1.0.0
  • 분할 :
나뉘다
'test' 1624년
'train' 48512
'validation' 1146
  • 특징 :
{
    "translation": {
        "languages": [
            "he",
            "pt"
        ],
        "id": null,
        "_type": "Translation"
    }
}

it_to_pt

TFDS에 이 데이터세트를 로드하려면 다음 명령어를 사용하세요.

ds = tfds.load('huggingface:ted_hrlr/it_to_pt')
  • 설명 :
Data sets derived from TED talk transcripts for comparing similar language pairs
where one is high resource and the other is low resource.
  • 라이센스 : 알려진 라이센스 없음
  • 버전 : 1.0.0
  • 분할 :
나뉘다
'test' 1670년
'train' 46260
'validation' 1163
  • 특징 :
{
    "translation": {
        "languages": [
            "it",
            "pt"
        ],
        "id": null,
        "_type": "Translation"
    }
}

pt_to_en

TFDS에 이 데이터세트를 로드하려면 다음 명령어를 사용하세요.

ds = tfds.load('huggingface:ted_hrlr/pt_to_en')
  • 설명 :
Data sets derived from TED talk transcripts for comparing similar language pairs
where one is high resource and the other is low resource.
  • 라이센스 : 알려진 라이센스 없음
  • 버전 : 1.0.0
  • 분할 :
나뉘다
'test' 1804년
'train' 51786
'validation' 1194
  • 특징 :
{
    "translation": {
        "languages": [
            "pt",
            "en"
        ],
        "id": null,
        "_type": "Translation"
    }
}

ru_to_en

TFDS에 이 데이터세트를 로드하려면 다음 명령어를 사용하세요.

ds = tfds.load('huggingface:ted_hrlr/ru_to_en')
  • 설명 :
Data sets derived from TED talk transcripts for comparing similar language pairs
where one is high resource and the other is low resource.
  • 라이센스 : 알려진 라이센스 없음
  • 버전 : 1.0.0
  • 분할 :
나뉘다
'test' 5477
'train' 208107
'validation' 4806
  • 특징 :
{
    "translation": {
        "languages": [
            "ru",
            "en"
        ],
        "id": null,
        "_type": "Translation"
    }
}

ru_to_pt

TFDS에 이 데이터세트를 로드하려면 다음 명령어를 사용하세요.

ds = tfds.load('huggingface:ted_hrlr/ru_to_pt')
  • 설명 :
Data sets derived from TED talk transcripts for comparing similar language pairs
where one is high resource and the other is low resource.
  • 라이센스 : 알려진 라이센스 없음
  • 버전 : 1.0.0
  • 분할 :
나뉘다
'test' 1589
'train' 47279
'validation' 1185
  • 특징 :
{
    "translation": {
        "languages": [
            "ru",
            "pt"
        ],
        "id": null,
        "_type": "Translation"
    }
}

tr_to_en

TFDS에 이 데이터세트를 로드하려면 다음 명령어를 사용하세요.

ds = tfds.load('huggingface:ted_hrlr/tr_to_en')
  • 설명 :
Data sets derived from TED talk transcripts for comparing similar language pairs
where one is high resource and the other is low resource.
  • 라이센스 : 알려진 라이센스 없음
  • 버전 : 1.0.0
  • 분할 :
나뉘다
'test' 5030
'train' 182451
'validation' 4046
  • 특징 :
{
    "translation": {
        "languages": [
            "tr",
            "en"
        ],
        "id": null,
        "_type": "Translation"
    }
}