발 x

참고자료:

ko

TFDS에 이 데이터세트를 로드하려면 다음 명령어를 사용하세요.

ds = tfds.load('huggingface:paws-x/en')
  • 설명 :
PAWS-X, a multilingual version of PAWS (Paraphrase Adversaries from Word Scrambling) for six languages.

This dataset contains 23,659 human translated PAWS evaluation pairs and 296,406 machine
translated training pairs in six typologically distinct languages: French, Spanish, German,
Chinese, Japanese, and Korean. English language is available by default. All translated
pairs are sourced from examples in PAWS-Wiki.

For further details, see the accompanying paper: PAWS-X: A Cross-lingual Adversarial Dataset
for Paraphrase Identification (https://arxiv.org/abs/1908.11828)

Note: There might be some missing or wrong labels in the dataset and we have replaced them with -1.
  • 라이센스 : 데이터 세트는 어떤 목적으로든 자유롭게 사용할 수 있지만 Google LLC("Google")를 데이터 소스로 인정하는 것이 좋습니다. 데이터 세트는 명시적이든 묵시적이든 어떠한 보증도 없이 "있는 그대로" 제공됩니다. Google은 데이터 세트 사용으로 인해 발생하는 직간접적인 피해에 대해 모든 책임을 지지 않습니다.
  • 버전 : 1.1.0
  • 분할 :
나뉘다
'test' 2000
'train' 49401
'validation' 2000
  • 특징 :
{
    "id": {
        "dtype": "int32",
        "id": null,
        "_type": "Value"
    },
    "sentence1": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "sentence2": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "label": {
        "num_classes": 2,
        "names": [
            "0",
            "1"
        ],
        "names_file": null,
        "id": null,
        "_type": "ClassLabel"
    }
}

TFDS에 이 데이터세트를 로드하려면 다음 명령어를 사용하세요.

ds = tfds.load('huggingface:paws-x/de')
  • 설명 :
PAWS-X, a multilingual version of PAWS (Paraphrase Adversaries from Word Scrambling) for six languages.

This dataset contains 23,659 human translated PAWS evaluation pairs and 296,406 machine
translated training pairs in six typologically distinct languages: French, Spanish, German,
Chinese, Japanese, and Korean. English language is available by default. All translated
pairs are sourced from examples in PAWS-Wiki.

For further details, see the accompanying paper: PAWS-X: A Cross-lingual Adversarial Dataset
for Paraphrase Identification (https://arxiv.org/abs/1908.11828)

Note: There might be some missing or wrong labels in the dataset and we have replaced them with -1.
  • 라이센스 : 데이터 세트는 어떤 목적으로든 자유롭게 사용할 수 있지만 Google LLC("Google")를 데이터 소스로 인정하는 것이 좋습니다. 데이터 세트는 명시적이든 묵시적이든 어떠한 보증도 없이 "있는 그대로" 제공됩니다. Google은 데이터 세트 사용으로 인해 발생하는 직간접적인 피해에 대해 모든 책임을 지지 않습니다.
  • 버전 : 1.1.0
  • 분할 :
나뉘다
'test' 2000
'train' 49401
'validation' 2000
  • 특징 :
{
    "id": {
        "dtype": "int32",
        "id": null,
        "_type": "Value"
    },
    "sentence1": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "sentence2": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "label": {
        "num_classes": 2,
        "names": [
            "0",
            "1"
        ],
        "names_file": null,
        "id": null,
        "_type": "ClassLabel"
    }
}

TFDS에 이 데이터세트를 로드하려면 다음 명령어를 사용하세요.

ds = tfds.load('huggingface:paws-x/es')
  • 설명 :
PAWS-X, a multilingual version of PAWS (Paraphrase Adversaries from Word Scrambling) for six languages.

This dataset contains 23,659 human translated PAWS evaluation pairs and 296,406 machine
translated training pairs in six typologically distinct languages: French, Spanish, German,
Chinese, Japanese, and Korean. English language is available by default. All translated
pairs are sourced from examples in PAWS-Wiki.

For further details, see the accompanying paper: PAWS-X: A Cross-lingual Adversarial Dataset
for Paraphrase Identification (https://arxiv.org/abs/1908.11828)

Note: There might be some missing or wrong labels in the dataset and we have replaced them with -1.
  • 라이센스 : 데이터 세트는 어떤 목적으로든 자유롭게 사용할 수 있지만 Google LLC("Google")를 데이터 소스로 인정하는 것이 좋습니다. 데이터 세트는 명시적이든 묵시적이든 어떠한 보증도 없이 "있는 그대로" 제공됩니다. Google은 데이터 세트 사용으로 인해 발생하는 직간접적인 피해에 대해 모든 책임을 지지 않습니다.
  • 버전 : 1.1.0
  • 분할 :
나뉘다
'test' 2000
'train' 49401
'validation' 2000
  • 특징 :
{
    "id": {
        "dtype": "int32",
        "id": null,
        "_type": "Value"
    },
    "sentence1": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "sentence2": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "label": {
        "num_classes": 2,
        "names": [
            "0",
            "1"
        ],
        "names_file": null,
        "id": null,
        "_type": "ClassLabel"
    }
}

정말로

TFDS에 이 데이터세트를 로드하려면 다음 명령어를 사용하세요.

ds = tfds.load('huggingface:paws-x/fr')
  • 설명 :
PAWS-X, a multilingual version of PAWS (Paraphrase Adversaries from Word Scrambling) for six languages.

This dataset contains 23,659 human translated PAWS evaluation pairs and 296,406 machine
translated training pairs in six typologically distinct languages: French, Spanish, German,
Chinese, Japanese, and Korean. English language is available by default. All translated
pairs are sourced from examples in PAWS-Wiki.

For further details, see the accompanying paper: PAWS-X: A Cross-lingual Adversarial Dataset
for Paraphrase Identification (https://arxiv.org/abs/1908.11828)

Note: There might be some missing or wrong labels in the dataset and we have replaced them with -1.
  • 라이센스 : 데이터 세트는 어떤 목적으로든 자유롭게 사용할 수 있지만 Google LLC("Google")를 데이터 소스로 인정하는 것이 좋습니다. 데이터 세트는 명시적이든 묵시적이든 어떠한 보증도 없이 "있는 그대로" 제공됩니다. Google은 데이터 세트 사용으로 인해 발생하는 직간접적인 피해에 대해 모든 책임을 지지 않습니다.
  • 버전 : 1.1.0
  • 분할 :
나뉘다
'test' 2000
'train' 49401
'validation' 2000
  • 특징 :
{
    "id": {
        "dtype": "int32",
        "id": null,
        "_type": "Value"
    },
    "sentence1": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "sentence2": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "label": {
        "num_classes": 2,
        "names": [
            "0",
            "1"
        ],
        "names_file": null,
        "id": null,
        "_type": "ClassLabel"
    }
}

TFDS에 이 데이터세트를 로드하려면 다음 명령어를 사용하세요.

ds = tfds.load('huggingface:paws-x/ja')
  • 설명 :
PAWS-X, a multilingual version of PAWS (Paraphrase Adversaries from Word Scrambling) for six languages.

This dataset contains 23,659 human translated PAWS evaluation pairs and 296,406 machine
translated training pairs in six typologically distinct languages: French, Spanish, German,
Chinese, Japanese, and Korean. English language is available by default. All translated
pairs are sourced from examples in PAWS-Wiki.

For further details, see the accompanying paper: PAWS-X: A Cross-lingual Adversarial Dataset
for Paraphrase Identification (https://arxiv.org/abs/1908.11828)

Note: There might be some missing or wrong labels in the dataset and we have replaced them with -1.
  • 라이센스 : 데이터 세트는 어떤 목적으로든 자유롭게 사용할 수 있지만 Google LLC("Google")를 데이터 소스로 인정하는 것이 좋습니다. 데이터 세트는 명시적이든 묵시적이든 어떠한 보증도 없이 "있는 그대로" 제공됩니다. Google은 데이터 세트 사용으로 인해 발생하는 직간접적인 피해에 대해 모든 책임을 지지 않습니다.
  • 버전 : 1.1.0
  • 분할 :
나뉘다
'test' 2000
'train' 49401
'validation' 2000
  • 특징 :
{
    "id": {
        "dtype": "int32",
        "id": null,
        "_type": "Value"
    },
    "sentence1": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "sentence2": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "label": {
        "num_classes": 2,
        "names": [
            "0",
            "1"
        ],
        "names_file": null,
        "id": null,
        "_type": "ClassLabel"
    }
}

TFDS에 이 데이터세트를 로드하려면 다음 명령어를 사용하세요.

ds = tfds.load('huggingface:paws-x/ko')
  • 설명 :
PAWS-X, a multilingual version of PAWS (Paraphrase Adversaries from Word Scrambling) for six languages.

This dataset contains 23,659 human translated PAWS evaluation pairs and 296,406 machine
translated training pairs in six typologically distinct languages: French, Spanish, German,
Chinese, Japanese, and Korean. English language is available by default. All translated
pairs are sourced from examples in PAWS-Wiki.

For further details, see the accompanying paper: PAWS-X: A Cross-lingual Adversarial Dataset
for Paraphrase Identification (https://arxiv.org/abs/1908.11828)

Note: There might be some missing or wrong labels in the dataset and we have replaced them with -1.
  • 라이센스 : 데이터 세트는 어떤 목적으로든 자유롭게 사용할 수 있지만 Google LLC("Google")를 데이터 소스로 인정하는 것이 좋습니다. 데이터 세트는 명시적이든 묵시적이든 어떠한 보증도 없이 "있는 그대로" 제공됩니다. Google은 데이터 세트 사용으로 인해 발생하는 직간접적인 피해에 대해 모든 책임을 지지 않습니다.
  • 버전 : 1.1.0
  • 분할 :
나뉘다
'test' 2000
'train' 49401
'validation' 2000
  • 특징 :
{
    "id": {
        "dtype": "int32",
        "id": null,
        "_type": "Value"
    },
    "sentence1": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "sentence2": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "label": {
        "num_classes": 2,
        "names": [
            "0",
            "1"
        ],
        "names_file": null,
        "id": null,
        "_type": "ClassLabel"
    }
}

zh

TFDS에 이 데이터세트를 로드하려면 다음 명령어를 사용하세요.

ds = tfds.load('huggingface:paws-x/zh')
  • 설명 :
PAWS-X, a multilingual version of PAWS (Paraphrase Adversaries from Word Scrambling) for six languages.

This dataset contains 23,659 human translated PAWS evaluation pairs and 296,406 machine
translated training pairs in six typologically distinct languages: French, Spanish, German,
Chinese, Japanese, and Korean. English language is available by default. All translated
pairs are sourced from examples in PAWS-Wiki.

For further details, see the accompanying paper: PAWS-X: A Cross-lingual Adversarial Dataset
for Paraphrase Identification (https://arxiv.org/abs/1908.11828)

Note: There might be some missing or wrong labels in the dataset and we have replaced them with -1.
  • 라이센스 : 데이터 세트는 어떤 목적으로든 자유롭게 사용할 수 있지만 Google LLC("Google")를 데이터 소스로 인정하는 것이 좋습니다. 데이터 세트는 명시적이든 묵시적이든 어떠한 보증도 없이 "있는 그대로" 제공됩니다. Google은 데이터 세트 사용으로 인해 발생하는 직간접적인 피해에 대해 모든 책임을 지지 않습니다.
  • 버전 : 1.1.0
  • 분할 :
나뉘다
'test' 2000
'train' 49401
'validation' 2000
  • 특징 :
{
    "id": {
        "dtype": "int32",
        "id": null,
        "_type": "Value"
    },
    "sentence1": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "sentence2": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "label": {
        "num_classes": 2,
        "names": [
            "0",
            "1"
        ],
        "names_file": null,
        "id": null,
        "_type": "ClassLabel"
    }
}