patas-x

Referências:

pt

Use o seguinte comando para carregar esse conjunto de dados no TFDS:

ds = tfds.load('huggingface:paws-x/en')
  • Descrição :
PAWS-X, a multilingual version of PAWS (Paraphrase Adversaries from Word Scrambling) for six languages.

This dataset contains 23,659 human translated PAWS evaluation pairs and 296,406 machine
translated training pairs in six typologically distinct languages: French, Spanish, German,
Chinese, Japanese, and Korean. English language is available by default. All translated
pairs are sourced from examples in PAWS-Wiki.

For further details, see the accompanying paper: PAWS-X: A Cross-lingual Adversarial Dataset
for Paraphrase Identification (https://arxiv.org/abs/1908.11828)

Note: There might be some missing or wrong labels in the dataset and we have replaced them with -1.
  • Licença : O conjunto de dados pode ser usado livremente para qualquer finalidade, embora seja apreciado o reconhecimento da Google LLC ("Google") como fonte de dados. O conjunto de dados é fornecido "COMO ESTÁ" sem qualquer garantia, expressa ou implícita. O Google se isenta de qualquer responsabilidade por quaisquer danos, diretos ou indiretos, resultantes do uso do conjunto de dados.
  • Versão : 1.1.0
  • Divisões :
Dividir Exemplos
'test' 2000
'train' 49401
'validation' 2000
  • Características :
{
    "id": {
        "dtype": "int32",
        "id": null,
        "_type": "Value"
    },
    "sentence1": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "sentence2": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "label": {
        "num_classes": 2,
        "names": [
            "0",
            "1"
        ],
        "names_file": null,
        "id": null,
        "_type": "ClassLabel"
    }
}

de

Use o seguinte comando para carregar esse conjunto de dados no TFDS:

ds = tfds.load('huggingface:paws-x/de')
  • Descrição :
PAWS-X, a multilingual version of PAWS (Paraphrase Adversaries from Word Scrambling) for six languages.

This dataset contains 23,659 human translated PAWS evaluation pairs and 296,406 machine
translated training pairs in six typologically distinct languages: French, Spanish, German,
Chinese, Japanese, and Korean. English language is available by default. All translated
pairs are sourced from examples in PAWS-Wiki.

For further details, see the accompanying paper: PAWS-X: A Cross-lingual Adversarial Dataset
for Paraphrase Identification (https://arxiv.org/abs/1908.11828)

Note: There might be some missing or wrong labels in the dataset and we have replaced them with -1.
  • Licença : O conjunto de dados pode ser usado livremente para qualquer finalidade, embora seja apreciado o reconhecimento da Google LLC ("Google") como fonte de dados. O conjunto de dados é fornecido "COMO ESTÁ" sem qualquer garantia, expressa ou implícita. O Google se isenta de qualquer responsabilidade por quaisquer danos, diretos ou indiretos, resultantes do uso do conjunto de dados.
  • Versão : 1.1.0
  • Divisões :
Dividir Exemplos
'test' 2000
'train' 49401
'validation' 2000
  • Características :
{
    "id": {
        "dtype": "int32",
        "id": null,
        "_type": "Value"
    },
    "sentence1": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "sentence2": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "label": {
        "num_classes": 2,
        "names": [
            "0",
            "1"
        ],
        "names_file": null,
        "id": null,
        "_type": "ClassLabel"
    }
}

es

Use o seguinte comando para carregar esse conjunto de dados no TFDS:

ds = tfds.load('huggingface:paws-x/es')
  • Descrição :
PAWS-X, a multilingual version of PAWS (Paraphrase Adversaries from Word Scrambling) for six languages.

This dataset contains 23,659 human translated PAWS evaluation pairs and 296,406 machine
translated training pairs in six typologically distinct languages: French, Spanish, German,
Chinese, Japanese, and Korean. English language is available by default. All translated
pairs are sourced from examples in PAWS-Wiki.

For further details, see the accompanying paper: PAWS-X: A Cross-lingual Adversarial Dataset
for Paraphrase Identification (https://arxiv.org/abs/1908.11828)

Note: There might be some missing or wrong labels in the dataset and we have replaced them with -1.
  • Licença : O conjunto de dados pode ser usado livremente para qualquer finalidade, embora seja apreciado o reconhecimento da Google LLC ("Google") como fonte de dados. O conjunto de dados é fornecido "COMO ESTÁ" sem qualquer garantia, expressa ou implícita. O Google se isenta de qualquer responsabilidade por quaisquer danos, diretos ou indiretos, resultantes do uso do conjunto de dados.
  • Versão : 1.1.0
  • Divisões :
Dividir Exemplos
'test' 2000
'train' 49401
'validation' 2000
  • Características :
{
    "id": {
        "dtype": "int32",
        "id": null,
        "_type": "Value"
    },
    "sentence1": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "sentence2": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "label": {
        "num_classes": 2,
        "names": [
            "0",
            "1"
        ],
        "names_file": null,
        "id": null,
        "_type": "ClassLabel"
    }
}

fr

Use o seguinte comando para carregar esse conjunto de dados no TFDS:

ds = tfds.load('huggingface:paws-x/fr')
  • Descrição :
PAWS-X, a multilingual version of PAWS (Paraphrase Adversaries from Word Scrambling) for six languages.

This dataset contains 23,659 human translated PAWS evaluation pairs and 296,406 machine
translated training pairs in six typologically distinct languages: French, Spanish, German,
Chinese, Japanese, and Korean. English language is available by default. All translated
pairs are sourced from examples in PAWS-Wiki.

For further details, see the accompanying paper: PAWS-X: A Cross-lingual Adversarial Dataset
for Paraphrase Identification (https://arxiv.org/abs/1908.11828)

Note: There might be some missing or wrong labels in the dataset and we have replaced them with -1.
  • Licença : O conjunto de dados pode ser usado livremente para qualquer finalidade, embora seja apreciado o reconhecimento da Google LLC ("Google") como fonte de dados. O conjunto de dados é fornecido "COMO ESTÁ" sem qualquer garantia, expressa ou implícita. O Google se isenta de qualquer responsabilidade por quaisquer danos, diretos ou indiretos, resultantes do uso do conjunto de dados.
  • Versão : 1.1.0
  • Divisões :
Dividir Exemplos
'test' 2000
'train' 49401
'validation' 2000
  • Características :
{
    "id": {
        "dtype": "int32",
        "id": null,
        "_type": "Value"
    },
    "sentence1": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "sentence2": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "label": {
        "num_classes": 2,
        "names": [
            "0",
            "1"
        ],
        "names_file": null,
        "id": null,
        "_type": "ClassLabel"
    }
}

ja

Use o seguinte comando para carregar esse conjunto de dados no TFDS:

ds = tfds.load('huggingface:paws-x/ja')
  • Descrição :
PAWS-X, a multilingual version of PAWS (Paraphrase Adversaries from Word Scrambling) for six languages.

This dataset contains 23,659 human translated PAWS evaluation pairs and 296,406 machine
translated training pairs in six typologically distinct languages: French, Spanish, German,
Chinese, Japanese, and Korean. English language is available by default. All translated
pairs are sourced from examples in PAWS-Wiki.

For further details, see the accompanying paper: PAWS-X: A Cross-lingual Adversarial Dataset
for Paraphrase Identification (https://arxiv.org/abs/1908.11828)

Note: There might be some missing or wrong labels in the dataset and we have replaced them with -1.
  • Licença : O conjunto de dados pode ser usado livremente para qualquer finalidade, embora seja apreciado o reconhecimento da Google LLC ("Google") como fonte de dados. O conjunto de dados é fornecido "COMO ESTÁ" sem qualquer garantia, expressa ou implícita. O Google se isenta de qualquer responsabilidade por quaisquer danos, diretos ou indiretos, resultantes do uso do conjunto de dados.
  • Versão : 1.1.0
  • Divisões :
Dividir Exemplos
'test' 2000
'train' 49401
'validation' 2000
  • Características :
{
    "id": {
        "dtype": "int32",
        "id": null,
        "_type": "Value"
    },
    "sentence1": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "sentence2": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "label": {
        "num_classes": 2,
        "names": [
            "0",
            "1"
        ],
        "names_file": null,
        "id": null,
        "_type": "ClassLabel"
    }
}

ko

Use o seguinte comando para carregar esse conjunto de dados no TFDS:

ds = tfds.load('huggingface:paws-x/ko')
  • Descrição :
PAWS-X, a multilingual version of PAWS (Paraphrase Adversaries from Word Scrambling) for six languages.

This dataset contains 23,659 human translated PAWS evaluation pairs and 296,406 machine
translated training pairs in six typologically distinct languages: French, Spanish, German,
Chinese, Japanese, and Korean. English language is available by default. All translated
pairs are sourced from examples in PAWS-Wiki.

For further details, see the accompanying paper: PAWS-X: A Cross-lingual Adversarial Dataset
for Paraphrase Identification (https://arxiv.org/abs/1908.11828)

Note: There might be some missing or wrong labels in the dataset and we have replaced them with -1.
  • Licença : O conjunto de dados pode ser usado livremente para qualquer finalidade, embora seja apreciado o reconhecimento da Google LLC ("Google") como fonte de dados. O conjunto de dados é fornecido "COMO ESTÁ" sem qualquer garantia, expressa ou implícita. O Google se isenta de qualquer responsabilidade por quaisquer danos, diretos ou indiretos, resultantes do uso do conjunto de dados.
  • Versão : 1.1.0
  • Divisões :
Dividir Exemplos
'test' 2000
'train' 49401
'validation' 2000
  • Características :
{
    "id": {
        "dtype": "int32",
        "id": null,
        "_type": "Value"
    },
    "sentence1": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "sentence2": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "label": {
        "num_classes": 2,
        "names": [
            "0",
            "1"
        ],
        "names_file": null,
        "id": null,
        "_type": "ClassLabel"
    }
}

zh

Use o seguinte comando para carregar esse conjunto de dados no TFDS:

ds = tfds.load('huggingface:paws-x/zh')
  • Descrição :
PAWS-X, a multilingual version of PAWS (Paraphrase Adversaries from Word Scrambling) for six languages.

This dataset contains 23,659 human translated PAWS evaluation pairs and 296,406 machine
translated training pairs in six typologically distinct languages: French, Spanish, German,
Chinese, Japanese, and Korean. English language is available by default. All translated
pairs are sourced from examples in PAWS-Wiki.

For further details, see the accompanying paper: PAWS-X: A Cross-lingual Adversarial Dataset
for Paraphrase Identification (https://arxiv.org/abs/1908.11828)

Note: There might be some missing or wrong labels in the dataset and we have replaced them with -1.
  • Licença : O conjunto de dados pode ser usado livremente para qualquer finalidade, embora seja apreciado o reconhecimento da Google LLC ("Google") como fonte de dados. O conjunto de dados é fornecido "COMO ESTÁ" sem qualquer garantia, expressa ou implícita. O Google se isenta de qualquer responsabilidade por quaisquer danos, diretos ou indiretos, resultantes do uso do conjunto de dados.
  • Versão : 1.1.0
  • Divisões :
Dividir Exemplos
'test' 2000
'train' 49401
'validation' 2000
  • Características :
{
    "id": {
        "dtype": "int32",
        "id": null,
        "_type": "Value"
    },
    "sentence1": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "sentence2": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "label": {
        "num_classes": 2,
        "names": [
            "0",
            "1"
        ],
        "names_file": null,
        "id": null,
        "_type": "ClassLabel"
    }
}