pattes

Références:

label_final

Utilisez la commande suivante pour charger cet ensemble de données dans TFDS :

ds = tfds.load('huggingface:paws/labeled_final')
  • Descriptif :
PAWS: Paraphrase Adversaries from Word Scrambling

This dataset contains 108,463 human-labeled and 656k noisily labeled pairs that feature
the importance of modeling structure, context, and word order information for the problem
of paraphrase identification. The dataset has two subsets, one based on Wikipedia and the
other one based on the Quora Question Pairs (QQP) dataset.

For further details, see the accompanying paper: PAWS: Paraphrase Adversaries from Word Scrambling
(https://arxiv.org/abs/1904.01130)

PAWS-QQP is not available due to license of QQP. It must be reconstructed by downloading the original
data and then running our scripts to produce the data and attach the labels.

Note: There might be some missing or wrong labels in the dataset and we have replaced them with -1.
  • Licence : L'ensemble de données peut être librement utilisé à toutes fins, bien que la reconnaissance de Google LLC ("Google") en tant que source de données soit appréciée. L'ensemble de données est fourni "TEL QUEL" sans aucune garantie, expresse ou implicite. Google décline toute responsabilité pour tout dommage, direct ou indirect, résultant de l'utilisation de l'ensemble de données.
  • Version : 1.1.0
  • Fractionnements :
Diviser Exemples
'test' 8000
'train' 49401
'validation' 8000
  • Caractéristiques :
{
    "id": {
        "dtype": "int32",
        "id": null,
        "_type": "Value"
    },
    "sentence1": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "sentence2": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "label": {
        "num_classes": 2,
        "names": [
            "0",
            "1"
        ],
        "names_file": null,
        "id": null,
        "_type": "ClassLabel"
    }
}

label_swap

Utilisez la commande suivante pour charger cet ensemble de données dans TFDS :

ds = tfds.load('huggingface:paws/labeled_swap')
  • Descriptif :
PAWS: Paraphrase Adversaries from Word Scrambling

This dataset contains 108,463 human-labeled and 656k noisily labeled pairs that feature
the importance of modeling structure, context, and word order information for the problem
of paraphrase identification. The dataset has two subsets, one based on Wikipedia and the
other one based on the Quora Question Pairs (QQP) dataset.

For further details, see the accompanying paper: PAWS: Paraphrase Adversaries from Word Scrambling
(https://arxiv.org/abs/1904.01130)

PAWS-QQP is not available due to license of QQP. It must be reconstructed by downloading the original
data and then running our scripts to produce the data and attach the labels.

Note: There might be some missing or wrong labels in the dataset and we have replaced them with -1.
  • Licence : L'ensemble de données peut être librement utilisé à toutes fins, bien que la reconnaissance de Google LLC ("Google") en tant que source de données soit appréciée. L'ensemble de données est fourni "TEL QUEL" sans aucune garantie, expresse ou implicite. Google décline toute responsabilité pour tout dommage, direct ou indirect, résultant de l'utilisation de l'ensemble de données.
  • Version : 1.1.0
  • Fractionnements :
Diviser Exemples
'train' 30397
  • Caractéristiques :
{
    "id": {
        "dtype": "int32",
        "id": null,
        "_type": "Value"
    },
    "sentence1": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "sentence2": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "label": {
        "num_classes": 2,
        "names": [
            "0",
            "1"
        ],
        "names_file": null,
        "id": null,
        "_type": "ClassLabel"
    }
}

unlabeled_final

Utilisez la commande suivante pour charger cet ensemble de données dans TFDS :

ds = tfds.load('huggingface:paws/unlabeled_final')
  • Descriptif :
PAWS: Paraphrase Adversaries from Word Scrambling

This dataset contains 108,463 human-labeled and 656k noisily labeled pairs that feature
the importance of modeling structure, context, and word order information for the problem
of paraphrase identification. The dataset has two subsets, one based on Wikipedia and the
other one based on the Quora Question Pairs (QQP) dataset.

For further details, see the accompanying paper: PAWS: Paraphrase Adversaries from Word Scrambling
(https://arxiv.org/abs/1904.01130)

PAWS-QQP is not available due to license of QQP. It must be reconstructed by downloading the original
data and then running our scripts to produce the data and attach the labels.

Note: There might be some missing or wrong labels in the dataset and we have replaced them with -1.
  • Licence : L'ensemble de données peut être librement utilisé à toutes fins, bien que la reconnaissance de Google LLC ("Google") en tant que source de données soit appréciée. L'ensemble de données est fourni "TEL QUEL" sans aucune garantie, expresse ou implicite. Google décline toute responsabilité pour tout dommage, direct ou indirect, résultant de l'utilisation de l'ensemble de données.
  • Version : 1.1.0
  • Fractionnements :
Diviser Exemples
'train' 645652
'validation' 10000
  • Caractéristiques :
{
    "id": {
        "dtype": "int32",
        "id": null,
        "_type": "Value"
    },
    "sentence1": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "sentence2": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "label": {
        "num_classes": 2,
        "names": [
            "0",
            "1"
        ],
        "names_file": null,
        "id": null,
        "_type": "ClassLabel"
    }
}