zampe

Riferimenti:

etichettato_finale

Utilizzare il comando seguente per caricare questo set di dati in TFDS:

ds = tfds.load('huggingface:paws/labeled_final')
  • Descrizione :
PAWS: Paraphrase Adversaries from Word Scrambling

This dataset contains 108,463 human-labeled and 656k noisily labeled pairs that feature
the importance of modeling structure, context, and word order information for the problem
of paraphrase identification. The dataset has two subsets, one based on Wikipedia and the
other one based on the Quora Question Pairs (QQP) dataset.

For further details, see the accompanying paper: PAWS: Paraphrase Adversaries from Word Scrambling
(https://arxiv.org/abs/1904.01130)

PAWS-QQP is not available due to license of QQP. It must be reconstructed by downloading the original
data and then running our scripts to produce the data and attach the labels.

Note: There might be some missing or wrong labels in the dataset and we have replaced them with -1.
  • Licenza : il set di dati può essere utilizzato liberamente per qualsiasi scopo, anche se sarebbe apprezzato il riconoscimento di Google LLC ("Google") come fonte dei dati. Il set di dati viene fornito "COSÌ COM'È" senza alcuna garanzia, espressa o implicita. Google declina ogni responsabilità per eventuali danni, diretti o indiretti, derivanti dall'utilizzo del set di dati.
  • Versione : 1.1.0
  • Divide :
Diviso Esempi
'test' 8000
'train' 49401
'validation' 8000
  • Caratteristiche :
{
    "id": {
        "dtype": "int32",
        "id": null,
        "_type": "Value"
    },
    "sentence1": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "sentence2": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "label": {
        "num_classes": 2,
        "names": [
            "0",
            "1"
        ],
        "names_file": null,
        "id": null,
        "_type": "ClassLabel"
    }
}

etichettato_scambia

Utilizzare il comando seguente per caricare questo set di dati in TFDS:

ds = tfds.load('huggingface:paws/labeled_swap')
  • Descrizione :
PAWS: Paraphrase Adversaries from Word Scrambling

This dataset contains 108,463 human-labeled and 656k noisily labeled pairs that feature
the importance of modeling structure, context, and word order information for the problem
of paraphrase identification. The dataset has two subsets, one based on Wikipedia and the
other one based on the Quora Question Pairs (QQP) dataset.

For further details, see the accompanying paper: PAWS: Paraphrase Adversaries from Word Scrambling
(https://arxiv.org/abs/1904.01130)

PAWS-QQP is not available due to license of QQP. It must be reconstructed by downloading the original
data and then running our scripts to produce the data and attach the labels.

Note: There might be some missing or wrong labels in the dataset and we have replaced them with -1.
  • Licenza : il set di dati può essere utilizzato liberamente per qualsiasi scopo, anche se sarebbe apprezzato il riconoscimento di Google LLC ("Google") come fonte dei dati. Il set di dati viene fornito "COSÌ COM'È" senza alcuna garanzia, espressa o implicita. Google declina ogni responsabilità per eventuali danni, diretti o indiretti, derivanti dall'utilizzo del set di dati.
  • Versione : 1.1.0
  • Divide :
Diviso Esempi
'train' 30397
  • Caratteristiche :
{
    "id": {
        "dtype": "int32",
        "id": null,
        "_type": "Value"
    },
    "sentence1": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "sentence2": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "label": {
        "num_classes": 2,
        "names": [
            "0",
            "1"
        ],
        "names_file": null,
        "id": null,
        "_type": "ClassLabel"
    }
}

senzaetichetta_final

Utilizzare il comando seguente per caricare questo set di dati in TFDS:

ds = tfds.load('huggingface:paws/unlabeled_final')
  • Descrizione :
PAWS: Paraphrase Adversaries from Word Scrambling

This dataset contains 108,463 human-labeled and 656k noisily labeled pairs that feature
the importance of modeling structure, context, and word order information for the problem
of paraphrase identification. The dataset has two subsets, one based on Wikipedia and the
other one based on the Quora Question Pairs (QQP) dataset.

For further details, see the accompanying paper: PAWS: Paraphrase Adversaries from Word Scrambling
(https://arxiv.org/abs/1904.01130)

PAWS-QQP is not available due to license of QQP. It must be reconstructed by downloading the original
data and then running our scripts to produce the data and attach the labels.

Note: There might be some missing or wrong labels in the dataset and we have replaced them with -1.
  • Licenza : il set di dati può essere utilizzato liberamente per qualsiasi scopo, anche se sarebbe apprezzato il riconoscimento di Google LLC ("Google") come fonte dei dati. Il set di dati viene fornito "COSÌ COM'È" senza alcuna garanzia, espressa o implicita. Google declina ogni responsabilità per eventuali danni, diretti o indiretti, derivanti dall'utilizzo del set di dati.
  • Versione : 1.1.0
  • Divide :
Diviso Esempi
'train' 645652
'validation' 10000
  • Caratteristiche :
{
    "id": {
        "dtype": "int32",
        "id": null,
        "_type": "Value"
    },
    "sentence1": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "sentence2": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "label": {
        "num_classes": 2,
        "names": [
            "0",
            "1"
        ],
        "names_file": null,
        "id": null,
        "_type": "ClassLabel"
    }
}