гумикроредактирование

Использованная литература:

подзадача-1

Используйте следующую команду, чтобы загрузить этот набор данных в TFDS:

ds = tfds.load('huggingface:humicroedit/subtask-1')
  • Описание :
This new dataset is designed to assess the funniness of edited news headlines.
  • Лицензия : Нет известной лицензии.
  • Версия : 0.0.0
  • Расколы :
Расколоть Примеры
'funlines' 8248
'test' 3024
'train' 9652
'validation' 2419
  • Функции :
{
    "id": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "original": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "edit": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "grades": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "meanGrade": {
        "dtype": "float32",
        "id": null,
        "_type": "Value"
    }
}

подзадача-2

Используйте следующую команду, чтобы загрузить этот набор данных в TFDS:

ds = tfds.load('huggingface:humicroedit/subtask-2')
  • Описание :
This new dataset is designed to assess the funniness of edited news headlines.
  • Лицензия : Нет известной лицензии.
  • Версия : 0.0.0
  • Расколы :
Расколоть Примеры
'funlines' 1958 год
'test' 2960
'train' 9381
'validation' 2355
  • Функции :
{
    "id": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "original1": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "edit1": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "grades1": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "meanGrade1": {
        "dtype": "float32",
        "id": null,
        "_type": "Value"
    },
    "original2": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "edit2": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "grades2": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "meanGrade2": {
        "dtype": "float32",
        "id": null,
        "_type": "Value"
    },
    "label": {
        "num_classes": 3,
        "names": [
            "equal",
            "sentence1",
            "sentence2"
        ],
        "names_file": null,
        "id": null,
        "_type": "ClassLabel"
    }
}