ฮิวไมโครแก้ไข

อ้างอิง:

งานย่อย-1

ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:

ds = tfds.load('huggingface:humicroedit/subtask-1')
  • คำอธิบาย :
This new dataset is designed to assess the funniness of edited news headlines.
  • ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
  • เวอร์ชั่น : 0.0.0
  • แยก :
แยก ตัวอย่าง
'funlines' 8248
'test' 3024
'train' 9652
'validation' 2419
  • คุณสมบัติ :
{
    "id": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "original": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "edit": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "grades": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "meanGrade": {
        "dtype": "float32",
        "id": null,
        "_type": "Value"
    }
}

งานย่อย-2

ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:

ds = tfds.load('huggingface:humicroedit/subtask-2')
  • คำอธิบาย :
This new dataset is designed to assess the funniness of edited news headlines.
  • ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
  • เวอร์ชั่น : 0.0.0
  • แยก :
แยก ตัวอย่าง
'funlines' 2501
'test' 2960
'train' 9381
'validation' 2355
  • คุณสมบัติ :
{
    "id": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "original1": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "edit1": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "grades1": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "meanGrade1": {
        "dtype": "float32",
        "id": null,
        "_type": "Value"
    },
    "original2": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "edit2": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "grades2": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "meanGrade2": {
        "dtype": "float32",
        "id": null,
        "_type": "Value"
    },
    "label": {
        "num_classes": 3,
        "names": [
            "equal",
            "sentence1",
            "sentence2"
        ],
        "names_file": null,
        "id": null,
        "_type": "ClassLabel"
    }
}