tmu_gfm_dataset

Người giới thiệu:

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:tmu_gfm_dataset')
  • Mô tả :
A dataset for GEC metrics with manual evaluations of grammaticality, fluency, and meaning preservation for system outputs. More detail about the creation of the dataset can be found in Yoshimura et al. (2020).
  • Giấy phép : Không có giấy phép đã biết
  • Phiên bản : 1.1.0
  • Tách :
Tách ra Các ví dụ
'train' 4221
  • Các tính năng :
{
    "source": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "output": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "grammer": {
        "feature": {
            "dtype": "int32",
            "id": null,
            "_type": "Value"
        },
        "length": -1,
        "id": null,
        "_type": "Sequence"
    },
    "fluency": {
        "feature": {
            "dtype": "int32",
            "id": null,
            "_type": "Value"
        },
        "length": -1,
        "id": null,
        "_type": "Sequence"
    },
    "meaning": {
        "feature": {
            "dtype": "int32",
            "id": null,
            "_type": "Value"
        },
        "length": -1,
        "id": null,
        "_type": "Sequence"
    },
    "system": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "ave_g": {
        "dtype": "float32",
        "id": null,
        "_type": "Value"
    },
    "ave_f": {
        "dtype": "float32",
        "id": null,
        "_type": "Value"
    },
    "ave_m": {
        "dtype": "float32",
        "id": null,
        "_type": "Value"
    }
}