psc

참조:

다음 명령을 사용하여 TFDS에서 이 데이터세트를 로드합니다.

ds = tfds.load('huggingface:psc')
  • 설명 :
The Polish Summaries Corpus contains news articles and their summaries. We used summaries of the same article as positive pairs and sampled the most similar summaries of different articles as negatives.
  • 라이선스 : CC BY-SA 3.0
  • 버전 : 1.1.0
  • 분할 :
나뉘다
'test' 1078
'train' 4302
  • 특징 :
{
    "extract_text": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "summary_text": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "label": {
        "num_classes": 2,
        "names": [
            "0",
            "1"
        ],
        "names_file": null,
        "id": null,
        "_type": "ClassLabel"
    }
}