urdu_sentiment_corpus

ข้อมูลอ้างอิง:

ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:

ds = tfds.load('huggingface:urdu_sentiment_corpus')
  • คำอธิบาย :
“Urdu Sentiment Corpus” (USC) shares the dat of Urdu tweets for the sentiment analysis and polarity detection.
The dataset is consisting of tweets and overall, the dataset is comprising over 17, 185 tokens
with 52% records as positive, and 48 % records as negative.
  • ใบอนุญาต : ไม่ทราบใบอนุญาต
  • เวอร์ชัน : 1.0.0
  • แยก :
แยก ตัวอย่าง
'train' 1000
  • คุณสมบัติ :
{
    "sentence": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "sentiment": {
        "num_classes": 3,
        "names": [
            "P",
            "N",
            "O"
        ],
        "names_file": null,
        "id": null,
        "_type": "ClassLabel"
    }
}