телугу_новости

Использованная литература:

Используйте следующую команду, чтобы загрузить этот набор данных в TFDS:

ds = tfds.load('huggingface:telugu_news')
  • Описание :
This dataset contains Telugu language news articles along with respective
topic labels (business, editorial, entertainment, nation, sport) extracted from
the daily Andhra Jyoti. This dataset could be used to build Classification and Language Models.
  • Лицензия : файлы данных © Первоначальные авторы
  • Версия : 1.1.0
  • Сплиты :
Расколоть Примеры
'test' 4329
'train' 17312
  • Особенности :
{
    "sno": {
        "dtype": "int32",
        "id": null,
        "_type": "Value"
    },
    "date": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "heading": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "body": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "topic": {
        "num_classes": 5,
        "names": [
            "business",
            "editorial",
            "entertainment",
            "nation",
            "sports"
        ],
        "names_file": null,
        "id": null,
        "_type": "ClassLabel"
    }
}