викитекст_tl39

Использованная литература:

викитекст-tl-39

Используйте следующую команду, чтобы загрузить этот набор данных в TFDS:

ds = tfds.load('huggingface:wikitext_tl39/wikitext-tl-39')
  • Описание :
Large scale, unlabeled text dataset with 39 Million tokens in the training set. Inspired by the original WikiText Long Term Dependency dataset (Merity et al., 2016). TL means "Tagalog." Originally published in Cruz & Cheng (2019).
  • Лицензия : GPL-3.0.
  • Версия : 1.0.0
  • Расколы :
Расколоть Примеры
'test' 376737
'train' 1766072
'validation' 381763
  • Функции :
{
    "text": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    }
}