mahzan

Referanslar:

Bu veri kümesini TFDS'ye yüklemek için aşağıdaki komutu kullanın:

ds = tfds.load('huggingface:makhzan')
  • Açıklama :
An Urdu text corpus for machine learning, natural language processing and linguistic analysis.
  • Lisans : /text dizinindeki tüm dosyalar standart telif hakkı kapsamındadır. Her metin parçası, ilgili telif hakkı sahiplerinin açık izniyle bu havuza dahil edilmiştir. Her dosya için etiket. Bu metni analiz, araştırma ve geliştirme için kullanmakta özgürsünüz, ancak bu metni yeniden dağıtmanıza veya yeniden yayınlamanıza izin verilmemektedir. /text dizinindeki dosyalara daha az kısıtlayıcı bir lisansın uygulanabileceği bazı durumlar aşağıda sunulmuştur. Bazı durumlarda, telif hakkı içermeyen metinler, ortak çalışanlarımızın sıkı çalışmasıyla dijital olarak çoğaltılmıştır. Bu gibi durumlarda, dosyanın meta verilerindeki bir not alanına mümkün olan yerlerde uygun kişileri kaydettik ve bu metni herhangi bir biçimde yeniden dağıtmadan önce onlarla iletişime geçmenizi şiddetle tavsiye ederiz. Metinle birlikte ayrı bir lisans sağlandığında, ilgili verileri yayın alanında bir dosyanın meta verilerinde sağladık.
  • Sürüm : 1.0.0
  • Bölmeler :
Bölmek Örnekler
'train' 5522
  • Özellikler :
{
    "file_id": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "metadata": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "title": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "num-words": {
        "dtype": "int64",
        "id": null,
        "_type": "Value"
    },
    "contains-non-urdu-languages": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "document_body": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    }
}