TFDS اکنون از فرمت Croissant 🥐 پشتیبانی می کند! برای دانستن بیشتر مستندات را بخوانید.

این صفحه به‌وسیله ‏Cloud Translation API‏ ترجمه شده است.

lm1b

منابع:

متن_ساده

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:lm1b/plain_text')

شرح :

A benchmark corpus to be used for measuring progress in statistical language modeling. This has almost one billion words in the training data.

مجوز : مجوز شناخته شده ای وجود ندارد
نسخه : 1.0.0
تقسیم ها :

شکاف	مثال ها
`'test'`	306688
`'train'`	30301028

امکانات :

{
    "text": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    }
}

جز در مواردی که غیر از این ذکر شده باشد،‌محتوای این صفحه تحت مجوز Creative Commons Attribution 4.0 License است. نمونه کدها نیز دارای مجوز Apache 2.0 License است. برای اطلاع از جزئیات، به خطمشی‌های سایت Google Developers‏ مراجعه کنید. جاوا علامت تجاری ثبت‌شده Oracle و/یا شرکت‌های وابسته به آن است.

تاریخ آخرین به‌روزرسانی 2023-12-01 به‌وقت ساعت هماهنگ جهانی.