TFDS รองรับ รูปแบบ Croissant 🥐 แล้ว! อ่าน เอกสาร เพื่อทราบข้อมูลเพิ่มเติม

หน้านี้ได้รับการแปลโดย Cloud Translation API

lm1b

อ้างอิง:

ข้อความธรรมดา

ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:

ds = tfds.load('huggingface:lm1b/plain_text')

คำอธิบาย :

A benchmark corpus to be used for measuring progress in statistical language modeling. This has almost one billion words in the training data.

ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
เวอร์ชัน : 1.0.0
แยก :

แยก	ตัวอย่าง
`'test'`	306688
`'train'`	30301028

คุณสมบัติ :

{
    "text": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    }
}

เนื้อหาของหน้าเว็บนี้ได้รับอนุญาตภายใต้ใบอนุญาตที่ต้องระบุที่มาของครีเอทีฟคอมมอนส์ 4.0 และตัวอย่างโค้ดได้รับอนุญาตภายใต้ใบอนุญาต Apache 2.0 เว้นแต่จะระบุไว้เป็นอย่างอื่น โปรดดูรายละเอียดที่นโยบายเว็บไซต์ Google Developers Java เป็นเครื่องหมายการค้าจดทะเบียนของ Oracle และ/หรือบริษัทในเครือ

อัปเดตล่าสุด 2023-12-01 UTC