ช่วยปกป้อง Great Barrier Reef กับ TensorFlow บน Kaggle เข้าร่วมท้าทาย

lm1b

 • รายละเอียด:

คลังข้อมูลเกณฑ์มาตรฐานที่จะใช้สำหรับวัดความก้าวหน้าในการสร้างแบบจำลองภาษาทางสถิติ มีเกือบหนึ่งพันล้านคำในข้อมูลการฝึกอบรม

 • โฮมเพจ: http://www.statmt.org/lm-benchmark/

 • รหัสที่มา: tfds.text.Lm1b

 • รุ่น:

  • 1.1.0 (เริ่มต้น): ไม่มีบันทึกประจำรุ่น
 • ขนาดการดาวน์โหลด: 1.67 GiB

 • ขนาดชุด: 4.40 GiB

 • ออโต้แคช ( เอกสาร ): ไม่มี

 • แยก:

แยก ตัวอย่าง
'test' 306,688
'train' 30,301,028
 • คุณสมบัติ:
FeaturesDict({
  'text': Text(shape=(), dtype=tf.string),
})
 • อ้างอิง:
@article{DBLP:journals/corr/ChelbaMSGBK13,
 author  = {Ciprian Chelba and
        Tomas Mikolov and
        Mike Schuster and
        Qi Ge and
        Thorsten Brants and
        Phillipp Koehn},
 title   = {One Billion Word Benchmark for Measuring Progress in Statistical Language
        Modeling},
 journal  = {CoRR},
 volume  = {abs/1312.3005},
 year   = {2013},
 url    = {http://arxiv.org/abs/1312.3005},
 archivePrefix = {arXiv},
 eprint  = {1312.3005},
 timestamp = {Mon, 13 Aug 2018 16:46:16 +0200},
 biburl  = {https://dblp.org/rec/bib/journals/corr/ChelbaMSGBK13},
 bibsource = {dblp computer science bibliography, https://dblp.org}
}