ช่วยปกป้อง Great Barrier Reef กับ TensorFlow บน Kaggle เข้าร่วมท้าทาย

ag_news_subset

  • รายละเอียด:

AG เป็นการรวบรวมบทความข่าวมากกว่า 1 ล้านบทความ รวบรวมบทความข่าวจากแหล่งข่าวมากกว่า 2,000 แห่งโดย ComeToMyHead ในกิจกรรมมากกว่า 1 ปี ComeToMyHead เป็นเสิร์ชเอ็นจิ้นข่าวเชิงวิชาการที่เริ่มดำเนินการตั้งแต่เดือนกรกฎาคม 2547 ชุดข้อมูลนี้จัดทำโดยชุมชนวิชาการเพื่อวัตถุประสงค์ในการวิจัยในการทำเหมืองข้อมูล (การจัดกลุ่ม การจัดประเภท ฯลฯ) การดึงข้อมูล (อันดับ การค้นหา ฯลฯ ), xml, การบีบอัดข้อมูล การสตรีมข้อมูล และกิจกรรมอื่นๆ ที่ไม่ใช่เชิงพาณิชย์ สำหรับข้อมูลเพิ่มเติมโปรดดูที่การเชื่อมโยง http://www.di.unipi.it/~gulli/AG_corpus_of_news_articles.html

ชุดข้อมูลการจำแนกหัวข้อข่าวของ AG สร้างขึ้นโดย Xiang Zhang (xiang.zhang@nyu.edu) จากชุดข้อมูลด้านบน มันถูกใช้เป็นเกณฑ์มาตรฐานการจัดประเภทข้อความในเอกสารต่อไปนี้: Xiang Zhang, Junbo Zhao, Yann LeCun เครือข่าย Convolutional ระดับอักขระสำหรับการจำแนกข้อความ ความก้าวหน้าในระบบประมวลผลข้อมูลประสาท 28 (NIPS 2015).

ชุดข้อมูลการจำแนกหัวข้อข่าวของ AG สร้างขึ้นโดยการเลือกคลาสที่ใหญ่ที่สุด 4 คลาสจากคลังข้อมูลดั้งเดิม แต่ละชั้นเรียนประกอบด้วยตัวอย่างการฝึกอบรม 30,000 ตัวอย่าง และตัวอย่างการทดสอบ 1,900 ตัวอย่าง จำนวนตัวอย่างการฝึกอบรมทั้งหมดคือ 120,000 และการทดสอบ 7,600

  • โฮมเพจ: https://arxiv.org/abs/1509.01626

  • รหัสที่มา: tfds.text.AGNewsSubset

  • รุ่น:

    • 1.0.0 (เริ่มต้น): ไม่มีบันทึกประจำรุ่น
  • ขนาดการดาวน์โหลด: 11.24 MiB

  • ขนาดชุด: 35.79 MiB

  • ออโต้แคช ( เอกสาร ): ใช่

  • แยก:

แยก ตัวอย่าง
'test' 7,600
'train' 120,000
  • คุณสมบัติ:
FeaturesDict({
    'description': Text(shape=(), dtype=tf.string),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=4),
    'title': Text(shape=(), dtype=tf.string),
})
  • อ้างอิง:
@misc{zhang2015characterlevel,
    title={Character-level Convolutional Networks for Text Classification},
    author={Xiang Zhang and Junbo Zhao and Yann LeCun},
    year={2015},
    eprint={1509.01626},
    archivePrefix={arXiv},
    primaryClass={cs.LG}
}