ช่วยปกป้อง Great Barrier Reef กับ TensorFlow บน Kaggle เข้าร่วมท้าทาย

ปัญญา

  • รายละเอียด:

ชุดข้อมูลข้อความรูปภาพ (WIT) ที่ใช้ Wikipedia เป็นชุดข้อมูลหลายภาษาแบบต่อเนื่องหลายรูปแบบขนาดใหญ่ WIT ประกอบด้วยชุดตัวอย่างข้อความรูปภาพและข้อความเอนทิตีที่รวบรวมไว้ 37.6 ล้านรายการ โดยมีรูปภาพที่ไม่ซ้ำกัน 11.5 ล้านภาพในภาษาวิกิพีเดีย 108 ภาษา ขนาดของมันช่วยให้ WIT สามารถใช้เป็นชุดข้อมูลเตรียมการฝึกอบรมสำหรับโมเดลการเรียนรู้ของเครื่องหลายรูปแบบ

แยก ตัวอย่าง
'train' 37,046,386
  • คุณสมบัติ:
FeaturesDict({
    'attribution_passes_lang_id': tf.bool,
    'caption_alt_text_description': Text(shape=(), dtype=tf.string),
    'caption_attribution_description': Text(shape=(), dtype=tf.string),
    'caption_reference_description': Text(shape=(), dtype=tf.string),
    'context_page_description': Text(shape=(), dtype=tf.string),
    'context_section_description': Text(shape=(), dtype=tf.string),
    'hierarchical_section_title': Text(shape=(), dtype=tf.string),
    'image_url': Text(shape=(), dtype=tf.string),
    'is_main_image': tf.bool,
    'language': Text(shape=(), dtype=tf.string),
    'mime_type': Text(shape=(), dtype=tf.string),
    'original_height': tf.int32,
    'original_width': tf.int32,
    'page_changed_recently': tf.bool,
    'page_title': Text(shape=(), dtype=tf.string),
    'page_url': Text(shape=(), dtype=tf.string),
    'section_title': Text(shape=(), dtype=tf.string),
})
  • อ้างอิง:
@article{srinivasan2021wit,
  title={WIT: Wikipedia-based Image Text Dataset for Multimodal Multilingual Machine Learning},
  author={Srinivasan, Krishna and Raman, Karthik and Chen, Jiecao and Bendersky, Michael and Najork, Marc},
  journal={arXiv preprint arXiv:2103.01913},
  year={2021}
}