zekâ

  • Açıklama :

Wikipedia tabanlı Görüntü Metni (WIT) Veri Kümesi, çok modlu, çok dilli büyük bir veri kümesidir. WIT, 108 Vikipedi dilinde 11,5 milyon benzersiz resim içeren 37,6 milyon varlık açısından zengin resim-metin örneğinden oluşan bir setten oluşur. Boyutu, WIT'in çok modlu makine öğrenimi modelleri için bir ön eğitim veri kümesi olarak kullanılmasını sağlar.

Bölmek Örnekler
'test' 210.166
'train' 37.046.386
'val' 261.024
  • Özellik yapısı :
FeaturesDict({
    'attribution_passes_lang_id': tf.bool,
    'caption_alt_text_description': Text(shape=(), dtype=tf.string),
    'caption_attribution_description': Text(shape=(), dtype=tf.string),
    'caption_reference_description': Text(shape=(), dtype=tf.string),
    'context_page_description': Text(shape=(), dtype=tf.string),
    'context_section_description': Text(shape=(), dtype=tf.string),
    'hierarchical_section_title': Text(shape=(), dtype=tf.string),
    'image_url': Text(shape=(), dtype=tf.string),
    'is_main_image': tf.bool,
    'language': Text(shape=(), dtype=tf.string),
    'mime_type': Text(shape=(), dtype=tf.string),
    'original_height': tf.int32,
    'original_width': tf.int32,
    'page_changed_recently': tf.bool,
    'page_title': Text(shape=(), dtype=tf.string),
    'page_url': Text(shape=(), dtype=tf.string),
    'section_title': Text(shape=(), dtype=tf.string),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtype Tanım
ÖzelliklerDict
attribution_passes_lang_id tensör tf.bool
caption_alt_text_description Metin tf.string
caption_attribution_description Metin tf.string
caption_reference_description Metin tf.string
bağlam_sayfa_açıklaması Metin tf.string
bağlam_bölümü_açıklaması Metin tf.string
hiyerarşik_bölüm_başlığı Metin tf.string
image_url Metin tf.string
is_main_image tensör tf.bool
dil Metin tf.string
mime_type Metin tf.string
orijinal_yükseklik tensör tf.int32
orijinal_genişlik tensör tf.int32
page_changed_recently tensör tf.bool
sayfa başlığı Metin tf.string
page_url Metin tf.string
Bölüm başlığı Metin tf.string
  • alıntı :
@article{srinivasan2021wit,
  title={WIT: Wikipedia-based Image Text Dataset for Multimodal Multilingual Machine Learning},
  author={Srinivasan, Krishna and Raman, Karthik and Chen, Jiecao and Bendersky, Michael and Najork, Marc},
  journal={arXiv preprint arXiv:2103.01913},
  year={2021}
}