ধারণাগত_12 মি

তথ্যসূত্র:

TFDS এ এই ডেটাসেট লোড করতে নিম্নলিখিত কমান্ডটি ব্যবহার করুন:

ds = tfds.load('huggingface:conceptual_12m')
  • বর্ণনা :
Conceptual 12M is a large-scale dataset of 12 million
image-text pairs specifically meant to be used for visionand-language pre-training.
Its data collection pipeline is a relaxed version of the one used in Conceptual Captions 3M.
  • লাইসেন্স : ডেটাসেটটি যেকোন উদ্দেশ্যে অবাধে ব্যবহার করা যেতে পারে, যদিও ডেটা উৎস হিসেবে Google LLC ("Google") এর স্বীকৃতির প্রশংসা করা হবে। ডেটাসেটটি "AS IS" কোনো ওয়ারেন্টি, প্রকাশ বা উহ্য ছাড়াই প্রদান করা হয়েছে। ডেটাসেট ব্যবহারের ফলে প্রত্যক্ষ বা পরোক্ষভাবে যে কোনো ক্ষতির জন্য Google সমস্ত দায় অস্বীকার করে।

  • সংস্করণ : 0.0.0

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 12423374
  • বৈশিষ্ট্য :
{
    "image_url": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "caption": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    }
}