امروز برای رویداد محلی TensorFlow خود در همه جا پاسخ دهید!
این صفحه به‌وسیله ‏Cloud Translation API‏ ترجمه شده است.
Switch to English

imagenet2012

  • توضیحات :

ILSVRC 2012 ، معروف به "ImageNet" یک مجموعه داده تصویری است که طبق سلسله مراتب WordNet سازمان یافته است. هر مفهوم معنی دار در WordNet ، که احتمالاً توسط چندین کلمه یا عبارت کلمه ای توصیف شده است ، "مجموعه مترادف" یا "synset" نامیده می شود. بیش از 100000 مجموعه برنامه در WordNet وجود دارد ، اکثر آنها اسم هستند (بیش از 80،000). در ImageNet ، هدف ما ارائه 1000 تصویر برای نشان دادن هر synset است. تصاویر هر مفهوم با کیفیت کنترل می شوند و توسط انسان حاشیه نویسی می شوند. در پایان ، امیدواریم ImageNet ده ها میلیون تصویر مرتب شده با تمیز برای بیشتر مفاهیم سلسله مراتب WordNet ارائه دهد.

تقسیم آزمایشی شامل 100K تصویر است اما هیچ برچسبی ندارد زیرا هیچ برچسبی به صورت عمومی منتشر نشده است. ما از تقسیم آزمایشی سال 2012 با وصله جزئی منتشر شده در 10 اکتبر 2019 پشتیبانی می کنیم. برای بارگیری دستی این داده ها ، کاربر باید عملیات زیر را انجام دهد:

  1. تقسیم آزمون سال 2012 را از اینجا بارگیری کنید .
  2. پچ 10 اکتبر 2019 را بارگیری کنید. یک پیوند Google Drive به پچ ارائه شده در همان صفحه وجود دارد.
  3. دو توپ تار را ترکیب کنید ، و به صورت دستی هر تصویری را در بایگانی اصلی با تصاویر موجود در وصله نویسی کنید. طبق دستورالعمل های image-net.org ، این روش فقط چند تصویر را رونویسی می کند.

گلوله تار حاصل ممکن است توسط TFDS پردازش شود.

برای ارزیابی صحت یک مدل در تقسیم آزمایشی ImageNet ، باید نتیجه گیری در مورد همه تصاویر موجود در تقسیم را انجام دهید ، نتایج را به یک فایل متنی که باید در سرور ارزیابی ImageNet بارگذاری شود ، صادر کنید. نگهدارندگان سرور ارزیابی ImageNet به یک کاربر اجازه می دهند حداکثر 2 بار در هفته ارسال کند تا از نصب بیش از حد جلوگیری کند.

برای ارزیابی دقت در تقسیم آزمون ، ابتدا باید یک حساب کاربری در image-net.org ایجاد کنید. این حساب باید توسط مدیر سایت تأیید شود. پس از ایجاد حساب ، می توان نتایج را به سرور آزمون در http://www.image-net.org/challenges/LSVRC/2013/test_server ارسال کرد. ارسال شامل چندین فایل متنی ASCII مربوط به چندین کار است. وظیفه مورد علاقه "ارسال طبقه بندی (خطای بالای 5 cls)" است. یک نمونه از فایل متنی صادر شده به صورت زیر است:

771 778 794 387 650
363 691 764 923 427
737 369 430 531 124
755 930 755 59 168

قالب صادرات به طور کامل در "readme.txt" در کیت توسعه 2013 موجود در اینجا شرح داده شده است: http://imagenet.stanford.edu/image/ilsvrc2013/ILSVRC2013_devkit.tgz لطفا به بخشی با عنوان "3.3 قالب ارسال CLS-LOC مراجعه کنید " به طور خلاصه ، قالب فایل متنی 100000 خط مربوط به هر تصویر در تقسیم آزمون است. هر خط از اعداد صحیح مطابق با رتبه بندی ، 5 پیش بینی برتر برای هر تصویر آزمون است. عددهای صحیح مربوط به شماره خط موجود در پرونده برچسب های مربوطه با 1 شاخص هستند. به imagenet2012_labels.txt مراجعه کنید.

  • صفحه اصلی : http://image-net.org/

  • کد منبع : tfds.image_classification.Imagenet2012

  • نسخه ها :

    • 2.0.0 : برچسب های اعتبار سنجی را برطرف کنید.
    • 2.0.1 : رفع کدگذاری. هیچ تغییری از نظر کاربر وجود ندارد.
    • 3.0.0 : رنگ آمیزی را روی 12 تصویر ~ رفع کنید (CMYK -> RGB). قالب را برای سازگاری اصلاح کنید (تصویر png را به Jpeg تبدیل کنید). خواندن نسل سریعتر مستقیماً از بایگانی.

    • 4.0.0 : (منتشر نشده)

    • 5.0.0 : API جدید تقسیم شده ( https://tensorflow.org/datasets/splits )

    • 5.1.0 (پیش فرض): تقسیم آزمایشی اضافه شده است.

  • اندازه بارگیری : Unknown size

  • اندازه مجموعه داده : 155.84 GiB

  • دستورالعمل های بارگیری دستی : برای این مجموعه داده لازم است که داده های منبع را به صورت دستی در download_config.manual_dir (به طور پیش فرض ~/tensorflow_datasets/downloads/manual/ ):
    manual_dir باید شامل دو پرونده باشد: ILSVRC2012_img_train.tar و ILSVRC2012_img_val.tar. برای دریافت پیوند بارگیری مجموعه داده ، باید در http://www.image-net.org/download-images ثبت نام کنید .

  • ذخیره خودکار ( مستندات ): خیر

  • تقسیم :

شکاف مثال ها
'test' 100000
'train' 1،281،167
'validation' 50،000
  • ویژگی ها :
FeaturesDict({
    'file_name': Text(shape=(), dtype=tf.string),
    'image': Image(shape=(None, None, 3), dtype=tf.uint8),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=1000),
})
  • کلیدهای تحت نظارت (به as_supervised سند نظارت شده مراجعه کنید): ('image', 'label')

  • نقل قول :

@article{ILSVRC15,
Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
Title = { {ImageNet Large Scale Visual Recognition Challenge} },
Year = {2015},
journal   = {International Journal of Computer Vision (IJCV)},
doi = {10.1007/s11263-015-0816-y},
volume={115},
number={3},
pages={211-252}
}

تجسم