curated_breast_imaging_ddsm,curated_breast_imaging_ddsm

সিবিআইএস-ডিডিএসএম (ডিডিএসএমের কিউরেটেড ব্রেস্ট ইমেজিং সাবসেট) হল স্ক্রীনিং ম্যামোগ্রাফির (ডিডিএসএম) জন্য ডিজিটাল ডেটাবেসের একটি আপডেট করা এবং প্রমিত সংস্করণ। DDSM হল 2,620টি স্ক্যান করা ফিল্ম ম্যামোগ্রাফি অধ্যয়নের একটি ডাটাবেস। এটিতে যাচাইকৃত প্যাথলজি তথ্য সহ স্বাভাবিক, সৌম্য এবং ম্যালিগন্যান্ট কেস রয়েছে।

ডিফল্ট কনফিগারেশনটি মূল ম্যামোগ্রাম থেকে বের করা প্যাচ দিয়ে তৈরি করা হয়, ( http://arxiv.org/abs/1708.09427 ) থেকে বর্ণনা অনুসরণ করে একটি ঐতিহ্যগত চিত্র শ্রেণিবিন্যাসে সমাধানের জন্য টাস্ক ফ্রেম করার জন্য।

যেহেতু বিশেষ সফ্টওয়্যার এবং লাইব্রেরিগুলি ডেটাসেটে থাকা ছবিগুলি ডাউনলোড এবং পড়ার জন্য প্রয়োজন, TFDS অনুমান করে যে ব্যবহারকারী আসল DCIM ফাইলগুলি ডাউনলোড করেছেন এবং সেগুলিকে PNG তে রূপান্তর করেছেন৷

পুনরুত্পাদনযোগ্য ফলাফলের গ্যারান্টি দেওয়ার জন্য, PNG ফাইলগুলি তৈরি করতে নিম্নলিখিত কমান্ডগুলি (বা সমতুল্য) ব্যবহার করা উচিত:

find $DATASET_DCIM_DIR -name '*.dcm' | \
xargs -n1 -P8 -I{} bash -c 'f={}; dcmj2pnm $f | convert - ${f/.dcm/.png}'

ফলাফলের চিত্রগুলিকে manual_dir এ রাখতে হবে, যেমন: <manual_dir>/Mass-Training_P_01981_RIGHT_MLO_1/1.3.6.../000000.png

@misc{CBIS_DDSM_Citation,
  doi = {10.7937/k9/tcia.2016.7o02s9cy},
  url = {https://wiki.cancerimagingarchive.net/x/lZNXAQ},
  author = {Sawyer-Lee,  Rebecca and Gimenez,  Francisco and Hoogi,  Assaf and Rubin,  Daniel},
  title = {Curated Breast Imaging Subset of DDSM},
  publisher = {The Cancer Imaging Archive},
  year = {2016},
}
@article{TCIA_Citation,
  author = {
    K. Clark and B. Vendt and K. Smith and J. Freymann and J. Kirby and
    P. Koppel and S. Moore and S. Phillips and D. Maffitt and M. Pringle and
    L. Tarbox and F. Prior
  },
  title = { {The Cancer Imaging Archive (TCIA): Maintaining and Operating a
  Public Information Repository} },
  journal = {Journal of Digital Imaging},
  volume = {26},
  month = {December},
  year = {2013},
  pages = {1045-1057},
}
@article{DBLP:journals/corr/abs-1708-09427,
  author    = {Li Shen},
  title     = {End-to-end Training for Whole Image Breast Cancer Diagnosis using
               An All Convolutional Design},
  journal   = {CoRR},
  volume    = {abs/1708.09427},
  year      = {2017},
  url       = {http://arxiv.org/abs/1708.09427},
  archivePrefix = {arXiv},
  eprint    = {1708.09427},
  timestamp = {Mon, 13 Aug 2018 16:48:35 +0200},
  biburl    = {https://dblp.org/rec/bib/journals/corr/abs-1708-09427},
  bibsource = {dblp computer science bibliography, https://dblp.org}
}

curated_breast_imaging_ddsm/প্যাচ (ডিফল্ট কনফিগারেশন)

  • কনফিগারেশনের বিবরণ : প্যাচগুলি যেখানে ক্যালিসিফিকেশন এবং ভর উভয় ক্ষেত্রেই রয়েছে, এবং কোনো অস্বাভাবিকতা ছাড়াই পথ। একটি ঐতিহ্যগত 5-শ্রেণীর শ্রেণীবিভাগের টাস্ক হিসাবে ডিজাইন করা হয়েছে।

  • ডাউনলোড আকার : 2.01 MiB

  • ডেটাসেটের আকার : 801.46 MiB

  • বিভাজন :

বিভক্ত উদাহরণ
'test' ৯,৭৭০
'train' 49,780
'validation' ৫,৫৮০
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'id': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 1), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=5),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
আইডি পাঠ্য স্ট্রিং
ইমেজ ছবি (কোনটিই নয়, 1) uint8
লেবেল ক্লাসলেবেল int64

ভিজ্যুয়ালাইজেশন

curated_breast_imaging_ddsm/original-calc

  • কনফিগারেশনের বিবরণ : ক্ষতিহীন পিএনজিতে সংকুচিত ক্যালসিফিকেশন কেসের আসল চিত্র।

  • ডাউনলোড আকার : 1.06 MiB

  • ডেটাসেটের আকার : 4.42 GiB

  • বিভাজন :

বিভক্ত উদাহরণ
'test' 284
'train' 1,227
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'abnormalities': Sequence({
        'assessment': ClassLabel(shape=(), dtype=int64, num_classes=6),
        'calc_distribution': ClassLabel(shape=(), dtype=int64, num_classes=10),
        'calc_type': ClassLabel(shape=(), dtype=int64, num_classes=48),
        'id': int32,
        'mask': Image(shape=(None, None, 1), dtype=uint8),
        'pathology': ClassLabel(shape=(), dtype=int64, num_classes=3),
        'subtlety': ClassLabel(shape=(), dtype=int64, num_classes=6),
    }),
    'breast': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'id': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 1), dtype=uint8),
    'patient': Text(shape=(), dtype=string),
    'view': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
অস্বাভাবিকতা ক্রম
অস্বাভাবিকতা/মূল্যায়ন ক্লাসলেবেল int64
অস্বাভাবিকতা/ক্যাল্ক_ডিস্ট্রিবিউশন ক্লাসলেবেল int64
অস্বাভাবিকতা/ক্যাল্ক_টাইপ ক্লাসলেবেল int64
অস্বাভাবিকতা/আইডি টেনসর int32
অস্বাভাবিকতা/মুখোশ ছবি (কোনটিই নয়, 1) uint8
অস্বাভাবিকতা/প্যাথলজি ক্লাসলেবেল int64
অস্বাভাবিকতা/সূক্ষ্মতা ক্লাসলেবেল int64
স্তন ক্লাসলেবেল int64
আইডি পাঠ্য স্ট্রিং
ইমেজ ছবি (কোনটিই নয়, 1) uint8
রোগী পাঠ্য স্ট্রিং
দেখুন ক্লাসলেবেল int64

ভিজ্যুয়ালাইজেশন

curated_breast_imaging_ddsm/অরিজিনাল-ম্যাস

  • কনফিগারেশনের বিবরণ : লসলেস পিএনজিতে কম্প্রেস করা ভর কেসের আসল ছবি।

  • ডাউনলোড সাইজ : 966.57 KiB

  • ডেটাসেটের আকার : 4.80 GiB

  • বিভাজন :

বিভক্ত উদাহরণ
'test' 348
'train' 1,166
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'abnormalities': Sequence({
        'assessment': ClassLabel(shape=(), dtype=int64, num_classes=6),
        'id': int32,
        'mask': Image(shape=(None, None, 1), dtype=uint8),
        'mass_margins': ClassLabel(shape=(), dtype=int64, num_classes=20),
        'mass_shape': ClassLabel(shape=(), dtype=int64, num_classes=21),
        'pathology': ClassLabel(shape=(), dtype=int64, num_classes=3),
        'subtlety': ClassLabel(shape=(), dtype=int64, num_classes=6),
    }),
    'breast': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'id': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 1), dtype=uint8),
    'patient': Text(shape=(), dtype=string),
    'view': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
অস্বাভাবিকতা ক্রম
অস্বাভাবিকতা/মূল্যায়ন ক্লাসলেবেল int64
অস্বাভাবিকতা/আইডি টেনসর int32
অস্বাভাবিকতা/মুখোশ ছবি (কোনটিই নয়, 1) uint8
অস্বাভাবিকতা/ভর_মার্জিন ক্লাসলেবেল int64
অস্বাভাবিকতা/ভর_আকৃতি ক্লাসলেবেল int64
অস্বাভাবিকতা/প্যাথলজি ক্লাসলেবেল int64
অস্বাভাবিকতা/সূক্ষ্মতা ক্লাসলেবেল int64
স্তন ক্লাসলেবেল int64
আইডি পাঠ্য স্ট্রিং
ইমেজ ছবি (কোনটিই নয়, 1) uint8
রোগী পাঠ্য স্ট্রিং
দেখুন ক্লাসলেবেল int64

ভিজ্যুয়ালাইজেশন