ccd

  • Descrição :

BCCD Dataset é um conjunto de dados de pequena escala para detecção de células sanguíneas.

Obrigado pelos dados originais e anotações de cosmicad e akshaylamba. O conjunto de dados original é reorganizado no formato VOC. O conjunto de dados BCCD está sob licença do MIT.

A preparação de dados é importante para usar o aprendizado de máquina. Neste projeto, o algoritmo Faster R-CNN de keras-frcnn para Detecção de Objetos é usado. A partir desse conjunto de dados, nicolaschen1 desenvolveu dois scripts Python para preparar dados (arquivo CSV e imagens) para reconhecimento de anormalidades em células sanguíneas em imagens médicas.

export.py: cria o arquivo "test.csv" com todos os dados necessários: filename, class_name, x1,y1,x2,y2. plot.py: plota as caixas para cada imagem e salva em um novo diretório.

Tipo de imagem: jpeg (JPEG) Largura x Altura: 640 x 480

Dividir Exemplos
'test' 72
'train' 205
'validation' 87
  • Estrutura de recursos :
FeaturesDict({
    'image': Image(shape=(480, 640, 3), dtype=uint8),
    'image/filename': Text(shape=(), dtype=string),
    'objects': Sequence({
        'bbox': BBoxFeature(shape=(4,), dtype=float32),
        'label': ClassLabel(shape=(), dtype=int64, num_classes=3),
    }),
})
  • Documentação do recurso:
Característica Classe Forma Tipo D Descrição
RecursosDict
imagem Imagem (480, 640, 3) uint8
imagem/nome do arquivo Texto corda
objetos Seqüência
objetos/bbox Recurso BBox (4,) float32
objetos/rótulo ClassLabel int64

Visualização

  • Citação :
@ONLINE {BCCD_Dataset,
    author = "Shenggan",
    title  = "BCCD Dataset",
    year   = "2017",
    url    = "https://github.com/Shenggan/BCCD_Dataset"
}