Ayuda a proteger la Gran Barrera de Coral con TensorFlow en Kaggle Únete Challenge

bccd

  • Descripción:

BCCD Dataset es un conjunto de datos a pequeña escala para la detección de células sanguíneas.

Gracias por los datos originales y las anotaciones de cosmicad y akshaylamba. El conjunto de datos original se reorganiza en formato VOC. BCCD Dataset está bajo licencia MIT.

La preparación de datos es importante para utilizar el aprendizaje automático. En este proyecto, se utiliza el algoritmo Faster R-CNN de keras-frcnn para la detección de objetos. A partir de este conjunto de datos, nicolaschen1 desarrolló dos scripts de Python para generar datos de preparación (archivo CSV e imágenes) para el reconocimiento de anomalías en las células sanguíneas en imágenes médicas.

export.py: crea el archivo "test.csv" con todos los datos necesarios: nombre de archivo, nombre de clase, x1, y1, x2, y2. plot.py: traza las casillas de cada imagen y las guarda en un nuevo directorio.

Tipo de imagen: jpeg (JPEG) Ancho x Alto: 640 x 480

Separar Ejemplos de
  • características:
FeaturesDict({
    'image': Image(shape=(480, 640, 3), dtype=tf.uint8),
    'image/filename': Text(shape=(), dtype=tf.string),
    'objects': Sequence({
        'bbox': BBoxFeature(shape=(4,), dtype=tf.float32),
        'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
    }),
})
@ONLINE {BCCD_Dataset,
    author = "Shenggan",
    title  = "BCCD Dataset",
    year   = "2017",
    url    = "https://github.com/Shenggan/BCCD_Dataset"
}