Pomoc chronić Wielkiej Rafy Koralowej z TensorFlow na Kaggle Dołącz Wyzwanie

imagenet2012_multilabel

  • opis:

Ten zestaw danych zawiera ILSVRC-2012 (IMAGEnet) obrazów walidacji adnotacją z etykietami multi-klasy z „Ocenianie w pralce dokładności IMAGEnet” , ICML, 2020 Etykiety multi-klasy zostały zweryfikowane przez panel ekspertów obszernie przeszkolony w zawiłości porządku- szczegółowe rozróżnienia klas w hierarchii klas ImageNet (więcej szczegółów w artykule). W porównaniu z oryginalnymi etykietami, te sprawdzone przez ekspertów etykiety wieloklasowe umożliwiają bardziej spójną semantycznie ocenę dokładności.

Tylko 20 000 z 50 000 obrazów walidacyjnych ImageNet ma adnotacje z wieloma etykietami. Zestaw multi-etykiet najpierw generowane przez środowisko testowe 67 wyszkolonych modeli IMAGEnet, a następnie każda jednostka przewidywania model został ręcznie odnotowany przez ekspertów albo jako correct (etykieta jest prawidłowa dla obrazu), wrong (etykieta jest nieprawidłowe dla obraz) lub unclear (nie osiągnięto konsensus wśród ekspertów).

Dodatkowo podczas adnotacji, panel ekspertów zidentyfikowano szereg problematycznych obrazów. Obraz był problematyczny, jeśli spełniał którekolwiek z poniższych kryteriów:

  • Oryginalna etykieta ImageNet (etykieta top-1) była nieprawidłowa lub niejasna
  • Obraz był rysunkiem, obrazem, szkicem, kreskówką lub renderowanym komputerowo
  • Obraz był nadmiernie edytowany
  • Obraz miał nieodpowiednią treść

Problematyczne obrazy są zawarte w tym zbiorze danych, ale należy je zignorować podczas obliczania dokładności wielu etykiet. Dodatkowo, ponieważ początkowy zestaw 20 000 adnotacji jest zbilansowany klasowo, ale zestaw problematycznych obrazów nie, zalecamy obliczenie dokładności dla poszczególnych klas, a następnie uśrednienie ich. Zalecamy również, aby przewidywanie uznać za poprawne, jeśli zostało oznaczone jako poprawne lub niejasne (tj. pobłażliwe wobec niejasnych etykiet).

Jednym z możliwych sposobów na zrobienie tego jest następujący kod NumPy:

import tensorflow_datasets as tfds

ds = tfds.load('imagenet2012_multilabel', split='validation')

# We assume that predictions is a dictionary from file_name to a class index between 0 and 999

num_correct_per_class = {}
num_images_per_class = {}

for example in ds:
    # We ignore all problematic images
    if example[‘is_problematic’].numpy():
        continue

    # The label of the image in ImageNet
    cur_class = example['original_label'].numpy()

    # If we haven't processed this class yet, set the counters to 0
    if cur_class not in num_correct_per_class:
        num_correct_per_class[cur_class] = 0
        assert cur_class not in num_images_per_class
        num_images_per_class[cur_class] = 0

    num_images_per_class[cur_class] += 1

    # Get the predictions for this image
    cur_pred = predictions[example['file_name'].numpy()]

    # We count a prediction as correct if it is marked as correct or unclear
    # (i.e., we are lenient with the unclear labels)
    if cur_pred is in example['correct_multi_labels'].numpy() or cur_pred is in example['unclear_multi_labels'].numpy():
        num_correct_per_class[cur_class] += 1

# Check that we have collected accuracy data for each of the 1,000 classes
num_classes = 1000
assert len(num_correct_per_class) == num_classes
assert len(num_images_per_class) == num_classes

# Compute the per-class accuracies and then average them
final_avg = 0
for cid in range(num_classes):
  assert cid in num_correct_per_class
  assert cid in num_images_per_class
  final_avg += num_correct_per_class[cid] / num_images_per_class[cid]
final_avg /= num_classes

Podział Przykłady
'validation' 20 000
  • Cechy:
FeaturesDict({
    'correct_multi_labels': Sequence(ClassLabel(shape=(), dtype=tf.int64, num_classes=1000)),
    'file_name': Text(shape=(), dtype=tf.string),
    'image': Image(shape=(None, None, 3), dtype=tf.uint8),
    'is_problematic': tf.bool,
    'original_label': ClassLabel(shape=(), dtype=tf.int64, num_classes=1000),
    'unclear_multi_labels': Sequence(ClassLabel(shape=(), dtype=tf.int64, num_classes=1000)),
    'wrong_multi_labels': Sequence(ClassLabel(shape=(), dtype=tf.int64, num_classes=1000)),
})

Wyobrażanie sobie

  • cytat:
@article{shankar2019evaluating,
  title={Evaluating Machine Accuracy on ImageNet},
  author={Vaishaal Shankar* and Rebecca Roelofs* and Horia Mania and Alex Fang and Benjamin Recht and Ludwig Schmidt},
  journal={ICML},
  year={2020},
  note={\url{http://proceedings.mlr.press/v119/shankar20c.html} }
}
@article{ImageNetChallenge,
  title={ {ImageNet} large scale visual recognition challenge},
  author={Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause
   and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and
   Alexander C. Berg and Fei-Fei Li},
  journal={International Journal of Computer Vision},
  year={2015},
  note={\url{https://arxiv.org/abs/1409.0575} }
}
@inproceedings{ImageNet,
   author={Jia Deng and Wei Dong and Richard Socher and Li-Jia Li and Kai Li and Li Fei-Fei},
   booktitle={Conference on Computer Vision and Pattern Recognition (CVPR)},
   title={ {ImageNet}: A large-scale hierarchical image database},
   year={2009},
   note={\url{http://www.image-net.org/papers/imagenet_cvpr09.pdf} }
}