Vision par ordinateur avec TensorFlow

TensorFlow fournit un certain nombre d'outils de vision par ordinateur (CV) et de classification d'images. Ce document présente certains de ces outils et fournit un aperçu des ressources pour vous aider à démarrer avec les tâches courantes du CV.

Bibliothèques et outils de vision

TensorFlow fournit des outils CV via les bibliothèques Keras de niveau supérieur et le module tf.image de niveau inférieur. Pour la plupart des cas d'utilisation, les bibliothèques Keras seront plus pratiques que les alternatives TensorFlow intégrées. Mais si les options Keras ne correspondent pas à votre cas d'utilisation ou si vous souhaitez un contrôle de niveau inférieur sur le prétraitement de l'image, vous aurez peut-être besoin des outils TensorFlow de niveau inférieur.

KerasCV

Si vous débutez tout juste avec un projet de CV et que vous ne savez pas de quelles bibliothèques et outils vous aurez besoin, KerasCV est un bon point de départ. KerasCV est une bibliothèque de composants CV modulaires construite sur Keras Core. KerasCV comprend des modèles, des couches, des métriques, des rappels et d'autres outils qui étendent l'API Keras de haut niveau pour les tâches CV. Les API KerasCV peuvent aider à l'augmentation des données, à la classification, à la détection d'objets, à la segmentation, à la génération d'images et à d'autres flux de travail de CV courants. Vous pouvez utiliser KerasCV pour assembler rapidement des pipelines de formation et d’inférence de pointe de qualité production.

Utilitaires Keras

tf.keras.utils fournit plusieurs utilitaires de prétraitement d'image de haut niveau. Par exemple, tf.keras.utils.image_dataset_from_directory génère un tf.data.Dataset à partir d'un répertoire d'images sur le disque.

tf.image

Si KerasCV ne correspond pas à votre cas d'utilisation, vous pouvez utiliser tf.image et tf.data pour écrire vos propres pipelines ou couches d'augmentation de données.

Le module tf.image contient diverses fonctions de traitement d'image, telles que tf.image.flip_left_right , tf.image.rgb_to_grayscale , tf.image.adjust_brightness , tf.image.central_crop et tf.image.stateless_random* .

L'API tf.data vous permet de créer des pipelines d'entrée complexes à partir d'éléments simples et réutilisables.

Ensembles de données TensorFlow

TensorFlow Datasets est une collection d'ensembles de données prêts à être utilisés avec TensorFlow. De nombreux ensembles de données (par exemple, MNIST , Fashion-MNIST et TF Flowers ) peuvent être utilisés pour développer et tester des algorithmes de vision par ordinateur.

Où commencer

Les ressources suivantes vous aideront à être opérationnel avec les outils TensorFlow et Keras CV.