Esta página foi traduzida pela API Cloud Translation.
Switch to English

Módulo: tf.image

Versão do TensorFlow 1

Operações de imagem.

O módulo tf.image contém várias funções para processamento de imagens e operações de decodificação e codificação.

Muitas das funções de codificação / decodificação também estão disponíveis no módulo tf.io principal.

Processamento de imagem

Redimensionamento

As operações de redimensionamento aceitam imagens de entrada como tensores de vários tipos. Eles sempre geram imagens redimensionadas como tensores float32.

A função de conveniência tf.image.resize oferece suporte a tf.image.resize 4-D e 3-D como entrada e saída. Os tensores 4-D são para lotes de imagens, os tensores 3-D para imagens individuais.

As imagens redimensionadas serão distorcidas se a proporção do aspecto original não for igual ao tamanho. Para evitar distorções, consulte tf.image.resize_with_pad.

A classe tf.image.ResizeMethod fornece vários métodos de redimensionamento como bilinear , mais nearest_neighbor .

Conversão entre espaços de cores

As operações de imagem funcionam em imagens individuais ou em lotes de imagens, dependendo da forma do Tensor de entrada.

Se for 3-D, a forma é [height, width, channels] e o Tensor representa uma imagem. Se for 4-D, a forma é [batch_size, height, width, channels] e o Tensor representa batch_size imagens batch_size .

Atualmente, os channels podem ser 1, 2, 3 ou 4. As imagens de canal único são em tons de cinza, as imagens com 3 canais são codificadas como RGB ou HSV. Imagens com 2 ou 4 canais incluem um canal alfa, que deve ser retirado da imagem antes de passá-la para a maioria das funções de processamento de imagem (e pode ser reconectado posteriormente).

Internamente, as imagens são armazenadas como um float32 por canal por pixel (implicitamente, os valores são assumidos como estando em [0,1) ) ou um uint8 por canal por pixel (valores são assumidos como [0,255] em [0,255] ).

O TensorFlow pode converter imagens em RGB, HSV ou YIQ.

Ajustes de imagem

O TensorFlow oferece funções para ajustar imagens de várias maneiras: brilho, contraste, matiz e saturação. Cada ajuste pode ser feito com parâmetros predefinidos ou com parâmetros aleatórios escolhidos em intervalos predefinidos. Os ajustes aleatórios geralmente são úteis para expandir um conjunto de treinamento e reduzir o sobreajuste.

Se vários ajustes forem encadeados, é aconselhável minimizar o número de conversões redundantes, primeiro convertendo as imagens para o tipo de dados e representação mais naturais.

Trabalhando com caixas delimitadoras

Recorte

Invertendo, girando e transpondo

Decodificação e codificação de imagens

O TensorFlow oferece operações para decodificar e codificar os formatos JPEG e PNG. Imagens codificadas são representadas por tensores de string escalar, imagens decodificadas por tensores uint8 3-D de forma [height, width, channels] . (PNG também suporta uint16.)

As operações de codificação e decodificação se aplicam a uma imagem por vez. Sua entrada e saída são de tamanho variável. Se você precisar de imagens de tamanho fixo, passe a saída das operações de decodificação para uma das operações de corte e redimensionamento.

Aulas

class ResizeMethod : Consulte tf.image.resize para obter detalhes.

Funções

adjust_brightness(...) : Ajuste o brilho das imagens RGB ou em tons de cinza.

adjust_contrast(...) : Ajuste o contraste de imagens RGB ou em tons de cinza.

adjust_gamma(...) : Executa a correção de gama .

adjust_hue(...) : Ajusta o matiz das imagens RGB.

adjust_jpeg_quality(...) : Ajusta a qualidade de codificação jpeg de uma imagem.

adjust_saturation(...) : Ajusta a saturação das imagens RGB.

central_crop(...) : Corta a região central da (s) imagem (ns).

combined_non_max_suppression(...) : Avidamente seleciona um subconjunto de caixas delimitadoras em ordem decrescente de pontuação.

convert_image_dtype(...) : Converte a image em dtype , escalando seus valores se necessário.

crop_and_resize(...) : Extrai crop_and_resize(...) tensor de imagem de entrada e os redimensiona.

crop_to_bounding_box(...) : crop_to_bounding_box(...) uma imagem para uma caixa delimitadora especificada.

decode_and_crop_jpeg(...) : decodifica e decode_and_crop_jpeg(...) uma imagem codificada em JPEG para um tensor u