Ta strona została przetłumaczona przez Cloud Translation API.
Switch to English

Moduł: tf.image

TensorFlow 1 wersja

ops image.

tf.image moduł zawiera różne funkcje przetwarzania obrazu i dekodowania kodujący PO.

Wiele kodowanie / dekodowanie funkcje dostępne w rdzeniu są również tf.io modułu.

Przetwarzanie obrazu

Zmiana rozmiaru

Do zmiany rozmiaru obrazów wejściowych Ops przyjąć jak tensorów kilku typów. Oni zawsze wyjście przeskalowane obrazy jako float32 tensorów.

Funkcja wygoda tf.image.resize obsługuje 4-D i 3-D tensory na wejściu i wyjściu. 4-D tensory są dla partii obrazów, 3-D tensorów poszczególnych obrazów.

Przeskalowane obrazy będą zniekształcone, jeśli ich oryginalne proporcje nie jest taki sam jak rozmiar. Aby uniknąć zakłóceń zobaczyć tf.image.resize_with_pad.

Klasa tf.image.ResizeMethod zapewnia różne metody zmiany rozmiaru jak bilinear , nearest_neighbor .

Konwersja między przestrzeni kolorów

ops obraz pracować zarówno na pojedynczych obrazów lub w partiach obrazu, w zależności od kształtu ich wkład Tensor.

Jeśli 3-D, kształt [height, width, channels] i tensora reprezentuje jeden obraz. Jeśli 4-D, kształt [batch_size, height, width, channels] i tensora oznacza batch_size obrazów.

Obecnie channels może być użyteczny jako 1, 2, 3, lub 4 zdjęcia pojedynczego kanału są w skali szarości, obrazy z 3 kanały są kodowane w RGB lub HSV. Obrazy z 2 lub 4 kanałów obejmuje kanał alfa, który musi być usuwany z obrazu przed przejściem obrazu do większości funkcji przetwarzania obrazu (i może być ponownie nałożona później).

Wewnętrznie, obrazy są przechowywane albo jako jeden float32 na kanał dla każdego piksela (domyślnie wartości są wielorakie na [0,1) ) i jeden uint8 na kanał na piksel (wartości są wielorakie w [0,255] ).

TensorFlow może konwertować między obrazami w RGB lub HSV lub YIQ.

Korekta obrazu

TensorFlow zapewnia funkcje, aby dostosować obrazów na różne sposoby: jasność, kontrast, odcień i nasycenie. Każda regulacja może być wykonana z predefiniowanymi parametrami albo z parametrami losowymi pobrane z określonych odstępach czasu. korekty losowe są często przydatne rozszerzyć zestaw szkoleniowy i zmniejszenia nadmiernego dopasowywania.

Jeśli kilka korekt przykuty wskazane jest, aby zminimalizować liczbę zbędnych konwersji najpierw konwersja zdjęć do najbardziej naturalnych i reprezentacji typu danych.

Praca z obrys

Uprawa

Przerzucanie, obracanie i transponujących

dekodowania i kodowania obrazu

TensorFlow zapewnia Ops dekodować i kodować JPEG i PNG. Zakodowane obrazy reprezentowane przez skalarne tensory ciąg, zakodowanych obrazów przez 3-D tensorów Uint8 kształtu [height, width, channels] . (PNG obsługuje również uint16).

Do kodowania i dekodowania Ops zastosowanie do jednego obrazu na raz. Ich wejście i wyjście są o zmiennej wielkości. Jeśli potrzebujesz ustalony rozmiar zdjęć, przechodzą wyjście Ops dekodowania jednego z przycinania i zmiany rozmiaru Ops.

klasy

class ResizeMethod : See tf.image.resize szczegóły.

Funkcje

adjust_brightness(...) : Regulacja jasności RGB lub obrazów w skali szarości.

adjust_contrast(...) : Regulacja kontrastu RGB lub obrazów w skali szarości.

adjust_gamma(...) : Wykonuje korekcję gamma .

adjust_hue(...) : Regulacja barwy RGB.

adjust_jpeg_quality(...) : Regulacja jpeg kodowania jakość obrazu.

adjust_saturation(...) : Regulacja nasycenia obrazu RGB.

central_crop(...) : Crop centralny obszar obrazu (S).

combined_non_max_suppression(...) : łapczywie wybiera podzbiór ograniczające pola w kolejności wynik malejącej.

convert_image_dtype(...) : Konwersja image do dtype , skalowanie jej wartości w razie potrzeby.

crop_and_resize(...) : Ekstrakty crops od tensora obrazu wejściowego i zmianę rozmiaru je.

crop_to_bounding_box(...) : Rośliny obrazu do określonej obwiedni.

decode_and_crop_jpeg(...) : Decode i Przycinanie JPEG zakodowany obraz do tensora uint8.

decode_bmp(...) : dekodowanie pierwszej klatki BMP zakodowanego obrazu do tensora uint8.

decode_gif(...) : dekodowanie ramki (S) GIF obrazu zakodowanego tensora uint8.

decode_image(...) : Funkcja dla decode_bmp , decode_gif , decode_jpeg i decode_png .

decode_jpeg(...) : Decode JPEG zakodowany obraz a do tensora uint8.

decode_png(...) : dekodowania obrazu PNG kodowane do uint8 lub uint16 tensora.

draw_bounding_boxes(...) : Narysuj obrys na partię zdjęć.

encode_jpeg(...) : JPEG zakodować obraz.

encode_png(...) : PNG zakodować obraz.

extract_glimpse(...) : Ekstrakty spojrzenie od tensora wejściowego.

extract_jpeg_shape(...) : Wyciąg informacje kształcie JPEG zakodowanego obrazu.

extract_patches(...) : wyciąg patches z images .

flip_left_right(...) : Przerzucanie obrazu w poziomie (od lewej do prawej).

flip_up_down(...) : Przerzucanie obrazu w pionie (do góry nogami).

generate_bounding_box_proposals(...) : Generowanie propozycje ograniczające pole karne z kodowanymi obwiedni.

grayscale_to_rgb(...) : Zmienia jedno lub więcej zdjęć ze skali szarości do RGB.

hsv_to_rgb(...) : Konwersja jednego lub więcej zdjęć z HSV na RGB.

image_gradients(...) : Zwraca gradienty obrazu (dy dx) dla każdego kanału koloru.

is_jpeg(...) : function Convenience aby sprawdzić, czy zawartość '' koduje obraz JPEG.

non_max_suppression(...) : łapczywie wybiera podzbiór ograniczające pola w kolejności wynik malejącej.