このページは Cloud Translation API によって翻訳されました。
Switch to English

モジュール:tf.image

TensorFlow 1つのバージョン

画像OPS。

tf.imageモジュールは、画像処理及び復号化コードオプスのための様々な機能を含んでいます。

符号化/復号化機能の多くはコアにも利用可能であるtf.ioモジュール。

画像処理

サイズ変更

リサイズオプスは、いくつかのタイプのテンソルとして入力画像を受け付けます。彼らは常に出力はのfloat32テンソルとして画像をリサイズ。

便利な機能tf.image.resize入力および出力として4-Dおよび3-Dテンソルの両方をサポートします。 4-Dテンソルは、個々の画像のための画像、3次元テンソルのバッチのためのものです。

元のアスペクト比はサイズと同じでない場合リサイズ画像が歪むことになります。歪みがtf.image.resize_with_padを見る避けるために。

クラスtf.image.ResizeMethodのような様々なサイズ変更方法を提供bilinearnearest_neighbor

カラースペース(色空間)間の変換

画像OPSは、その入力テンソルの形状に応じて、個々の画像や画像のバッチでいずれかの動作します。

3-D場合、形状は[height, width, channels] 、及びテンソルつの画像を表しています。 4-D場合、形状がある[batch_size, height, width, channels] 、及びテンソルを表すbatch_sizeイメージ。

現在、 channels有効1、2、3、または4シングルチャネル画像がグレースケールであることができ、3つのチャンネルの画像がRGB又はHSVのいずれかとして符号化されます。 2つのまたは4チャンネルの画像が最も画像処理機能に画像を渡す前に、画像から除去されなければならない(再取り付け後であってもよい)、アルファチャンネルを含みます。

内部的には、画像がいずれかのように格納されているfloat32ピクセルあたりチャネルあたり(暗黙のうち、値がにあると想定されている[0,1)または1つuint8チャネル当たりの画素毎(値はにあると仮定される[0,255]

TensorFlowは、RGBやHSVまたはYIQの画像の間で変換することができます。

画像調整

明るさ、コントラスト、色相、および彩度:TensorFlowは、様々な方法で画像を調整する機能を提供します。各調整は、所定のパラメータまたは事前定義された間隔から採取ランダムパラメータを用いて行うことができます。ランダムな調整は、多くの場合、トレーニングセットを拡張し、オーバーフィッティングを軽減するのに有用です。

いくつかの調整が連鎖している場合、最初の最も自然なデータ型と表現に画像を変換することにより、冗長コンバージョンの数を最小限にすることが望ましいです。

バウンディングボックスを使用した作業

切り抜き

反転、回転およびトランスポーズ

画像のデコードとエンコード

TensorFlowは、デコードおよびエンコードJPEGやPNG形式にオプスを提供します。符号化された画像は、形状の3次元UINT8テンソルによってスカラー列テンソル、復号画像で表され[height, width, channels] 。 (PNGもuint16のをサポートしています。)

エンコードとデコードオプスは、一度に1枚の画像に適用されます。彼らの入力と出力は、可変サイズのすべてです。あなたは、固定サイズの画像が必要な場合は、トリミングやリサイズオプスの一つにデコードオプスの出力を渡します。

クラス

class ResizeMethod :参照くださいtf.image.resize詳細については。

関数

adjust_brightness(...) :RGBまたはグレースケール画像の明るさを調整します。

adjust_contrast(...) :RGBまたはグレースケール画像のコントラストを調整します。

adjust_gamma(...)実行ガンマ補正

adjust_hue(...) :RGB画像の色合いを調整します。

adjust_jpeg_quality(...)画像のJPEGエンコード品質を調整します。

adjust_saturation(...) :RGB画像の彩度を調整します。

central_crop(...)イメージ(複数可)の中央領域をトリミング。

combined_non_max_suppression(...)貪欲は、スコアの降順にバウンディングボックスのサブセットを選択します。

convert_image_dtype(...)変換のimagedtype必要に応じてその値をスケーリング、。

crop_and_resize(...)抽出は、入力画像テンソルから作物やそれらのサイズを変更します。

crop_to_bounding_box(...)指定されたバウンディングボックスに画像をトリミングし。

decode_and_crop_jpeg(...)デコードおよびuint8のテンソルにJPEGでエンコードされた画像をトリミング。

decode_bmp(...)デコードUINT8テンソルにBMP-符号化された画像の最初のフレーム。

decode_gif(...) :GIF符号化画像の復号フレーム(S)UINT8テンソルです。

decode_image(...)のための機能decode_bmpdecode_gifdecode_jpeg 、およびdecode_png

decode_jpeg(...)デコードuint8のテンソルへJPEGエンコードされた画像。

decode_png(...)デコードUINT8またはuint16のテンソルのPNGでエンコードされた画像。

draw_bounding_boxes(...)画像のバッチにバウンディングボックスを描画します。

encode_jpeg(...) :JPEGエンコード画像。

encode_png(...)画像PNGエンコード。

extract_glimpse(...)抽出入力テンソルから垣間見ます。

extract_jpeg_shape(...) :JPEG符号化画像の形状情報を抽出します。

extract_patches(...)抽出patchesからimages

flip_left_right(...)水平方向(左から右)の画像を反転します。

flip_up_down(...)逆さま)画像を垂直方向に反転します。

generate_bounding_box_proposals(...)エンコードされたバウンディングボックスからボックスの提案をバウンディング生成します。

grayscale_to_rgb(...)グレースケールからRGBに変換し一つ以上の画像。

hsv_to_rgb(...) :RGBへのHSVからの変換一つ以上の画像。

image_gradients(...)各カラーチャンネルの戻り値画像勾配(DY、DX)。

is_jpeg(...) :「内容」かどうかを確認するための便利な関数はJPEG画像を符号化します。

non_max_suppression(...)貪欲は、スコアの降順にバウンディングボックスのサブセットを選択します。

non_max_suppression_overlaps(...)貪欲は、スコアの降順にバウンディングボックスのサブセットを選択します。

non_max_suppression_padded(...)貪欲は、スコアの降順にバウンディングボックスのサブセットを選択します。

non_max_suppression_with_scores(...)貪欲は、スコアの降順にバウンディングボックスのサブセットを選択します。

pad_to_bounding_box(...)パッドimageの指定にゼロでheightwidth

per_image_standardization(...)直線は内の各画像を拡大縮小image平均0、分散1を持っています。

psnr(...) :aとbの間にピーク信号対雑音比を返します。

random_brightness(...)ランダム因子によって画像の明るさを調整します。

random_contrast(...)ランダム因子によって画像または画像のコントラストを調整します。

random_crop(...)ランダムに指定されたサイズにテンソルをトリミング。

random_flip_left_right(...)ランダムに水平方向(左から右)の画像を反転させます。

random_flip_up_down(...)ランダムに画像縦方向(上下逆さま)を反転させます。

random_hue(...)ランダムな要因によりRGB画像の色合いを調整します。

random_jpeg_quality(...)ランダムにJPEGノイズを誘導するためのJPEGエンコード品質が変化します。

random_saturation(...)ランダムな要因によりRGB画像の彩度を調整します。

resize(...)サイズ変更imagessize指定された使用method

resize_with_crop_or_pad(...)作物及び/又はパッド目標の幅と高さに画像を表示します。

resize_with_pad(...)サイズ変更とパッドターゲットの幅と高さのイメージ。

rgb_to_grayscale(...) :RGBからグレースケールに変換し一つ以上の画像。

rgb_to_hsv(...) :RGBからHSVに変換一つ以上の画像。

rgb_to_yiq(...) :YIQへRGBから変換し1以上の画像。

rgb_to_yuv(...) :RGBからYUVに変換し一つ以上の画像。

rot90(...) :90度回転画像(S)反時計回り。

sample_distorted_bounding_box(...)画像のための単一のランダムに歪んだバウンディングボックスを生成します。

sobel_edges(...)ソーベルエッジマップを保持テンソルを返します。

ssim(...) :IMG1とIMG2の間で計算SSIMインデックス。

ssim_multiscale(...) :IMG1とIMG2の間で計算MS-SSIM。

total_variation(...)計算と1枚のまたは複数の画像の全変動を返します。

transpose(...)高さと幅寸法を交換することにより、トランスポーズの画像(複数可)。

yiq_to_rgb(...) :YIQからRGBに変換し一つ以上の画像。

yuv_to_rgb(...) :YUVからRGBに変換し一つ以上の画像。