このページは Cloud Translation API によって翻訳されました。
Switch to English

tensorflow :: ops :: QuantizeV2

#include <array_ops.h>

float型の「入力」テンソルを「T」型の「出力」テンソルに量子化します。

概要

[min_range、max_range]は、「入力」データの範囲を指定するスカラーフロートです。 'mode'属性は、float値を量子化された等価値に変換するために使用される計算を正確に制御します。 「round_mode」属性は、float値を量子化された同等値に丸めるときに使用される丸めタイブレークアルゴリズムを制御します。

「MIN_COMBINED」モードでは、テンソルの各値は次のようになります。

out[i] = (in[i] - min_range) * range(T) / (max_range - min_range)
if T == qint8: out[i] -= (range(T) + 1) / 2.0

ここでrange(T) = numeric_limits ::max() - numeric_limits ::min() range(T) = numeric_limits ::max() - numeric_limits ::min() range(T) = numeric_limits ::max() - numeric_limits ::min()

MIN_COMBINEDモードの例

入力がfloat型であり、可能な範囲が[0.0、6.0]で、出力型がquint8([0、255])であると想定します。 min_rangeおよびmax_rangeの値は、0.0および6.0として指定する必要があります。 floatからquint8に量子化すると、入力の各値に255/6が乗算され、quint8にキャストされます。

出力タイプがqint8([-128、127])である場合、操作はキャストの前に各値をさらに128減算して、値の範囲がqint8の範囲と一致するようにします。

モードが「MIN_FIRST」の場合、このアプローチが使用されます。

num_discrete_values = 1 << (# of bits in T)
range_adjust = num_discrete_values / (num_discrete_values - 1)
range = (range_max - range_min) * range_adjust
range_scale = num_discrete_values / range
quantized = round(input * range_scale) - round(range_min * range_scale) +
  numeric_limits::min()
quantized = max(quantized, numeric_limits::min())
quantized = min(quantized, numeric_limits::max())

これとMIN_COMBINEDの最大の違いは、丸められた値から減算される前に、最小範囲が最初に丸められることです。 MIN_COMBINEDを使用すると、小さなバイアスが導入され、量子化と逆量子化を繰り返し繰り返すと、エラーがますます大きくなります。

SCALEDモードの例

SCALEDモードは、 QuantizeAndDequantize{V2|V3}使用される量子化アプローチと一致します。

モードがSCALED場合、出力タイプの全範囲を使用せず、対称性の可能な最小値を除外することを選択します(たとえば、出力範囲は、符号付き8ビット量子化では-128から127ではなく-127から127です)。 0.0は0にマッピングされます。

まず、テンソルで値の範囲を見つけます。使用する範囲は常に0を中心とするため、次のようなmを見つけます。

  m = max(abs(input_min), abs(input_max))

入力テンソル範囲は[-m, m]です。

次に、固定小数点量子化バケット[min_fixed, max_fixed]を選択します。 Tが署名されている場合、これは

  num_bits = sizeof(T) * 8
  [min_fixed, max_fixed] =
      [-(1 << (num_bits - 1) - 1), (1 << (num_bits - 1)) - 1]

それ以外の場合、Tが符号なしの場合、固定小数点範囲は次のようになります。

  [min_fixed, max_fixed] = [0, (1 << num_bits) - 1]

これから、スケーリング係数sを計算します。

  s = (max_fixed - min_fixed) / (2 * m)

これで、テンソルの要素を量子化できます。

result = round(input * s)

注意すべき点の1つは、オペレーターが量子化プロセス中に要求された最小値と最大値を少し調整することを選択する可能性があるため、以降の計算の範囲として常に出力ポートを使用する必要があります。たとえば、要求された最小値と最大値がほぼ等しい場合、それらは小さなイプシロン値で区切られ、不正な形式の量子化バッファーが作成されないようにします。そうしないと、すべての量子化された値が同じfloat値にマッピングされるバッファーになってしまい、それにより、さらに計算を実行する必要のある操作で問題が発生します。

引数:

  • scope: Scopeオブジェクト
  • min_range:入力に対して生成される可能性のある最小スカラー値。
  • max_range:入力に対して生成される可能性のある最大スカラー値。

戻り値:

  • Output出力:float入力から生成された量子化データ。
  • Output output_min: Output使用される実際の最小スカラー値。
  • Output output_max: Output使用される実際の最大スカラー値。

コンストラクタとデストラクタ

QuantizeV2 (const :: tensorflow::Scope & scope, :: tensorflow::Input input, :: tensorflow::Input min_range, :: tensorflow::Input max_range, DataType T)
QuantizeV2 (const :: tensorflow::Scope & scope, :: tensorflow::Input input, :: tensorflow::Input min_range, :: tensorflow::Input max_range, DataType T, const QuantizeV2::Attrs & attrs)

公開属性

operation
output
output_max
output_min

パブリック静的関数

Mode (StringPiece x)
RoundMode (StringPiece x)

構造

tensorflow :: ops :: QuantizeV2 :: Attrs

QuantizeV2のオプションの属性セッター。

公開属性

操作

Operation operation

出力

::tensorflow::Output output

output_max

::tensorflow::Output output_max

output_min

::tensorflow::Output output_min

公開機能

QuantizeV2

 QuantizeV2(
  const ::tensorflow::Scope & scope,
  ::tensorflow::Input input,
  ::tensorflow::Input min_range,
  ::tensorflow::Input max_range,
  DataType T
)

QuantizeV2

 QuantizeV2(
  const ::tensorflow::Scope & scope,
  ::tensorflow::Input input,
  ::tensorflow::Input min_range,
  ::tensorflow::Input max_range,
  DataType T,
  const QuantizeV2::Attrs & attrs
)

パブリック静的関数

モード

Attrs Mode(
  StringPiece x
)

RoundMode

Attrs RoundMode(
  StringPiece x
)