Halaman ini diterjemahkan oleh Cloud Translation API.
Switch to English

tensorflow :: ops :: QuantizeDownAndShrinkRange

#include <math_ops.h>

Ubah tensor 'masukan' yang dikuantisasi menjadi 'keluaran' dengan presisi lebih rendah, menggunakan.

Ringkasan

distribusi aktual dari nilai untuk memaksimalkan penggunaan kedalaman bit yang lebih rendah dan menyesuaikan output min dan kisaran maks.

[input_min, input_max] adalah float skalar yang menentukan kisaran untuk interpretasi float dari data 'masukan'. Misalnya, jika input_min adalah -1.0f dan input_max adalah 1.0f, dan kita berurusan dengan data terkuantisasi quint16, maka nilai 0 dalam data 16-bit harus diinterpretasikan sebagai -1.0f, dan 65535 berarti 1.0f.

Operator ini mencoba memasukkan presisi sebanyak mungkin ke dalam keluaran dengan kedalaman bit yang lebih rendah dengan menghitung nilai min dan maks aktual yang ditemukan dalam data. Misalnya, mungkin masukan quint16 itu tidak memiliki nilai yang lebih rendah dari 16.384 dan tidak ada yang lebih tinggi dari 49.152. Itu berarti hanya setengah rentang yang benar-benar dibutuhkan, semua interpretasi float adalah antara -0.5f dan 0.5f, jadi jika kita ingin mengompresi data menjadi keluaran quint8, kita dapat menggunakan rentang itu daripada teoritis -1.0f hingga 1.0 f yang disarankan oleh input min dan max.

Dalam praktiknya, ini paling berguna untuk mengambil keluaran dari operasi seperti QuantizedMatMul yang dapat menghasilkan keluaran dengan kedalaman bit yang lebih tinggi daripada masukannya dan mungkin memiliki rentang keluaran potensial yang besar, tetapi dalam praktiknya memiliki distribusi nilai masukan yang hanya menggunakan sebagian kecil dari jarak yang memungkinkan. Dengan memasukkan output tersebut ke operator ini, kami dapat menguranginya dari 32 bit menjadi 8 dengan kehilangan akurasi minimal.

Argumen:

  • scope: Objek Scope
  • input_min: Nilai float yang diwakili oleh nilai input terkuantisasi minimum.
  • input_max: Nilai float yang diwakili oleh nilai input terkuantisasi maksimum.
  • out_type: Jenis keluaran. Kedalaman bit harus lebih rendah dari Tinput.

Pengembalian:

  • Output keluaran
  • Output output_min: Nilai float yang diwakili oleh nilai output terkuantisasi minimum.
  • Output output_max: Nilai float yang diwakili oleh nilai output terkuantisasi maksimum.

Pembuat dan Penghancur

QuantizeDownAndShrinkRange (const :: tensorflow::Scope & scope, :: tensorflow::Input input, :: tensorflow::Input input_min, :: tensorflow::Input input_max, DataType out_type)

Atribut publik

operation
output
output_max
output_min

Atribut publik

operasi

Operation operation

keluaran

::tensorflow::Output output

output_max

::tensorflow::Output output_max

output_min

::tensorflow::Output output_min

Fungsi publik

QuantizeDownAndShrinkRange

 QuantizeDownAndShrinkRange(
  const ::tensorflow::Scope & scope,
  ::tensorflow::Input input,
  ::tensorflow::Input input_min,
  ::tensorflow::Input input_max,
  DataType out_type
)