เทนเซอร์โฟลว์ :: ops :: QuantizeV2

#include <array_ops.h>

หาค่าเทนเซอร์ชนิด 'อินพุต' ลอยเป็น 'เอาต์พุต' เทนเซอร์ประเภท 'T'

สรุป

[min_range, max_range] คือสเกลาร์ลอยที่ระบุช่วงสำหรับข้อมูล "อินพุต" แอตทริบิวต์ "mode" จะควบคุมว่าการคำนวณใดที่ใช้ในการแปลงค่า float เป็นค่าเทียบเท่าเชิงปริมาณ แอตทริบิวต์ "round_mode" จะควบคุมอัลกอริธึมการแบ่งการผูกแบบปัดเศษที่ใช้เมื่อปัดเศษค่า float เป็นค่าเทียบเท่าเชิงปริมาณ

ในโหมด "MIN_COMBINED" แต่ละค่าของเทนเซอร์จะได้รับสิ่งต่อไปนี้:

out[i] = (in[i] - min_range) * range(T) / (max_range - min_range)
if T == qint8: out[i] -= (range(T) + 1) / 2.0

ที่นี่ range(T) = numeric_limits ::max() - numeric_limits ::min() range(T) = numeric_limits ::max() - numeric_limits ::min() range(T) = numeric_limits ::max() - numeric_limits ::min()

MIN_COMBINED โหมดตัวอย่าง

สมมติว่าอินพุตเป็นประเภท float และมีช่วงที่เป็นไปได้ [0.0, 6.0] และประเภทเอาต์พุตคือ quint8 ([0, 255]) ค่า min_range และ max_range ควรระบุเป็น 0.0 และ 6.0 การหาค่าจาก float ถึง quint8 จะคูณแต่ละค่าของอินพุตด้วย 255/6 และส่งเป็น quint8

หากประเภทเอาต์พุตเป็น qint8 ([-128, 127]) การดำเนินการจะลบค่าแต่ละค่าด้วย 128 ก่อนที่จะส่งเพื่อให้ช่วงของค่าสอดคล้องกับช่วงของ qint8

หากโหมดคือ 'MIN_FIRST' จะใช้วิธีนี้:

num_discrete_values = 1 << (# of bits in T)
range_adjust = num_discrete_values / (num_discrete_values - 1)
range = (range_max - range_min) * range_adjust
range_scale = num_discrete_values / range
quantized = round(input * range_scale) - round(range_min * range_scale) +
  numeric_limits::min()
quantized = max(quantized, numeric_limits::min())
quantized = min(quantized, numeric_limits::max())

ความแตกต่างที่ใหญ่ที่สุดระหว่างค่านี้กับ MIN_COMBINED คือช่วงต่ำสุดจะถูกปัดเศษก่อนที่จะลบออกจากค่าที่ปัดเศษ เมื่อใช้ MIN_COMBINED จะมีการนำอคติเล็กน้อยมาใช้ซึ่งการวนซ้ำซ้ำ ๆ ของการหาปริมาณและการลดควอนตัสจะทำให้เกิดข้อผิดพลาดที่ใหญ่ขึ้นและมากขึ้น

ตัวอย่างโหมด SCALED

โหมด SCALED ตรงกับวิธีการหาปริมาณที่ใช้ใน QuantizeAndDequantize{V2|V3}

หากโหมดเป็น SCALED เราจะไม่ใช้ช่วงเต็มของประเภทเอาต์พุตโดยเลือกที่จะกำหนดค่าที่ต่ำที่สุดที่เป็นไปได้สำหรับสมมาตร (เช่นช่วงเอาต์พุตคือ -127 ถึง 127 ไม่ใช่ -128 ถึง 127 สำหรับการหาปริมาณ 8 บิตที่ลงชื่อ) เพื่อให้ 0.0 จับคู่กับ 0

อันดับแรกเราจะหาช่วงของค่าในเทนเซอร์ของเรา ช่วงที่เราใช้จะมีศูนย์กลางอยู่ที่ 0 เสมอดังนั้นเราจึงพบว่า m เป็นเช่นนั้น

  m = max(abs(input_min), abs(input_max))

ช่วงเทนเซอร์อินพุตของเราคือ [-m, m]

ต่อไปเราจะเลือกที่เก็บข้อมูลการวัดปริมาณจุดคงที่ [min_fixed, max_fixed] ถ้าลงนาม T นี่คือ

  num_bits = sizeof(T) * 8
  [min_fixed, max_fixed] =
      [-(1 << (num_bits - 1) - 1), (1 << (num_bits - 1)) - 1]

มิฉะนั้นถ้า T ไม่ได้ลงนามช่วงจุดคงที่คือ

  [min_fixed, max_fixed] = [0, (1 << num_bits) - 1]

จากสิ่งนี้เราคำนวณปัจจัยสเกลของเรา s:

  s = (max_fixed - min_fixed) / (2 * m)

ตอนนี้เราสามารถหาปริมาณองค์ประกอบของเทนเซอร์ของเรา:

result = round(input * s)

สิ่งหนึ่งที่ต้องระวังคือผู้ปฏิบัติงานอาจเลือกที่จะปรับค่าต่ำสุดและสูงสุดที่ร้องขอเล็กน้อยในระหว่างขั้นตอนการหาปริมาณดังนั้นคุณควรใช้พอร์ตเอาต์พุตเป็นช่วงสำหรับการคำนวณเพิ่มเติม ตัวอย่างเช่นหากค่าต่ำสุดและสูงสุดที่ร้องขอใกล้เคียงกันค่าเหล่านี้จะถูกคั่นด้วยค่า epsilon ขนาดเล็กเพื่อป้องกันไม่ให้สร้างบัฟเฟอร์เชิงปริมาณที่มีรูปแบบไม่ถูกต้อง มิฉะนั้นคุณสามารถจบลงด้วยบัฟเฟอร์ที่ค่าเชิงปริมาณทั้งหมดจับคู่กับค่าลอยเดียวกันซึ่งทำให้เกิดปัญหาสำหรับการดำเนินการที่ต้องทำการคำนวณเพิ่มเติม

อาร์กิวเมนต์:

  • ขอบเขต: วัตถุ ขอบเขต
  • min_range: ค่าสเกลาร์ขั้นต่ำที่อาจเกิดขึ้นสำหรับอินพุต
  • max_range: ค่าสเกลาร์สูงสุดที่อาจเกิดขึ้นสำหรับอินพุต

ผลตอบแทน:

  • Output ท: ข้อมูลเชิงปริมาณที่ผลิตจากอินพุตลอย
  • Output output_min: ค่าสเกลาร์ขั้นต่ำที่แท้จริงที่ใช้สำหรับเอาต์พุต
  • Output output_max: ค่าสเกลาร์สูงสุดจริงที่ใช้สำหรับเอาต์พุต

ผู้สร้างและผู้ทำลาย

QuantizeV2 (const :: tensorflow::Scope & scope, :: tensorflow::Input input, :: tensorflow::Input min_range, :: tensorflow::Input max_range, DataType T)
QuantizeV2 (const :: tensorflow::Scope & scope, :: tensorflow::Input input, :: tensorflow::Input min_range, :: tensorflow::Input max_range, DataType T, const QuantizeV2::Attrs & attrs)

คุณลักษณะสาธารณะ

operation
output
output_max
output_min

ฟังก์ชันคงที่สาธารณะ

Mode (StringPiece x)
RoundMode (StringPiece x)

โครงสร้าง

tensorflow :: ops :: QuantizeV2 :: Attrs

ตัวตั้งค่าแอตทริบิวต์ทางเลือกสำหรับ QuantizeV2

คุณลักษณะสาธารณะ

การดำเนินการ

Operation operation

เอาท์พุท

::tensorflow::Output output

output_max

::tensorflow::Output output_max

output_min

::tensorflow::Output output_min

หน้าที่สาธารณะ

QuantizeV2

 QuantizeV2(
  const ::tensorflow::Scope & scope,
  ::tensorflow::Input input,
  ::tensorflow::Input min_range,
  ::tensorflow::Input max_range,
  DataType T
)

QuantizeV2

 QuantizeV2(
  const ::tensorflow::Scope & scope,
  ::tensorflow::Input input,
  ::tensorflow::Input min_range,
  ::tensorflow::Input max_range,
  DataType T,
  const QuantizeV2::Attrs & attrs
)

ฟังก์ชันคงที่สาธารณะ

โหมด

Attrs Mode(
  StringPiece x
)

RoundMode

Attrs RoundMode(
  StringPiece x
)