TFDV ตรวจสอบความผิดปกติโดยการเปรียบเทียบสคีมาและสถิติโปรโต แผนภูมิต่อไปนี้แสดงรายการประเภทความผิดปกติที่ TFDV สามารถตรวจจับได้ ฟิลด์สคีมาและสถิติที่ใช้ในการตรวจจับความผิดปกติแต่ละประเภท และเงื่อนไขที่ตรวจพบความผิดปกติแต่ละประเภท
BOOL_TYPE_BIG_INT
- ฟิลด์สคีมา:
-
feature.bool_domain
-
- ฟิลด์สถิติ:
-
features.num_stats.max
-
features.type
-
- เงื่อนไขการตรวจจับ:
- มีการระบุ
feature.bool_domain
และ -
features.type
==INT
และ -
features.num_stats.max
> 1
- มีการระบุ
- ฟิลด์สคีมา:
BOOL_TYPE_BYTES_NOT_INT
- ตรวจไม่พบประเภทความผิดปกติใน TFDV
BOOL_TYPE_BYTES_NOT_STRING
- ตรวจไม่พบประเภทความผิดปกติใน TFDV
BOOL_TYPE_FLOAT_NOT_INT
- ตรวจไม่พบประเภทความผิดปกติใน TFDV
BOOL_TYPE_FLOAT_NOT_STRING
- ตรวจไม่พบประเภทความผิดปกติใน TFDV
BOOL_TYPE_INT_NOT_STRING
- ตรวจไม่พบประเภทความผิดปกติใน TFDV
BOOL_TYPE_SMALL_INT
- ฟิลด์สคีมา:
-
feature.bool_domain
-
- ฟิลด์สถิติ:
-
features.num_stats.min
-
features.type
-
- เงื่อนไขการตรวจจับ:
-
features.type
==INT
และ - มีการระบุ
feature.bool_domain
และ -
features.num_stats.min
< 0
-
- ฟิลด์สคีมา:
BOOL_TYPE_STRING_NOT_INT
- ตรวจไม่พบประเภทความผิดปกติใน TFDV
BOOL_TYPE_UNEXPECTED_STRING
- ฟิลด์สคีมา:
-
feature.bool_domain
-
- ฟิลด์สถิติ:
-
features.string_stats.rank_histogram
*
-
- เงื่อนไขการตรวจจับ:
-
features.type
==STRING
และ - มีการระบุ
feature.bool_domain
และ - อย่างน้อยหนึ่งค่าใน
rank_histogram
* ไม่ใช่feature.bool_domain.true_value
หรือfeature.bool_domain.false_value
-
- ฟิลด์สคีมา:
BOOL_TYPE_UNEXPECTED_FLOAT
- ฟิลด์สคีมา:
-
feature.bool_domain
-
- ฟิลด์สถิติ:
-
features.num_stats.min
-
features.num_stats.max
-
features.num_stats.histograms.num_nan
-
features.num_stats.histograms.buckets.low_value
-
features.num_stats.histograms.buckets.high_value
-
features.type
-
- เงื่อนไขการตรวจจับ:
-
features.type
==FLOAT
และ - มีการระบุ
feature.bool_domain
และอย่างใดอย่างหนึ่ง- (
features.num_stats.min
!= 0 หรือfeatures.num_stats.min
!= 1) หรือ - (
features.num_stats.max
!= 0 หรือfeatures.num_stats.max
!= 1) หรือ -
features.num_stats.histograms.num_nan
> 0 หรือ - (
features.num_stats.histograms.buckets.low_value
!= 0 หรือfeatures.num_stats.histograms.buckets.high_value
!= 1) และfeatures.num_stats.histograms.buckets.sample_count
> 0
- (
-
- ฟิลด์สคีมา:
BOOL_TYPE_INVALID_CONFIG
- ฟิลด์สคีมา:
-
feature.bool_domain
-
- ฟิลด์สถิติ:
-
features.type
-
- เงื่อนไขการตรวจจับ:
- หาก
features.type
==INT
หรือFLOAT
- มีการระบุ
feature.bool_domain
และ - มีการระบุ
feature.bool_domain.true_value
หรือfeature.bool_domain.false_value
หรือ
- มีการระบุ
- ถ้า
features.type
==STRING
,- มีการระบุ
feature.bool_domain
และ - ไม่ได้ระบุ
feature.bool_domain.true_value
และfeature.bool_domain.false_value
- มีการระบุ
- หาก
- ฟิลด์สคีมา:
ENUM_TYPE_BYTES_NOT_STRING
- ตรวจไม่พบประเภทความผิดปกติใน TFDV
ENUM_TYPE_FLOAT_NOT_STRING
- ตรวจไม่พบประเภทความผิดปกติใน TFDV
ENUM_TYPE_INT_NOT_STRING
- ตรวจไม่พบประเภทความผิดปกติใน TFDV
ENUM_TYPE_INVALID_UTF8
- ฟิลด์สถิติ:
-
features.string_stats.invalid_utf8_count
-
- เงื่อนไขการตรวจจับ:
-
invalid_utf8_count
> 0
-
- ฟิลด์สถิติ:
ENUM_TYPE_UNEXPECTED_STRING_VALUES
- ฟิลด์สคีมา:
-
string_domain
และfeature.domain
; หรือfeature.string_domain
-
feature.distribution_constraints.min_domain_mass
-
- ฟิลด์สถิติ:
-
features.string_stats.rank_histogram
*
-
- เงื่อนไขการตรวจจับ:
- อย่างใดอย่างหนึ่ง (จำนวนค่าใน
rank_histogram
* ที่ไม่อยู่ในโดเมน / จำนวนค่าทั้งหมด) > (1 -feature.distribution_constraints.min_domain_mass
) หรือ -
feature.distribution_constraints.min_domain_mass
== 1.0 และมีค่าในฮิสโตแกรมที่ไม่ได้อยู่ในโดเมน
- อย่างใดอย่างหนึ่ง (จำนวนค่าใน
- ฟิลด์สคีมา:
FEATURE_TYPE_HIGH_NUMBER_VALUES
- ฟิลด์สคีมา:
-
feature.value_count.max
-
feature.value_counts.value_count.max
-
- ฟิลด์สถิติ:
-
features.common_stats.max_num_values
-
features.common_stats.presence_and_valency_stats.max_num_values
-
- เงื่อนไขการตรวจจับ:
- หากระบุ
feature.value_count.max
-
features.common_stats.max_num_values
>feature.value_count.max
; หรือ
-
- หากระบุ
feature.value_counts
-
feature.value_counts.value_count.max
<features.common_stats.presence_and_valency_stats.max_num_values
ที่ระดับความซ้อนที่กำหนด
-
- หากระบุ
- ฟิลด์สคีมา:
FEATURE_TYPE_LOW_FRACTION_PRESENT
- ฟิลด์สคีมา:
-
feature.presence.min_fraction
-
- ฟิลด์สถิติ:
-
features.common_stats.num_non_missing
* -
num_examples
*
-
- เงื่อนไขการตรวจจับ:
- มีการระบุ
feature.presence.min_fraction
และ (features.common_stats.num_non_missing
* /num_examples
*) <feature.presence.min_fraction
หรือ -
feature.presence.min_fraction
== 1.0 และcommon_stats.num_missing
!= 0
- มีการระบุ
- ฟิลด์สคีมา:
FEATURE_TYPE_LOW_NUMBER_PRESENT
- ฟิลด์สคีมา:
-
feature.presence.min_count
-
- ฟิลด์สถิติ:
-
features.common_stats.num_non_missing
*
-
- เงื่อนไขการตรวจจับ:
- มีการระบุ
feature.presence.min_count
และอย่างใดอย่างหนึ่ง-
features.common_stats.num_non_missing
* == 0 หรือ -
features.common_stats.num_non_missing
* <feature.presence.min_count
-
- มีการระบุ
- ฟิลด์สคีมา:
FEATURE_TYPE_LOW_NUMBER_VALUES
- ฟิลด์สคีมา:
-
feature.value_count.min
-
feature.value_counts.value_count.min
-
- ฟิลด์สถิติ:
-
features.common_stats.min_num_values
-
features.common_stats.presence_and_valency_stats.min_num_values
-
- เงื่อนไขการตรวจจับ:
- ถ้าระบุ
feature.value_count.min
-
features.common_stats.min_num_values
<feature.value_count.min
; หรือ
-
- หากระบุ
feature.value_counts
-
features.common_stats.presence_and_valency_stats.min_num_values
<feature.value_counts.value_count.min
ที่ระดับความซ้อนที่กำหนด
-
- ถ้าระบุ
- ฟิลด์สคีมา:
FEATURE_TYPE_NOT_PRESENT
- ฟิลด์สคีมา:
-
feature.in_environment
หรือfeature.not_in_environment
หรือschema.default_environment
-
feature.lifecycle_stage
-
feature.presence.min_count
หรือfeature.presence.min_fraction
-
- ฟิลด์สถิติ:
-
features.common_stats.num_non_missing
*
-
- เงื่อนไขการตรวจจับ:
-
feature.lifecycle_stage
ไม่อยู่ใน [PLANNED
,ALPHA
,DEBUG
,DEPRECATED
] และ -
common_stats.num_non_missing
* == 0 และ - (
feature.presence.min_count
> 0 หรือfeature.presence.min_fraction
> 0) และอย่างใดอย่างหนึ่ง-
feature.in_environment
== สภาพแวดล้อมปัจจุบันหรือ -
feature.not_in_environment
!= สภาพแวดล้อมปัจจุบัน หรือ -
schema.default_environment
!= สภาพแวดล้อมปัจจุบัน
-
-
- ฟิลด์สคีมา:
FEATURE_TYPE_NO_VALUES
- ตรวจไม่พบประเภทความผิดปกติใน TFDV
FEATURE_TYPE_UNEXPECTED_REPEATED
- ตรวจไม่พบประเภทความผิดปกติใน TFDV
FEATURE_TYPE_HIGH_UNIQUE
- ฟิลด์สคีมา:
-
feature.unique_constraints.max
-
- ฟิลด์สถิติ:
-
features.string_stats.unique
-
- เงื่อนไขการตรวจจับ:
-
features.string_stats.unique
>feature.unique_constraints.max
-
- ฟิลด์สคีมา:
FEATURE_TYPE_LOW_UNIQUE
- ฟิลด์สคีมา:
-
feature.unique_constraints.min
-
- ฟิลด์สถิติ:
-
features.string_stats.unique
-
- เงื่อนไขการตรวจจับ:
-
features.string_stats.unique
<feature.unique_constraints.min
-
- ฟิลด์สคีมา:
FEATURE_TYPE_NO_UNIQUE
- ฟิลด์สคีมา:
-
feature.unique_constraints
-
- ฟิลด์สถิติ:
-
features.string_stats.unique
-
- เงื่อนไขการตรวจจับ:
- ระบุ
feature.unique_constraints
แต่ไม่มีfeatures.string_stats.unique
อยู่ (เช่นในกรณีที่คุณสมบัติไม่ใช่สตริงหรือหมวดหมู่)
- ระบุ
- ฟิลด์สคีมา:
FLOAT_TYPE_BIG_FLOAT
- ฟิลด์สคีมา:
-
feature.float_domain.max
-
- ฟิลด์สถิติ:
-
features.type
-
features.num_stats.max
หรือfeatures.string_stats.rank_histogram
-
- เงื่อนไขการตรวจจับ:
- หาก
features.type
==FLOAT
,-
features.num_stats.max
>feature.float_domain.max
; หรือ
-
- ถ้า
features.type
==BYTES
หรือSTRING
- ค่าสูงสุดใน
features.string_stats.rank_histogram
(เมื่อแปลงเป็นทศนิยม) >feature.float_domain.max
- ค่าสูงสุดใน
- หาก
- ฟิลด์สคีมา:
FLOAT_TYPE_NOT_FLOAT
- ตรวจไม่พบประเภทความผิดปกติใน TFDV
FLOAT_TYPE_SMALL_FLOAT
- ฟิลด์สคีมา:
-
feature.float_domain.min
-
- ฟิลด์สถิติ:
-
features.type
-
features.num_stats.min
หรือfeatures.string_stats.rank_histogram
-
- เงื่อนไขการตรวจจับ:
- หาก
features.type
==FLOAT
,-
features.num_stats.min
<feature.float_domain.min
; หรือ
-
- ถ้า
features.type
==BYTES
หรือSTRING
- ค่าต่ำสุดใน
features.string_stats.rank_histogram
(เมื่อแปลงเป็นทศนิยม) <feature.float_domain.min
- ค่าต่ำสุดใน
- หาก
- ฟิลด์สคีมา:
FLOAT_TYPE_STRING_NOT_FLOAT
- ฟิลด์สคีมา:
-
feature.float_domain
-
- ฟิลด์สถิติ:
-
features.type
-
features.string_stats.rank_histogram
-
- เงื่อนไขการตรวจจับ:
-
features.type
==BYTES
หรือSTRING
และ -
features.string_stats.rank_histogram
มีค่าอย่างน้อยหนึ่งค่าที่ไม่สามารถแปลงเป็นทศนิยมได้
-
- ฟิลด์สคีมา:
FLOAT_TYPE_NON_STRING
- ตรวจไม่พบประเภทความผิดปกติใน TFDV
FLOAT_TYPE_UNKNOWN_TYPE_NUMBER
- ตรวจไม่พบประเภทความผิดปกติใน TFDV
FLOAT_TYPE_HAS_NAN
- ฟิลด์สคีมา:
-
feature.float_domain.disallow_nan
-
- ฟิลด์สถิติ:
-
features.type
-
features.num_stats.histograms.num_nan
-
- เงื่อนไขการตรวจจับ:
-
float_domain.disallow_nan
เป็นจริง และ -
features.num_stats.histograms.num_nan
> 0
-
- ฟิลด์สคีมา:
FLOAT_TYPE_HAS_INF
- ฟิลด์สคีมา:
-
feature.float_domain.disallow_inf
-
- ฟิลด์สถิติ:
-
features.type
-
features.num_stats.min
-
features.num_stats.max
-
- เงื่อนไขการตรวจจับ:
-
features.type
==FLOAT
-
float_domain.disallow_inf
เป็นจริงอย่างใดอย่างหนึ่ง-
features.num_stats.min
==inf/-inf
หรือ -
features.num_stats.max
==inf/-inf
-
-
- ฟิลด์สคีมา:
INT_TYPE_BIG_INT
- ฟิลด์สคีมา:
-
feature.int_domain.max
-
- ฟิลด์สถิติ:
-
features.type
-
features.num_stats.max
-
features.string_stats.rank_histogram
-
- เงื่อนไขการตรวจจับ:
- หาก
features.type
==INT
,-
features.num_stats.max
>feature.int_domain.max
; หรือ
-
- ถ้า
features.type
==BYTES
หรือSTRING
- ค่าสูงสุดใน
features.string_stats.rank_histogram
(เมื่อแปลงเป็น int) >feature.int_domain.max
- ค่าสูงสุดใน
- หาก
- ฟิลด์สคีมา:
INT_TYPE_INT_EXPECTED
- ตรวจไม่พบประเภทความผิดปกติใน TFDV
INT_TYPE_NOT_INT_STRING
- ฟิลด์สคีมา:
-
feature.int_domain
-
- ฟิลด์สถิติ:
-
features.type
-
features.string_stats.rank_histogram
-
- เงื่อนไขการตรวจจับ:
-
features.type
==BYTES
หรือSTRING
และ -
features.string_stats.rank_histogram
มีค่าอย่างน้อยหนึ่งค่าที่ไม่สามารถแปลงเป็น int ได้
-
- ฟิลด์สคีมา:
INT_TYPE_NOT_STRING
- ตรวจไม่พบประเภทความผิดปกติใน TFDV
INT_TYPE_SMALL_INT
- ฟิลด์สคีมา:
-
feature.int_domain.min
-
- ฟิลด์สถิติ:
-
features.type
-
features.num_stats.min
-
features.string_stats.rank_histogram
-
- เงื่อนไขการตรวจจับ:
- หาก
features.type
==INT
,-
features.num_stats.min
<feature.int_domain.min
; หรือ
-
- ถ้า
features.type
==BYTES
หรือSTRING
- ค่าต่ำสุดใน
features.string_stats.rank_histogram
(เมื่อแปลงเป็น int) <feature.int_domain.min
- ค่าต่ำสุดใน
- หาก
- ฟิลด์สคีมา:
INT_TYPE_STRING_EXPECTED
- ตรวจไม่พบประเภทความผิดปกติใน TFDV
INT_TYPE_UNKNOWN_TYPE_NUMBER
- ตรวจไม่พบประเภทความผิดปกติใน TFDV
LOW_SUPPORTED_IMAGE_FRACTION
- ฟิลด์สคีมา:
-
feature.image_domain.minimum_supported_image_fraction
-
- ฟิลด์สถิติ:
-
features.custom_stats.rank_histogram
สำหรับ custom_stats ที่มีชื่อimage_format_histogram
โปรดทราบว่าต้องเปิดใช้สถิติโดเมนเชิงความหมายเพื่อสร้าง image_format_histogram และดำเนินการตรวจสอบนี้ สถิติของโดเมนความหมายไม่ได้สร้างขึ้นตามค่าเริ่มต้น
-
- เงื่อนไขการตรวจจับ:
- เศษส่วนของค่าที่รองรับประเภทรูปภาพ Tensorflow สำหรับรูปภาพทุกประเภทมีค่าน้อยกว่า
feature.image_domain.minimum_supported_image_fraction
- เศษส่วนของค่าที่รองรับประเภทรูปภาพ Tensorflow สำหรับรูปภาพทุกประเภทมีค่าน้อยกว่า
- ฟิลด์สคีมา:
SCHEMA_MISSING_COLUMN
- ฟิลด์สคีมา:
-
feature.in_environment
หรือfeature.not_in_environment
หรือschema.default_environment
-
feature.lifecycle_stage
-
feature.presence.min_count
หรือfeature.presence.min_fraction
-
- เงื่อนไขการตรวจจับ:
-
feature.lifecycle_stage
!=PLANNED
,ALPHA
,DEBUG
หรือDEPRECATED
และ -
feature.presence.min_count
> 0 หรือfeature.presence.min_fraction
> 0 และ -
feature.in_environment
== สภาพแวดล้อมปัจจุบัน หรือfeature.not_in_environment
!= สภาพแวดล้อมปัจจุบัน หรือschema.default_environment
!= สภาพแวดล้อมปัจจุบัน และ - ไม่พบคุณลักษณะที่มีชื่อ/พาธที่ระบุในสถิติโปรโต
-
- ฟิลด์สคีมา:
SCHEMA_NEW_COLUMN
- เงื่อนไขการตรวจจับ:
- มีฟีเจอร์ในโปรโตสถิติ แต่ไม่มีฟีเจอร์ที่มีชื่อ/เส้นทางในโปรโตสคีมา
- เงื่อนไขการตรวจจับ:
SCHEMA_TRAINING_SERVING_SKEW
- ตรวจไม่พบประเภทความผิดปกติใน TFDV
STRING_TYPE_NOW_FLOAT
- ตรวจไม่พบประเภทความผิดปกติใน TFDV
STRING_TYPE_NOW_INT
- ตรวจไม่พบประเภทความผิดปกติใน TFDV
COMPARATOR_CONTROL_DATA_MISSING
- ฟิลด์สคีมา:
-
feature.skew_comparator.infinity_norm.threshold
-
feature.drift_comparator.infinity_norm.threshold
-
- เงื่อนไขการตรวจจับ:
- ควบคุมสถิติโปรโต (เช่น สถิติการเสิร์ฟสำหรับการเอียงหรือสถิติก่อนหน้าสำหรับการเลื่อน) พร้อมใช้งาน แต่ไม่มีคุณลักษณะที่ระบุ
- ฟิลด์สคีมา:
COMPARATOR_TREATMENT_DATA_MISSING
- ตรวจไม่พบประเภทความผิดปกติใน TFDV
COMPARATOR_L_INFTY_HIGH
- ฟิลด์สคีมา:
-
feature.skew_comparator.infinity_norm.threshold
-
feature.drift_comparator.infinity_norm.threshold
-
- ฟิลด์สถิติ:
-
features.string_stats.rank_histogram
*
-
- เงื่อนไขการตรวจจับ:
- บรรทัดฐาน L-infinity ของเวกเตอร์ที่แสดงความแตกต่างระหว่างการนับปกติจาก
features.string_stats.rank_histogram
* ในสถิติควบคุม (เช่น สถิติการเสิร์ฟสำหรับการเอียงหรือสถิติก่อนหน้าสำหรับการเลื่อน) และสถิติการรักษา (เช่น สถิติการฝึกสำหรับ เอียงหรือสถิติปัจจุบันสำหรับการเลื่อน) >feature.skew_comparator.infinity_norm.threshold
หรือfeature.drift_comparator.infinity_norm.threshold
- บรรทัดฐาน L-infinity ของเวกเตอร์ที่แสดงความแตกต่างระหว่างการนับปกติจาก
- ฟิลด์สคีมา:
COMPARATOR_NORMALIZED_ABSOLUTE_DIFFERENCE_HIGH
- ฟิลด์สคีมา:
-
feature.skew_comparator.normalized_abs_difference.threshold
-
feature.drift_comparator.normalized_abs_difference.threshold
-
- ฟิลด์สถิติ:
-
features.string_stats.rank_histogram
-
- เงื่อนไขการตรวจจับ:
- ความแตกต่างของจำนวนสัมบูรณ์ที่ปรับให้เป็นมาตรฐานของการนับค่าจาก
features.string_stats.rank_histogram
ในสถิติควบคุม (เช่น สถิติการเสิร์ฟสำหรับการเบ้หรือสถิติก่อนหน้าสำหรับการดริฟท์) และสถิติการรักษา (เช่น สถิติการฝึกสำหรับการเบ้หรือสถิติปัจจุบันสำหรับการดริฟท์) เกิน feature.skew_comparator.normalized_abs_difference.threshold หรือ feature.drift_comparator.normalized_abs_difference.threshold ความแตกต่างของจำนวนจะถูกทำให้เป็นมาตรฐานโดยการนับรวมของทั้งสองเงื่อนไข
- ความแตกต่างของจำนวนสัมบูรณ์ที่ปรับให้เป็นมาตรฐานของการนับค่าจาก
- ฟิลด์สคีมา:
COMPARATOR_JENSEN_SHANNON_DIVERGENCE_HIGH
- ฟิลด์สคีมา:
-
feature.skew_comparator.jensen_shannon_divergence.threshold
-
feature.drift_comparator.jensen_shannon_divergence.threshold
-
- ฟิลด์สถิติ:
-
features.num_stats.histograms
ประเภทSTANDARD
-
features.string_stats.rank_histogram
*
-
- เงื่อนไขการตรวจจับ:
- ความแตกต่างโดยประมาณของ Jensen-Shannon ที่คำนวณระหว่างสถิติการควบคุม (เช่น สถิติการเสิร์ฟสำหรับการเบ้หรือสถิติก่อนหน้านี้สำหรับการดริฟท์) และสถิติการรักษา (เช่น สถิติการฝึกสำหรับการเบ้หรือสถิติปัจจุบันสำหรับการดริฟท์) >
feature.skew_comparator.jensen_shannon_divergence.threshold
หรือfeature.drift_comparator.jensen_shannon_divergence.threshold
ความแตกต่างของ Jensen-Shannon โดยประมาณคำนวณจากจำนวนตัวอย่างที่ปรับให้เป็นมาตรฐานในฮิสโตแกรมมาตรฐานทั้งfeatures.num_stats.histograms
และfeatures.string_stats.rank_histogram
*
- ความแตกต่างโดยประมาณของ Jensen-Shannon ที่คำนวณระหว่างสถิติการควบคุม (เช่น สถิติการเสิร์ฟสำหรับการเบ้หรือสถิติก่อนหน้านี้สำหรับการดริฟท์) และสถิติการรักษา (เช่น สถิติการฝึกสำหรับการเบ้หรือสถิติปัจจุบันสำหรับการดริฟท์) >
- ฟิลด์สคีมา:
NO_DATA_IN_SPAN
- ตรวจไม่พบประเภทความผิดปกติใน TFDV
SPARSE_FEATURE_MISSING_VALUE
- ฟิลด์สคีมา:
-
sparse_feature.value_feature
-
- ฟิลด์สถิติ:
-
features.custom_stats
-
- เงื่อนไขการตรวจจับ:
-
features.custom_stats
ที่มี "missing_value" เป็นชื่อและ -
missing_value
สถิติที่กำหนดเอง != 0
-
- ฟิลด์สคีมา:
SPARSE_FEATURE_MISSING_INDEX
- ฟิลด์สคีมา:
-
sparse_feature.index_feature
-
- ฟิลด์สถิติ:
-
features.custom_stats
-
- เงื่อนไขการตรวจจับ:
-
features.custom_stats
ที่มี "missing_index" เป็นชื่อและ - สถิติที่กำหนดเองของ
missing_index
มีค่าใดๆ != 0
-
- ฟิลด์สคีมา:
SPARSE_FEATURE_LENGTH_MISMATCH
- ฟิลด์สคีมา:
-
sparse_feature.value_feature
-
sparse_feature.index_feature
-
- ฟิลด์สถิติ:
-
features.custom_stats
-
- เงื่อนไขการตรวจจับ:
-
features.custom_stats
ที่มี "min_length_diff" หรือ "max_length_diff" เป็นชื่อ - สถิติที่กำหนดเอง
min_length_diff
หรือmax_length_diff
มีค่าใดๆ != 0
-
- ฟิลด์สคีมา:
SPARSE_FEATURE_NAME_COLLISION
- ฟิลด์สคีมา:
-
sparse_feature.name
-
sparse_feature.lifecycle_stage
-
feature.name
-
feature.lifecycle_stage
-
- เงื่อนไขการตรวจจับ:
-
sparse_feature.lifecycle_stage
!=PLANNED
,ALPHA
,DEBUG
หรือDEPRECATED
และ -
feature.lifecycle_stage
!=PLANNED
,ALPHA
,DEBUG
หรือDEPRECATED
และ -
sparse_feature.name
==feature.name
-
- ฟิลด์สคีมา:
SEMANTIC_DOMAIN_UPDATE
- ฟิลด์สคีมา:
-
feature.domain_info
-
- ฟิลด์สถิติ:
-
features.custom_stats
-
- เงื่อนไขการตรวจจับ:
-
features.custom_stats
ที่มี "domain_info" เป็นชื่อและ - ยังไม่ได้ตั้ง
feature.domain_info
ในสคีมาและ - มีสถิติที่กำหนดเอง
domain_info
เดียวสำหรับคุณลักษณะนี้
-
- ฟิลด์สคีมา:
COMPARATOR_LOW_NUM_EXAMPLES
- ฟิลด์สคีมา:
-
schema.dataset_constraints.num_examples_drift_comparator.min_fraction_threshold
-
schema.dataset_constraints.num_examples_version_comparator.min_fraction_threshold
-
- ฟิลด์สถิติ:
-
num_examples
*
-
- เงื่อนไขการตรวจจับ:
-
num_examples
* > 0 และ - มีโปรโตสถิติก่อนหน้าและ
-
num_examples
* / สถิติก่อนหน้าnum_examples
* < ตัวเปรียบเทียบmin_fraction_threshold
-
- ฟิลด์สคีมา:
COMPARATOR_HIGH_NUM_EXAMPLES
- ฟิลด์สคีมา:
-
schema.dataset_constraints.num_examples_drift_comparator.max_fraction_threshold
-
schema.dataset_constraints.num_examples_version_comparator.max_fraction_threshold
-
- ฟิลด์สถิติ:
-
num_examples
*
-
- เงื่อนไขการตรวจจับ:
-
num_examples
* > 0 และ - มีโปรโตสถิติก่อนหน้าและ
-
num_examples
* / สถิติก่อนหน้าnum_examples
* > ตัวเปรียบเทียบmax_fraction_threshold
-
- ฟิลด์สคีมา:
DATASET_LOW_NUM_EXAMPLES
- ฟิลด์สคีมา:
-
schema.dataset_constraints.min_examples_count
-
- ฟิลด์สถิติ:
-
num_examples
*
-
- เงื่อนไขการตรวจจับ:
-
num_examples
* <dataset_constraints.min_examples_count
-
- ฟิลด์สคีมา:
DATASET_HIGH_NUM_EXAMPLES
- ฟิลด์สคีมา:
-
schema.dataset_constraints.max_examples_count
-
- ฟิลด์สถิติ:
-
num_examples
*
-
- เงื่อนไขการตรวจจับ:
-
num_examples
* >dataset_constraints.max_examples_count
-
- ฟิลด์สคีมา:
WEIGHTED_FEATURE_NAME_COLLISION
- ฟิลด์สคีมา:
-
weighted_feature.name
-
weighted_feature.lifecycle_stage
-
sparse_feature.name
-
sparse_feature.lifecycle_stage
-
feature.name
-
feature.lifecycle_stage
-
- เงื่อนไขการตรวจจับ:
-
weighted_feature.lifecycle_stage
!=PLANNED
,ALPHA
,DEBUG
หรือDEPRECATED
และอย่างใดอย่างหนึ่ง- if
feature.lifecycle_stage
!=PLANNED
,ALPHA
,DEBUG
หรือDEPRECATED
,-
weighted_feature.name
==feature.name
; หรือ
-
- if
sparse_feature.lifecycle_stage
!=PLANNED
,ALPHA
,DEBUG
หรือDEPRECATED
,-
weighted_feature.name
==sparse_feature.name
-
- if
-
- ฟิลด์สคีมา:
WEIGHTED_FEATURE_MISSING_VALUE
- ฟิลด์สคีมา:
-
weighted_feature.feature
-
- ฟิลด์สถิติ:
-
features.custom_stats
-
- เงื่อนไขการตรวจจับ:
-
features.custom_stats
ที่มี "missing_value" เป็นชื่อและ -
missing_value
สถิติที่กำหนดเอง != 0
-
- ฟิลด์สคีมา:
WEIGHTED_FEATURE_MISSING_WEIGHT
- ฟิลด์สคีมา:
-
weighted_feature.weight_feature
-
- ฟิลด์สถิติ:
-
features.custom_stats
-
- เงื่อนไขการตรวจจับ:
-
features.custom_stats
ที่มี "missing_weight" เป็นชื่อและ - สถิติที่กำหนดเอง
missing_weight
!= 0
-
- ฟิลด์สคีมา:
WEIGHTED_FEATURE_LENGTH_MISMATCH
- ฟิลด์สคีมา:
-
weighted_feature.feature
-
weighted_feature.weight_feature
-
- ฟิลด์สถิติ:
-
features.custom_stats
-
- เงื่อนไขการตรวจจับ:
-
features.custom_stats
ที่มี "min_weighted_length_diff" หรือ "max_weight_length_diff" เป็นชื่อ และ -
min_weight_length_diff
หรือmax_weight_length_diff
สถิติที่กำหนดเอง != 0
-
- ฟิลด์สคีมา:
VALUE_NESTEDNESS_MISMATCH
- ฟิลด์สคีมา:
-
feature.value_count
-
feature.value_counts
-
- ฟิลด์สถิติ:
-
features.common_stats.presence_and_valency_stats
-
- เงื่อนไขการตรวจจับ:
- มีการระบุ
feature.value_count
และมีpresence_and_valency_stats
ของคุณลักษณะซ้ำ (ซึ่งระบุระดับความซ้อนที่มากกว่าหนึ่ง) และ - มีการระบุ
feature.value_counts
และจำนวนครั้งpresence_and_valency_stats
ของคุณลักษณะซ้ำกับค่าvalue_count
ไม่ตรงกับจำนวนครั้งที่เกิดซ้ำค่าในfeature.value_counts
- มีการระบุ
- ฟิลด์สคีมา:
DOMAIN_INVALID_FOR_TYPE
- ฟิลด์สคีมา:
-
feature.type
-
feature.domain_info
-
- ฟิลด์สถิติ:
-
features.type
-
- เงื่อนไขการตรวจจับ:
- หาก
features.type
==BYTES
,-
feature.domain_info
เป็นประเภทที่เข้ากันไม่ได้ หรือ
-
- ถ้า
features.type
!=BYTES
,-
feature.domain_info
ไม่ตรงกับfeature.type
(เช่น ระบุint_domain
แต่type
ของฟีเจอร์คือFLOAT
)
-
- หาก
- ฟิลด์สคีมา:
FEATURE_MISSING_NAME
- ฟิลด์สคีมา:
-
feature.name
-
- เงื่อนไขการตรวจจับ:
- ไม่ได้ระบุ
feature.name
- ไม่ได้ระบุ
- ฟิลด์สคีมา:
FEATURE_MISSING_TYPE
- ฟิลด์สคีมา:
-
feature.type
-
- เงื่อนไขการตรวจจับ:
- ไม่ได้ระบุ
feature.type
- ไม่ได้ระบุ
- ฟิลด์สคีมา:
INVALID_SCHEMA_SPECIFICATION
- ฟิลด์สคีมา:
-
feature.domain_info
-
feature.presence.min_fraction
-
feature.value_count.min
-
feature.value_count.max
-
feature.distribution_constraints
-
- เงื่อนไขการตรวจจับ:
-
feature.presence.min_fraction
< 0.0 หรือ > 1.0 หรือ -
feature.value_count.min
< 0 หรือ >feature.value_count.max
หรือ - มีการระบุโดเมนบูล, int, float, struct หรือ semantic สำหรับคุณลักษณะและมีการระบุ
feature.distribution_constraints
สำหรับคุณลักษณะนั้นด้วย หรือ - มีการระบุ
feature.distribution_constraints
สำหรับฟีเจอร์ แต่ไม่มีการระบุโดเมนระดับสคีมาหรือfeature.string_domain
สำหรับฟีเจอร์นั้น
-
- ฟิลด์สคีมา:
INVALID_DOMAIN_SPECIFICATION
- ฟิลด์สคีมา:
-
feature.domain_info
-
feature.bool_domain
-
feature.string_domain
-
- เงื่อนไขการตรวจจับ:
- มีการระบุประเภท
feature.domain_info
ที่ไม่รู้จัก หรือ - มีการระบุ
feature.domain
แต่ไม่มีการระบุโดเมนที่ตรงกันที่ระดับ schema หรือ - หากระบุ
feature.bool_domain
,feature.bool_domain.true_value
และfeature.bool_domain.false_value
-
feature.bool_domain.true_value
==feature.bool_domain.false_value
หรือ
-
- หากระบุ
feature.string_domain
- มี
feature.string_domain.values
ที่ซ้ำกัน หรือ -
feature.string_domain
เกินขนาดสูงสุด
- มี
- มีการระบุประเภท
- ฟิลด์สคีมา:
UNEXPECTED_DATA_TYPE
- ฟิลด์สคีมา:
-
feature.type
-
- ฟิลด์สถิติ:
-
features.type
-
- เงื่อนไขการตรวจจับ:
-
features.type
ไม่ใช่ประเภทที่ระบุในfeature.type
-
- ฟิลด์สคีมา:
SEQUENCE_VALUE_TOO_FEW_OCCURRENCES
- ฟิลด์สคีมา:
-
feature.natural_language_domain.token_constraints.min_per_sequence
-
- ฟิลด์สถิติ:
-
features.custom_stats.nl_statistics.token_statistics.per_sequence_min_frequency
-
- เงื่อนไขการตรวจจับ:
-
min_per_sequence
>per_sequence_min_frequency
-
- ฟิลด์สคีมา:
SEQUENCE_VALUE_TOO_MANY_OCCURRENCES
- ฟิลด์สคีมา:
-
feature.natural_language_domain.token_constraints.max_per_sequence
-
- ฟิลด์สถิติ:
-
features.custom_stats.nl_statistics.token_statistics.per_sequence_max_frequency
-
- เงื่อนไขการตรวจจับ:
-
max_per_sequence
<per_sequence_max_frequency
-
- ฟิลด์สคีมา:
SEQUENCE_VALUE_TOO_SMALL_FRACTION
- ฟิลด์สคีมา:
-
feature.natural_language_domain.token_constraints.min_fraction_of_sequences
-
- ฟิลด์สถิติ:
-
features.custom_stats.nl_statistics.token_statistics.fraction_of_sequences
-
- เงื่อนไขการตรวจจับ:
-
min_fraction_of_sequences
>fraction_of_sequences
-
- ฟิลด์สคีมา:
SEQUENCE_VALUE_TOO_LARGE_FRACTION
- ฟิลด์สคีมา:
-
feature.natural_language_domain.token_constraints.max_fraction_of_sequences
-
- ฟิลด์สถิติ:
-
features.custom_stats.nl_statistics.token_statistics.fraction_of_sequences
-
- เงื่อนไขการตรวจจับ:
-
max_fraction_of_sequences
<fraction_of_sequences
-
- ฟิลด์สคีมา:
FEATURE_COVERAGE_TOO_LOW
- ฟิลด์สคีมา:
-
feature.natural_language_domain.coverage.min_coverage
-
- ฟิลด์สถิติ:
-
features.custom_stats.nl_statistics.feature_coverage
-
- เงื่อนไขการตรวจจับ:
-
feature_coverage
<coverage.min_coverage
-
- ฟิลด์สคีมา:
FEATURE_COVERAGE_TOO_SHORT_AVG_TOKEN_LENGTH
- ฟิลด์สคีมา:
-
feature.natural_language_domain.coverage.min_avg_token_length
-
- ฟิลด์สถิติ:
-
features.custom_stats.nl_statistics.avg_token_length
-
- เงื่อนไขการตรวจจับ:
-
avg_token_length
<min_avg_token_length
-
- ฟิลด์สคีมา:
NLP_WRONG_LOCATION
- ตรวจไม่พบประเภทความผิดปกติใน TFDV
EMBEDDING_SHAPE_INVALID
- ตรวจไม่พบประเภทความผิดปกติใน TFDV
MAX_IMAGE_BYTE_SIZE_EXCEEDED
- ฟิลด์สคีมา:
-
feature.image_domain.max_image_byte_size
-
- ฟิลด์สถิติ:
-
features.bytes_stats.max_num_bytes_int
-
- เงื่อนไขการตรวจจับ:
-
max_num_bytes_int
>max_image_byte_size
-
- ฟิลด์สคีมา:
INVALID_FEATURE_SHAPE
- ฟิลด์สคีมา:
-
feature.shape
-
- ฟิลด์สถิติ:
-
features.common_stats.num_missing
-
features.common_stats.min_num_values
-
features.common_stats.max_num_values
-
features.common_stats.presence_and_valency_stats.num_missing
-
features.common_stats.presence_and_valency_stats.min_num_values
-
features.common_stats.presence_and_valency_stats.max_num_values
-
features.common_stats.weighted_presence_and_valency_stats
-
- เงื่อนไขการตรวจจับ:
- มีการระบุ
feature.shape
และอย่างใดอย่างหนึ่ง- คุณสมบัติอาจขาดหายไป (
num_missing
!= 0) ในบางระดับหรือ - คุณลักษณะอาจมีจำนวนตัวแปร (
min_num_values
!=max_num_values
) ในบางระดับของรังหรือ - รูปร่างที่ระบุเข้ากันไม่ได้กับสถิติการนับมูลค่าของคุณลักษณะ ตัวอย่างเช่น รูปร่าง
[16]
เข้ากันได้กับ (min_num_values
==max_num_values
==[2, 2, 4]
(สำหรับคุณลักษณะที่ซ้อนกัน 3 รายการ))
- คุณสมบัติอาจขาดหายไป (
- มีการระบุ
- ฟิลด์สคีมา:
STATS_NOT_AVAILBLE
- ความผิดปกติเกิดขึ้นเมื่อไม่มีสถานะที่จำเป็นในการตรวจสอบข้อจำกัด
DERIVED_FEATURE_BAD_LIFECYCLE
- ฟิลด์สคีมา:
-
feature.lifecycle_stage
-
- ฟิลด์สถิติ:
-
features.validation_derived_source
-
- เงื่อนไขการตรวจจับ:
-
feature.lifecycle_stage
ไม่ใช่หนึ่งในDERIVED
หรือDISABLED
และมีfeatures.validation_derived_source
ซึ่งบ่งชี้ว่านี่คือคุณสมบัติที่ได้รับมา
-
- ฟิลด์สคีมา:
DERIVED_FEATURE_INVALID_SOURCE
- ฟิลด์สคีมา:
-
feature.validation_derived_source
-
- ฟิลด์สถิติ:
-
features.validation_derived_source
-
- เงื่อนไขการตรวจจับ:
- มี
features.validation_derived_source
สำหรับฟีเจอร์ แต่ไม่มีfeature.validation_derived_source
ที่เกี่ยวข้อง
- มี
- ฟิลด์สคีมา:
* หากมีสถิติถ่วงน้ำหนักสำหรับฟิลด์นี้ จะใช้แทนสถิติที่ไม่ได้ถ่วงน้ำหนัก