TFDV ตรวจสอบความผิดปกติโดยการเปรียบเทียบสคีมาและสถิติโปรโต แผนภูมิต่อไปนี้แสดงรายการประเภทความผิดปกติที่ TFDV สามารถตรวจจับได้ ฟิลด์สคีมาและสถิติที่ใช้ในการตรวจจับความผิดปกติแต่ละประเภท และเงื่อนไขที่ตรวจพบความผิดปกติแต่ละประเภท
BOOL_TYPE_BIG_INT- ฟิลด์สคีมา:
-
feature.bool_domain
-
- ฟิลด์สถิติ:
-
features.num_stats.max -
features.type
-
- เงื่อนไขการตรวจจับ:
- มีการระบุ
feature.bool_domainและ -
features.type==INTและ -
features.num_stats.max> 1
- มีการระบุ
- ฟิลด์สคีมา:
BOOL_TYPE_BYTES_NOT_INT- ตรวจไม่พบประเภทความผิดปกติใน TFDV
BOOL_TYPE_BYTES_NOT_STRING- ตรวจไม่พบประเภทความผิดปกติใน TFDV
BOOL_TYPE_FLOAT_NOT_INT- ตรวจไม่พบประเภทความผิดปกติใน TFDV
BOOL_TYPE_FLOAT_NOT_STRING- ตรวจไม่พบประเภทความผิดปกติใน TFDV
BOOL_TYPE_INT_NOT_STRING- ตรวจไม่พบประเภทความผิดปกติใน TFDV
BOOL_TYPE_SMALL_INT- ฟิลด์สคีมา:
-
feature.bool_domain
-
- ฟิลด์สถิติ:
-
features.num_stats.min -
features.type
-
- เงื่อนไขการตรวจจับ:
-
features.type==INTและ - มีการระบุ
feature.bool_domainและ -
features.num_stats.min< 0
-
- ฟิลด์สคีมา:
BOOL_TYPE_STRING_NOT_INT- ตรวจไม่พบประเภทความผิดปกติใน TFDV
BOOL_TYPE_UNEXPECTED_STRING- ฟิลด์สคีมา:
-
feature.bool_domain
-
- ฟิลด์สถิติ:
-
features.string_stats.rank_histogram*
-
- เงื่อนไขการตรวจจับ:
-
features.type==STRINGและ - มีการระบุ
feature.bool_domainและ - อย่างน้อยหนึ่งค่าใน
rank_histogram* ไม่ใช่feature.bool_domain.true_valueหรือfeature.bool_domain.false_value
-
- ฟิลด์สคีมา:
BOOL_TYPE_UNEXPECTED_FLOAT- ฟิลด์สคีมา:
-
feature.bool_domain
-
- ฟิลด์สถิติ:
-
features.num_stats.min -
features.num_stats.max -
features.num_stats.histograms.num_nan -
features.num_stats.histograms.buckets.low_value -
features.num_stats.histograms.buckets.high_value -
features.type
-
- เงื่อนไขการตรวจจับ:
-
features.type==FLOATและ - มีการระบุ
feature.bool_domainและอย่างใดอย่างหนึ่ง- (
features.num_stats.min!= 0 หรือfeatures.num_stats.min!= 1) หรือ - (
features.num_stats.max!= 0 หรือfeatures.num_stats.max!= 1) หรือ -
features.num_stats.histograms.num_nan> 0 หรือ - (
features.num_stats.histograms.buckets.low_value!= 0 หรือfeatures.num_stats.histograms.buckets.high_value!= 1) และfeatures.num_stats.histograms.buckets.sample_count> 0
- (
-
- ฟิลด์สคีมา:
BOOL_TYPE_INVALID_CONFIG- ฟิลด์สคีมา:
-
feature.bool_domain
-
- ฟิลด์สถิติ:
-
features.type
-
- เงื่อนไขการตรวจจับ:
- หาก
features.type==INTหรือFLOAT- มีการระบุ
feature.bool_domainและ - มีการระบุ
feature.bool_domain.true_valueหรือfeature.bool_domain.false_valueหรือ
- มีการระบุ
- ถ้า
features.type==STRING,- มีการระบุ
feature.bool_domainและ - ไม่ได้ระบุ
feature.bool_domain.true_valueและfeature.bool_domain.false_value
- มีการระบุ
- หาก
- ฟิลด์สคีมา:
ENUM_TYPE_BYTES_NOT_STRING- ตรวจไม่พบประเภทความผิดปกติใน TFDV
ENUM_TYPE_FLOAT_NOT_STRING- ตรวจไม่พบประเภทความผิดปกติใน TFDV
ENUM_TYPE_INT_NOT_STRING- ตรวจไม่พบประเภทความผิดปกติใน TFDV
ENUM_TYPE_INVALID_UTF8- ฟิลด์สถิติ:
-
features.string_stats.invalid_utf8_count
-
- เงื่อนไขการตรวจจับ:
-
invalid_utf8_count> 0
-
- ฟิลด์สถิติ:
ENUM_TYPE_UNEXPECTED_STRING_VALUES- ฟิลด์สคีมา:
-
string_domainและfeature.domain; หรือfeature.string_domain -
feature.distribution_constraints.min_domain_mass
-
- ฟิลด์สถิติ:
-
features.string_stats.rank_histogram*
-
- เงื่อนไขการตรวจจับ:
- อย่างใดอย่างหนึ่ง (จำนวนค่าใน
rank_histogram* ที่ไม่อยู่ในโดเมน / จำนวนค่าทั้งหมด) > (1 -feature.distribution_constraints.min_domain_mass) หรือ -
feature.distribution_constraints.min_domain_mass== 1.0 และมีค่าในฮิสโตแกรมที่ไม่ได้อยู่ในโดเมน
- อย่างใดอย่างหนึ่ง (จำนวนค่าใน
- ฟิลด์สคีมา:
FEATURE_TYPE_HIGH_NUMBER_VALUES- ฟิลด์สคีมา:
-
feature.value_count.max -
feature.value_counts.value_count.max
-
- ฟิลด์สถิติ:
-
features.common_stats.max_num_values -
features.common_stats.presence_and_valency_stats.max_num_values
-
- เงื่อนไขการตรวจจับ:
- หากระบุ
feature.value_count.max-
features.common_stats.max_num_values>feature.value_count.max; หรือ
-
- หากระบุ
feature.value_counts-
feature.value_counts.value_count.max<features.common_stats.presence_and_valency_stats.max_num_valuesที่ระดับความซ้อนที่กำหนด
-
- หากระบุ
- ฟิลด์สคีมา:
FEATURE_TYPE_LOW_FRACTION_PRESENT- ฟิลด์สคีมา:
-
feature.presence.min_fraction
-
- ฟิลด์สถิติ:
-
features.common_stats.num_non_missing* -
num_examples*
-
- เงื่อนไขการตรวจจับ:
- มีการระบุ
feature.presence.min_fractionและ (features.common_stats.num_non_missing* /num_examples*) <feature.presence.min_fractionหรือ -
feature.presence.min_fraction== 1.0 และcommon_stats.num_missing!= 0
- มีการระบุ
- ฟิลด์สคีมา:
FEATURE_TYPE_LOW_NUMBER_PRESENT- ฟิลด์สคีมา:
-
feature.presence.min_count
-
- ฟิลด์สถิติ:
-
features.common_stats.num_non_missing*
-
- เงื่อนไขการตรวจจับ:
- มีการระบุ
feature.presence.min_countและอย่างใดอย่างหนึ่ง-
features.common_stats.num_non_missing* == 0 หรือ -
features.common_stats.num_non_missing* <feature.presence.min_count
-
- มีการระบุ
- ฟิลด์สคีมา:
FEATURE_TYPE_LOW_NUMBER_VALUES- ฟิลด์สคีมา:
-
feature.value_count.min -
feature.value_counts.value_count.min
-
- ฟิลด์สถิติ:
-
features.common_stats.min_num_values -
features.common_stats.presence_and_valency_stats.min_num_values
-
- เงื่อนไขการตรวจจับ:
- ถ้าระบุ
feature.value_count.min-
features.common_stats.min_num_values<feature.value_count.min; หรือ
-
- หากระบุ
feature.value_counts-
features.common_stats.presence_and_valency_stats.min_num_values<feature.value_counts.value_count.minที่ระดับความซ้อนที่กำหนด
-
- ถ้าระบุ
- ฟิลด์สคีมา:
FEATURE_TYPE_NOT_PRESENT- ฟิลด์สคีมา:
-
feature.in_environmentหรือfeature.not_in_environmentหรือschema.default_environment -
feature.lifecycle_stage -
feature.presence.min_countหรือfeature.presence.min_fraction
-
- ฟิลด์สถิติ:
-
features.common_stats.num_non_missing*
-
- เงื่อนไขการตรวจจับ:
-
feature.lifecycle_stageไม่อยู่ใน [PLANNED,ALPHA,DEBUG,DEPRECATED] และ -
common_stats.num_non_missing* == 0 และ - (
feature.presence.min_count> 0 หรือfeature.presence.min_fraction> 0) และอย่างใดอย่างหนึ่ง-
feature.in_environment== สภาพแวดล้อมปัจจุบันหรือ -
feature.not_in_environment!= สภาพแวดล้อมปัจจุบัน หรือ -
schema.default_environment!= สภาพแวดล้อมปัจจุบัน
-
-
- ฟิลด์สคีมา:
FEATURE_TYPE_NO_VALUES- ตรวจไม่พบประเภทความผิดปกติใน TFDV
FEATURE_TYPE_UNEXPECTED_REPEATED- ตรวจไม่พบประเภทความผิดปกติใน TFDV
FEATURE_TYPE_HIGH_UNIQUE- ฟิลด์สคีมา:
-
feature.unique_constraints.max
-
- ฟิลด์สถิติ:
-
features.string_stats.unique
-
- เงื่อนไขการตรวจจับ:
-
features.string_stats.unique>feature.unique_constraints.max
-
- ฟิลด์สคีมา:
FEATURE_TYPE_LOW_UNIQUE- ฟิลด์สคีมา:
-
feature.unique_constraints.min
-
- ฟิลด์สถิติ:
-
features.string_stats.unique
-
- เงื่อนไขการตรวจจับ:
-
features.string_stats.unique<feature.unique_constraints.min
-
- ฟิลด์สคีมา:
FEATURE_TYPE_NO_UNIQUE- ฟิลด์สคีมา:
-
feature.unique_constraints
-
- ฟิลด์สถิติ:
-
features.string_stats.unique
-
- เงื่อนไขการตรวจจับ:
- ระบุ
feature.unique_constraintsแต่ไม่มีfeatures.string_stats.uniqueอยู่ (เช่นในกรณีที่คุณสมบัติไม่ใช่สตริงหรือหมวดหมู่)
- ระบุ
- ฟิลด์สคีมา:
FLOAT_TYPE_BIG_FLOAT- ฟิลด์สคีมา:
-
feature.float_domain.max
-
- ฟิลด์สถิติ:
-
features.type -
features.num_stats.maxหรือfeatures.string_stats.rank_histogram
-
- เงื่อนไขการตรวจจับ:
- หาก
features.type==FLOAT,-
features.num_stats.max>feature.float_domain.max; หรือ
-
- ถ้า
features.type==BYTESหรือSTRING- ค่าสูงสุดใน
features.string_stats.rank_histogram(เมื่อแปลงเป็นทศนิยม) >feature.float_domain.max
- ค่าสูงสุดใน
- หาก
- ฟิลด์สคีมา:
FLOAT_TYPE_NOT_FLOAT- ตรวจไม่พบประเภทความผิดปกติใน TFDV
FLOAT_TYPE_SMALL_FLOAT- ฟิลด์สคีมา:
-
feature.float_domain.min
-
- ฟิลด์สถิติ:
-
features.type -
features.num_stats.minหรือfeatures.string_stats.rank_histogram
-
- เงื่อนไขการตรวจจับ:
- หาก
features.type==FLOAT,-
features.num_stats.min<feature.float_domain.min; หรือ
-
- ถ้า
features.type==BYTESหรือSTRING- ค่าต่ำสุดใน
features.string_stats.rank_histogram(เมื่อแปลงเป็นทศนิยม) <feature.float_domain.min
- ค่าต่ำสุดใน
- หาก
- ฟิลด์สคีมา:
FLOAT_TYPE_STRING_NOT_FLOAT- ฟิลด์สคีมา:
-
feature.float_domain
-
- ฟิลด์สถิติ:
-
features.type -
features.string_stats.rank_histogram
-
- เงื่อนไขการตรวจจับ:
-
features.type==BYTESหรือSTRINGและ -
features.string_stats.rank_histogramมีค่าอย่างน้อยหนึ่งค่าที่ไม่สามารถแปลงเป็นทศนิยมได้
-
- ฟิลด์สคีมา:
FLOAT_TYPE_NON_STRING- ตรวจไม่พบประเภทความผิดปกติใน TFDV
FLOAT_TYPE_UNKNOWN_TYPE_NUMBER- ตรวจไม่พบประเภทความผิดปกติใน TFDV
FLOAT_TYPE_HAS_NAN- ฟิลด์สคีมา:
-
feature.float_domain.disallow_nan
-
- ฟิลด์สถิติ:
-
features.type -
features.num_stats.histograms.num_nan
-
- เงื่อนไขการตรวจจับ:
-
float_domain.disallow_nanเป็นจริง และ -
features.num_stats.histograms.num_nan> 0
-
- ฟิลด์สคีมา:
FLOAT_TYPE_HAS_INF- ฟิลด์สคีมา:
-
feature.float_domain.disallow_inf
-
- ฟิลด์สถิติ:
-
features.type -
features.num_stats.min -
features.num_stats.max
-
- เงื่อนไขการตรวจจับ:
-
features.type==FLOAT -
float_domain.disallow_infเป็นจริงอย่างใดอย่างหนึ่ง-
features.num_stats.min==inf/-infหรือ -
features.num_stats.max==inf/-inf
-
-
- ฟิลด์สคีมา:
INT_TYPE_BIG_INT- ฟิลด์สคีมา:
-
feature.int_domain.max
-
- ฟิลด์สถิติ:
-
features.type -
features.num_stats.max -
features.string_stats.rank_histogram
-
- เงื่อนไขการตรวจจับ:
- หาก
features.type==INT,-
features.num_stats.max>feature.int_domain.max; หรือ
-
- ถ้า
features.type==BYTESหรือSTRING- ค่าสูงสุดใน
features.string_stats.rank_histogram(เมื่อแปลงเป็น int) >feature.int_domain.max
- ค่าสูงสุดใน
- หาก
- ฟิลด์สคีมา:
INT_TYPE_INT_EXPECTED- ตรวจไม่พบประเภทความผิดปกติใน TFDV
INT_TYPE_NOT_INT_STRING- ฟิลด์สคีมา:
-
feature.int_domain
-
- ฟิลด์สถิติ:
-
features.type -
features.string_stats.rank_histogram
-
- เงื่อนไขการตรวจจับ:
-
features.type==BYTESหรือSTRINGและ -
features.string_stats.rank_histogramมีค่าอย่างน้อยหนึ่งค่าที่ไม่สามารถแปลงเป็น int ได้
-
- ฟิลด์สคีมา:
INT_TYPE_NOT_STRING- ตรวจไม่พบประเภทความผิดปกติใน TFDV
INT_TYPE_SMALL_INT- ฟิลด์สคีมา:
-
feature.int_domain.min
-
- ฟิลด์สถิติ:
-
features.type -
features.num_stats.min -
features.string_stats.rank_histogram
-
- เงื่อนไขการตรวจจับ:
- หาก
features.type==INT,-
features.num_stats.min<feature.int_domain.min; หรือ
-
- ถ้า
features.type==BYTESหรือSTRING- ค่าต่ำสุดใน
features.string_stats.rank_histogram(เมื่อแปลงเป็น int) <feature.int_domain.min
- ค่าต่ำสุดใน
- หาก
- ฟิลด์สคีมา:
INT_TYPE_STRING_EXPECTED- ตรวจไม่พบประเภทความผิดปกติใน TFDV
INT_TYPE_UNKNOWN_TYPE_NUMBER- ตรวจไม่พบประเภทความผิดปกติใน TFDV
LOW_SUPPORTED_IMAGE_FRACTION- ฟิลด์สคีมา:
-
feature.image_domain.minimum_supported_image_fraction
-
- ฟิลด์สถิติ:
-
features.custom_stats.rank_histogramสำหรับ custom_stats ที่มีชื่อimage_format_histogramโปรดทราบว่าต้องเปิดใช้สถิติโดเมนเชิงความหมายเพื่อสร้าง image_format_histogram และดำเนินการตรวจสอบนี้ สถิติของโดเมนความหมายไม่ได้สร้างขึ้นตามค่าเริ่มต้น
-
- เงื่อนไขการตรวจจับ:
- เศษส่วนของค่าที่รองรับประเภทรูปภาพ Tensorflow สำหรับรูปภาพทุกประเภทมีค่าน้อยกว่า
feature.image_domain.minimum_supported_image_fraction
- เศษส่วนของค่าที่รองรับประเภทรูปภาพ Tensorflow สำหรับรูปภาพทุกประเภทมีค่าน้อยกว่า
- ฟิลด์สคีมา:
SCHEMA_MISSING_COLUMN- ฟิลด์สคีมา:
-
feature.in_environmentหรือfeature.not_in_environmentหรือschema.default_environment -
feature.lifecycle_stage -
feature.presence.min_countหรือfeature.presence.min_fraction
-
- เงื่อนไขการตรวจจับ:
-
feature.lifecycle_stage!=PLANNED,ALPHA,DEBUGหรือDEPRECATEDและ -
feature.presence.min_count> 0 หรือfeature.presence.min_fraction> 0 และ -
feature.in_environment== สภาพแวดล้อมปัจจุบัน หรือfeature.not_in_environment!= สภาพแวดล้อมปัจจุบัน หรือschema.default_environment!= สภาพแวดล้อมปัจจุบัน และ - ไม่พบคุณลักษณะที่มีชื่อ/พาธที่ระบุในสถิติโปรโต
-
- ฟิลด์สคีมา:
SCHEMA_NEW_COLUMN- เงื่อนไขการตรวจจับ:
- มีฟีเจอร์ในโปรโตสถิติ แต่ไม่มีฟีเจอร์ที่มีชื่อ/เส้นทางในโปรโตสคีมา
- เงื่อนไขการตรวจจับ:
SCHEMA_TRAINING_SERVING_SKEW- ตรวจไม่พบประเภทความผิดปกติใน TFDV
STRING_TYPE_NOW_FLOAT- ตรวจไม่พบประเภทความผิดปกติใน TFDV
STRING_TYPE_NOW_INT- ตรวจไม่พบประเภทความผิดปกติใน TFDV
COMPARATOR_CONTROL_DATA_MISSING- ฟิลด์สคีมา:
-
feature.skew_comparator.infinity_norm.threshold -
feature.drift_comparator.infinity_norm.threshold
-
- เงื่อนไขการตรวจจับ:
- ควบคุมสถิติโปรโต (เช่น สถิติการเสิร์ฟสำหรับการเอียงหรือสถิติก่อนหน้าสำหรับการเลื่อน) พร้อมใช้งาน แต่ไม่มีคุณลักษณะที่ระบุ
- ฟิลด์สคีมา:
COMPARATOR_TREATMENT_DATA_MISSING- ตรวจไม่พบประเภทความผิดปกติใน TFDV
COMPARATOR_L_INFTY_HIGH- ฟิลด์สคีมา:
-
feature.skew_comparator.infinity_norm.threshold -
feature.drift_comparator.infinity_norm.threshold
-
- ฟิลด์สถิติ:
-
features.string_stats.rank_histogram*
-
- เงื่อนไขการตรวจจับ:
- บรรทัดฐาน L-infinity ของเวกเตอร์ที่แสดงความแตกต่างระหว่างการนับปกติจาก
features.string_stats.rank_histogram* ในสถิติควบคุม (เช่น สถิติการเสิร์ฟสำหรับการเอียงหรือสถิติก่อนหน้าสำหรับการเลื่อน) และสถิติการรักษา (เช่น สถิติการฝึกสำหรับ เอียงหรือสถิติปัจจุบันสำหรับการเลื่อน) >feature.skew_comparator.infinity_norm.thresholdหรือfeature.drift_comparator.infinity_norm.threshold
- บรรทัดฐาน L-infinity ของเวกเตอร์ที่แสดงความแตกต่างระหว่างการนับปกติจาก
- ฟิลด์สคีมา:
COMPARATOR_NORMALIZED_ABSOLUTE_DIFFERENCE_HIGH- ฟิลด์สคีมา:
-
feature.skew_comparator.normalized_abs_difference.threshold -
feature.drift_comparator.normalized_abs_difference.threshold
-
- ฟิลด์สถิติ:
-
features.string_stats.rank_histogram
-
- เงื่อนไขการตรวจจับ:
- ความแตกต่างของจำนวนสัมบูรณ์ที่ปรับให้เป็นมาตรฐานของการนับค่าจาก
features.string_stats.rank_histogramในสถิติควบคุม (เช่น สถิติการเสิร์ฟสำหรับการเบ้หรือสถิติก่อนหน้าสำหรับการดริฟท์) และสถิติการรักษา (เช่น สถิติการฝึกสำหรับการเบ้หรือสถิติปัจจุบันสำหรับการดริฟท์) เกิน feature.skew_comparator.normalized_abs_difference.threshold หรือ feature.drift_comparator.normalized_abs_difference.threshold ความแตกต่างของจำนวนจะถูกทำให้เป็นมาตรฐานโดยการนับรวมของทั้งสองเงื่อนไข
- ความแตกต่างของจำนวนสัมบูรณ์ที่ปรับให้เป็นมาตรฐานของการนับค่าจาก
- ฟิลด์สคีมา:
COMPARATOR_JENSEN_SHANNON_DIVERGENCE_HIGH- ฟิลด์สคีมา:
-
feature.skew_comparator.jensen_shannon_divergence.threshold -
feature.drift_comparator.jensen_shannon_divergence.threshold
-
- ฟิลด์สถิติ:
-
features.num_stats.histogramsประเภทSTANDARD -
features.string_stats.rank_histogram*
-
- เงื่อนไขการตรวจจับ:
- ความแตกต่างโดยประมาณของ Jensen-Shannon ที่คำนวณระหว่างสถิติการควบคุม (เช่น สถิติการเสิร์ฟสำหรับการเบ้หรือสถิติก่อนหน้านี้สำหรับการดริฟท์) และสถิติการรักษา (เช่น สถิติการฝึกสำหรับการเบ้หรือสถิติปัจจุบันสำหรับการดริฟท์) >
feature.skew_comparator.jensen_shannon_divergence.thresholdหรือfeature.drift_comparator.jensen_shannon_divergence.thresholdความแตกต่างของ Jensen-Shannon โดยประมาณคำนวณจากจำนวนตัวอย่างที่ปรับให้เป็นมาตรฐานในฮิสโตแกรมมาตรฐานทั้งfeatures.num_stats.histogramsและfeatures.string_stats.rank_histogram*
- ความแตกต่างโดยประมาณของ Jensen-Shannon ที่คำนวณระหว่างสถิติการควบคุม (เช่น สถิติการเสิร์ฟสำหรับการเบ้หรือสถิติก่อนหน้านี้สำหรับการดริฟท์) และสถิติการรักษา (เช่น สถิติการฝึกสำหรับการเบ้หรือสถิติปัจจุบันสำหรับการดริฟท์) >
- ฟิลด์สคีมา:
NO_DATA_IN_SPAN- ตรวจไม่พบประเภทความผิดปกติใน TFDV
SPARSE_FEATURE_MISSING_VALUE- ฟิลด์สคีมา:
-
sparse_feature.value_feature
-
- ฟิลด์สถิติ:
-
features.custom_stats
-
- เงื่อนไขการตรวจจับ:
-
features.custom_statsที่มี "missing_value" เป็นชื่อและ -
missing_valueสถิติที่กำหนดเอง != 0
-
- ฟิลด์สคีมา:
SPARSE_FEATURE_MISSING_INDEX- ฟิลด์สคีมา:
-
sparse_feature.index_feature
-
- ฟิลด์สถิติ:
-
features.custom_stats
-
- เงื่อนไขการตรวจจับ:
-
features.custom_statsที่มี "missing_index" เป็นชื่อและ - สถิติที่กำหนดเองของ
missing_indexมีค่าใดๆ != 0
-
- ฟิลด์สคีมา:
SPARSE_FEATURE_LENGTH_MISMATCH- ฟิลด์สคีมา:
-
sparse_feature.value_feature -
sparse_feature.index_feature
-
- ฟิลด์สถิติ:
-
features.custom_stats
-
- เงื่อนไขการตรวจจับ:
-
features.custom_statsที่มี "min_length_diff" หรือ "max_length_diff" เป็นชื่อ - สถิติที่กำหนดเอง
min_length_diffหรือmax_length_diffมีค่าใดๆ != 0
-
- ฟิลด์สคีมา:
SPARSE_FEATURE_NAME_COLLISION- ฟิลด์สคีมา:
-
sparse_feature.name -
sparse_feature.lifecycle_stage -
feature.name -
feature.lifecycle_stage
-
- เงื่อนไขการตรวจจับ:
-
sparse_feature.lifecycle_stage!=PLANNED,ALPHA,DEBUGหรือDEPRECATEDและ -
feature.lifecycle_stage!=PLANNED,ALPHA,DEBUGหรือDEPRECATEDและ -
sparse_feature.name==feature.name
-
- ฟิลด์สคีมา:
SEMANTIC_DOMAIN_UPDATE- ฟิลด์สคีมา:
-
feature.domain_info
-
- ฟิลด์สถิติ:
-
features.custom_stats
-
- เงื่อนไขการตรวจจับ:
-
features.custom_statsที่มี "domain_info" เป็นชื่อและ - ยังไม่ได้ตั้ง
feature.domain_infoในสคีมาและ - มีสถิติที่กำหนดเอง
domain_infoเดียวสำหรับคุณลักษณะนี้
-
- ฟิลด์สคีมา:
COMPARATOR_LOW_NUM_EXAMPLES- ฟิลด์สคีมา:
-
schema.dataset_constraints.num_examples_drift_comparator.min_fraction_threshold -
schema.dataset_constraints.num_examples_version_comparator.min_fraction_threshold
-
- ฟิลด์สถิติ:
-
num_examples*
-
- เงื่อนไขการตรวจจับ:
-
num_examples* > 0 และ - มีโปรโตสถิติก่อนหน้าและ
-
num_examples* / สถิติก่อนหน้าnum_examples* < ตัวเปรียบเทียบmin_fraction_threshold
-
- ฟิลด์สคีมา:
COMPARATOR_HIGH_NUM_EXAMPLES- ฟิลด์สคีมา:
-
schema.dataset_constraints.num_examples_drift_comparator.max_fraction_threshold -
schema.dataset_constraints.num_examples_version_comparator.max_fraction_threshold
-
- ฟิลด์สถิติ:
-
num_examples*
-
- เงื่อนไขการตรวจจับ:
-
num_examples* > 0 และ - มีโปรโตสถิติก่อนหน้าและ
-
num_examples* / สถิติก่อนหน้าnum_examples* > ตัวเปรียบเทียบmax_fraction_threshold
-
- ฟิลด์สคีมา:
DATASET_LOW_NUM_EXAMPLES- ฟิลด์สคีมา:
-
schema.dataset_constraints.min_examples_count
-
- ฟิลด์สถิติ:
-
num_examples*
-
- เงื่อนไขการตรวจจับ:
-
num_examples* <dataset_constraints.min_examples_count
-
- ฟิลด์สคีมา:
DATASET_HIGH_NUM_EXAMPLES- ฟิลด์สคีมา:
-
schema.dataset_constraints.max_examples_count
-
- ฟิลด์สถิติ:
-
num_examples*
-
- เงื่อนไขการตรวจจับ:
-
num_examples* >dataset_constraints.max_examples_count
-
- ฟิลด์สคีมา:
WEIGHTED_FEATURE_NAME_COLLISION- ฟิลด์สคีมา:
-
weighted_feature.name -
weighted_feature.lifecycle_stage -
sparse_feature.name -
sparse_feature.lifecycle_stage -
feature.name -
feature.lifecycle_stage
-
- เงื่อนไขการตรวจจับ:
-
weighted_feature.lifecycle_stage!=PLANNED,ALPHA,DEBUGหรือDEPRECATEDและอย่างใดอย่างหนึ่ง- if
feature.lifecycle_stage!=PLANNED,ALPHA,DEBUGหรือDEPRECATED,-
weighted_feature.name==feature.name; หรือ
-
- if
sparse_feature.lifecycle_stage!=PLANNED,ALPHA,DEBUGหรือDEPRECATED,-
weighted_feature.name==sparse_feature.name
-
- if
-
- ฟิลด์สคีมา:
WEIGHTED_FEATURE_MISSING_VALUE- ฟิลด์สคีมา:
-
weighted_feature.feature
-
- ฟิลด์สถิติ:
-
features.custom_stats
-
- เงื่อนไขการตรวจจับ:
-
features.custom_statsที่มี "missing_value" เป็นชื่อและ -
missing_valueสถิติที่กำหนดเอง != 0
-
- ฟิลด์สคีมา:
WEIGHTED_FEATURE_MISSING_WEIGHT- ฟิลด์สคีมา:
-
weighted_feature.weight_feature
-
- ฟิลด์สถิติ:
-
features.custom_stats
-
- เงื่อนไขการตรวจจับ:
-
features.custom_statsที่มี "missing_weight" เป็นชื่อและ - สถิติที่กำหนดเอง
missing_weight!= 0
-
- ฟิลด์สคีมา:
WEIGHTED_FEATURE_LENGTH_MISMATCH- ฟิลด์สคีมา:
-
weighted_feature.feature -
weighted_feature.weight_feature
-
- ฟิลด์สถิติ:
-
features.custom_stats
-
- เงื่อนไขการตรวจจับ:
-
features.custom_statsที่มี "min_weighted_length_diff" หรือ "max_weight_length_diff" เป็นชื่อ และ -
min_weight_length_diffหรือmax_weight_length_diffสถิติที่กำหนดเอง != 0
-
- ฟิลด์สคีมา:
VALUE_NESTEDNESS_MISMATCH- ฟิลด์สคีมา:
-
feature.value_count -
feature.value_counts
-
- ฟิลด์สถิติ:
-
features.common_stats.presence_and_valency_stats
-
- เงื่อนไขการตรวจจับ:
- มีการระบุ
feature.value_countและมีpresence_and_valency_statsของคุณลักษณะซ้ำ (ซึ่งระบุระดับความซ้อนที่มากกว่าหนึ่ง) และ - มีการระบุ
feature.value_countsและจำนวนครั้งpresence_and_valency_statsของคุณลักษณะซ้ำกับค่าvalue_countไม่ตรงกับจำนวนครั้งที่เกิดซ้ำค่าในfeature.value_counts
- มีการระบุ
- ฟิลด์สคีมา:
DOMAIN_INVALID_FOR_TYPE- ฟิลด์สคีมา:
-
feature.type -
feature.domain_info
-
- ฟิลด์สถิติ:
-
features.type
-
- เงื่อนไขการตรวจจับ:
- หาก
features.type==BYTES,-
feature.domain_infoเป็นประเภทที่เข้ากันไม่ได้ หรือ
-
- ถ้า
features.type!=BYTES,-
feature.domain_infoไม่ตรงกับfeature.type(เช่น ระบุint_domainแต่typeของฟีเจอร์คือFLOAT)
-
- หาก
- ฟิลด์สคีมา:
FEATURE_MISSING_NAME- ฟิลด์สคีมา:
-
feature.name
-
- เงื่อนไขการตรวจจับ:
- ไม่ได้ระบุ
feature.name
- ไม่ได้ระบุ
- ฟิลด์สคีมา:
FEATURE_MISSING_TYPE- ฟิลด์สคีมา:
-
feature.type
-
- เงื่อนไขการตรวจจับ:
- ไม่ได้ระบุ
feature.type
- ไม่ได้ระบุ
- ฟิลด์สคีมา:
INVALID_SCHEMA_SPECIFICATION- ฟิลด์สคีมา:
-
feature.domain_info -
feature.presence.min_fraction -
feature.value_count.min -
feature.value_count.max -
feature.distribution_constraints
-
- เงื่อนไขการตรวจจับ:
-
feature.presence.min_fraction< 0.0 หรือ > 1.0 หรือ -
feature.value_count.min< 0 หรือ >feature.value_count.maxหรือ - มีการระบุโดเมนบูล, int, float, struct หรือ semantic สำหรับคุณลักษณะและมีการระบุ
feature.distribution_constraintsสำหรับคุณลักษณะนั้นด้วย หรือ - มีการระบุ
feature.distribution_constraintsสำหรับฟีเจอร์ แต่ไม่มีการระบุโดเมนระดับสคีมาหรือfeature.string_domainสำหรับฟีเจอร์นั้น
-
- ฟิลด์สคีมา:
INVALID_DOMAIN_SPECIFICATION- ฟิลด์สคีมา:
-
feature.domain_info -
feature.bool_domain -
feature.string_domain
-
- เงื่อนไขการตรวจจับ:
- มีการระบุประเภท
feature.domain_infoที่ไม่รู้จัก หรือ - มีการระบุ
feature.domainแต่ไม่มีการระบุโดเมนที่ตรงกันที่ระดับ schema หรือ - หากระบุ
feature.bool_domain,feature.bool_domain.true_valueและfeature.bool_domain.false_value-
feature.bool_domain.true_value==feature.bool_domain.false_valueหรือ
-
- หากระบุ
feature.string_domain- มี
feature.string_domain.valuesที่ซ้ำกัน หรือ -
feature.string_domainเกินขนาดสูงสุด
- มี
- มีการระบุประเภท
- ฟิลด์สคีมา:
UNEXPECTED_DATA_TYPE- ฟิลด์สคีมา:
-
feature.type
-
- ฟิลด์สถิติ:
-
features.type
-
- เงื่อนไขการตรวจจับ:
-
features.typeไม่ใช่ประเภทที่ระบุในfeature.type
-
- ฟิลด์สคีมา:
SEQUENCE_VALUE_TOO_FEW_OCCURRENCES- ฟิลด์สคีมา:
-
feature.natural_language_domain.token_constraints.min_per_sequence
-
- ฟิลด์สถิติ:
-
features.custom_stats.nl_statistics.token_statistics.per_sequence_min_frequency
-
- เงื่อนไขการตรวจจับ:
-
min_per_sequence>per_sequence_min_frequency
-
- ฟิลด์สคีมา:
SEQUENCE_VALUE_TOO_MANY_OCCURRENCES- ฟิลด์สคีมา:
-
feature.natural_language_domain.token_constraints.max_per_sequence
-
- ฟิลด์สถิติ:
-
features.custom_stats.nl_statistics.token_statistics.per_sequence_max_frequency
-
- เงื่อนไขการตรวจจับ:
-
max_per_sequence<per_sequence_max_frequency
-
- ฟิลด์สคีมา:
SEQUENCE_VALUE_TOO_SMALL_FRACTION- ฟิลด์สคีมา:
-
feature.natural_language_domain.token_constraints.min_fraction_of_sequences
-
- ฟิลด์สถิติ:
-
features.custom_stats.nl_statistics.token_statistics.fraction_of_sequences
-
- เงื่อนไขการตรวจจับ:
-
min_fraction_of_sequences>fraction_of_sequences
-
- ฟิลด์สคีมา:
SEQUENCE_VALUE_TOO_LARGE_FRACTION- ฟิลด์สคีมา:
-
feature.natural_language_domain.token_constraints.max_fraction_of_sequences
-
- ฟิลด์สถิติ:
-
features.custom_stats.nl_statistics.token_statistics.fraction_of_sequences
-
- เงื่อนไขการตรวจจับ:
-
max_fraction_of_sequences<fraction_of_sequences
-
- ฟิลด์สคีมา:
FEATURE_COVERAGE_TOO_LOW- ฟิลด์สคีมา:
-
feature.natural_language_domain.coverage.min_coverage
-
- ฟิลด์สถิติ:
-
features.custom_stats.nl_statistics.feature_coverage
-
- เงื่อนไขการตรวจจับ:
-
feature_coverage<coverage.min_coverage
-
- ฟิลด์สคีมา:
FEATURE_COVERAGE_TOO_SHORT_AVG_TOKEN_LENGTH- ฟิลด์สคีมา:
-
feature.natural_language_domain.coverage.min_avg_token_length
-
- ฟิลด์สถิติ:
-
features.custom_stats.nl_statistics.avg_token_length
-
- เงื่อนไขการตรวจจับ:
-
avg_token_length<min_avg_token_length
-
- ฟิลด์สคีมา:
NLP_WRONG_LOCATION- ตรวจไม่พบประเภทความผิดปกติใน TFDV
EMBEDDING_SHAPE_INVALID- ตรวจไม่พบประเภทความผิดปกติใน TFDV
MAX_IMAGE_BYTE_SIZE_EXCEEDED- ฟิลด์สคีมา:
-
feature.image_domain.max_image_byte_size
-
- ฟิลด์สถิติ:
-
features.bytes_stats.max_num_bytes_int
-
- เงื่อนไขการตรวจจับ:
-
max_num_bytes_int>max_image_byte_size
-
- ฟิลด์สคีมา:
INVALID_FEATURE_SHAPE- ฟิลด์สคีมา:
-
feature.shape
-
- ฟิลด์สถิติ:
-
features.common_stats.num_missing -
features.common_stats.min_num_values -
features.common_stats.max_num_values -
features.common_stats.presence_and_valency_stats.num_missing -
features.common_stats.presence_and_valency_stats.min_num_values -
features.common_stats.presence_and_valency_stats.max_num_values -
features.common_stats.weighted_presence_and_valency_stats
-
- เงื่อนไขการตรวจจับ:
- มีการระบุ
feature.shapeและอย่างใดอย่างหนึ่ง- คุณสมบัติอาจขาดหายไป (
num_missing!= 0) ในบางระดับหรือ - คุณลักษณะอาจมีจำนวนตัวแปร (
min_num_values!=max_num_values) ในบางระดับของรังหรือ - รูปร่างที่ระบุเข้ากันไม่ได้กับสถิติการนับมูลค่าของคุณลักษณะ ตัวอย่างเช่น รูปร่าง
[16]เข้ากันได้กับ (min_num_values==max_num_values==[2, 2, 4](สำหรับคุณลักษณะที่ซ้อนกัน 3 รายการ))
- คุณสมบัติอาจขาดหายไป (
- มีการระบุ
- ฟิลด์สคีมา:
STATS_NOT_AVAILBLE- ความผิดปกติเกิดขึ้นเมื่อไม่มีสถานะที่จำเป็นในการตรวจสอบข้อจำกัด
DERIVED_FEATURE_BAD_LIFECYCLE- ฟิลด์สคีมา:
-
feature.lifecycle_stage
-
- ฟิลด์สถิติ:
-
features.validation_derived_source
-
- เงื่อนไขการตรวจจับ:
-
feature.lifecycle_stageไม่ใช่หนึ่งในDERIVEDหรือDISABLEDและมีfeatures.validation_derived_sourceซึ่งบ่งชี้ว่านี่คือคุณสมบัติที่ได้รับมา
-
- ฟิลด์สคีมา:
DERIVED_FEATURE_INVALID_SOURCE- ฟิลด์สคีมา:
-
feature.validation_derived_source
-
- ฟิลด์สถิติ:
-
features.validation_derived_source
-
- เงื่อนไขการตรวจจับ:
- มี
features.validation_derived_sourceสำหรับฟีเจอร์ แต่ไม่มีfeature.validation_derived_sourceที่เกี่ยวข้อง
- มี
- ฟิลด์สคีมา:
* หากมีสถิติถ่วงน้ำหนักสำหรับฟิลด์นี้ จะใช้แทนสถิติที่ไม่ได้ถ่วงน้ำหนัก