يتحقق TFDV من الحالات الشاذة من خلال مقارنة مخطط (بروتوكولات) وإحصائيات. يسرد المخطط التالي أنواع الشذوذ التي يمكن أن يكتشفها TFDV ، وحقول المخطط والإحصاءات المستخدمة لاكتشاف كل نوع من أنواع الشذوذ ، والظروف (الحالات) التي يتم من خلالها اكتشاف كل نوع شذوذ.
BOOL_TYPE_BIG_INT- حقول المخطط:
-
feature.bool_domain
-
- مجالات الإحصاء:
-
features.num_stats.max -
features.type
-
- شرط الكشف:
- يتم تحديد
feature.bool_domainو -
features.type==INTو -
features.num_stats.max> 1
- يتم تحديد
- حقول المخطط:
BOOL_TYPE_BYTES_NOT_INT- لم يتم اكتشاف نوع الانحراف في TFDV
BOOL_TYPE_BYTES_NOT_STRING- لم يتم اكتشاف نوع الانحراف في TFDV
BOOL_TYPE_FLOAT_NOT_INT- لم يتم اكتشاف نوع الانحراف في TFDV
BOOL_TYPE_FLOAT_NOT_STRING- لم يتم اكتشاف نوع الانحراف في TFDV
BOOL_TYPE_INT_NOT_STRING- لم يتم اكتشاف نوع الانحراف في TFDV
BOOL_TYPE_SMALL_INT- حقول المخطط:
-
feature.bool_domain
-
- مجالات الإحصاء:
-
features.num_stats.min -
features.type
-
- شرط الكشف:
-
features.type==INTو - يتم تحديد
feature.bool_domainو -
features.num_stats.min<0
-
- حقول المخطط:
BOOL_TYPE_STRING_NOT_INT- لم يتم اكتشاف نوع الانحراف في TFDV
BOOL_TYPE_UNEXPECTED_STRING- حقول المخطط:
-
feature.bool_domain
-
- مجالات الإحصاء:
-
features.string_stats.rank_histogram*
-
- شرط الكشف:
-
features.type==STRINGو - يتم تحديد
feature.bool_domainو - قيمة واحدة على الأقل في
rank_histogram* ليستfeature.bool_domain.true_valueأوfeature.bool_domain.false_value
-
- حقول المخطط:
BOOL_TYPE_UNEXPECTED_FLOAT- حقول المخطط:
-
feature.bool_domain
-
- مجالات الإحصاء:
-
features.num_stats.min -
features.num_stats.max -
features.num_stats.histograms.num_nan -
features.num_stats.histograms.buckets.low_value -
features.num_stats.histograms.buckets.high_value -
features.type
-
- شرط الكشف:
-
features.type==FLOATو - يتم تحديد
feature.bool_domainوإما- (
features.num_stats.min! = 0 أوfeatures.num_stats.min! = 1) أو - (
features.num_stats.max! = 0 أوfeatures.num_stats.max! = 1) أو -
features.num_stats.histograms.num_nan> 0 أو - (
features.num_stats.histograms.buckets.low_value! = 0 أوfeatures.num_stats.histograms.buckets.high_value! = 1) وfeatures.num_stats.histograms.buckets.sample_count> 0
- (
-
- حقول المخطط:
BOOL_TYPE_INVALID_CONFIG- حقول المخطط:
-
feature.bool_domain
-
- مجالات الإحصاء:
-
features.type
-
- شرط الكشف:
- إذا كانت
features.type==INTأوFLOAT،- يتم تحديد
feature.bool_domainو - يتم تحديد
feature.bool_domain.true_valueأوfeature.bool_domain.false_value، أو
- يتم تحديد
- إذا كانت
features.type==STRING،- يتم تحديد
feature.bool_domainو - لم يتم تحديد
feature.bool_domain.true_valueوfeature.bool_domain.false_value
- يتم تحديد
- إذا كانت
- حقول المخطط:
ENUM_TYPE_BYTES_NOT_STRING- لم يتم اكتشاف نوع الانحراف في TFDV
ENUM_TYPE_FLOAT_NOT_STRING- لم يتم اكتشاف نوع الانحراف في TFDV
ENUM_TYPE_INT_NOT_STRING- لم يتم اكتشاف نوع الانحراف في TFDV
ENUM_TYPE_INVALID_UTF8- مجالات الإحصاء:
-
features.string_stats.invalid_utf8_count
-
- شرط الكشف:
-
invalid_utf8_count> 0
-
- مجالات الإحصاء:
ENUM_TYPE_UNEXPECTED_STRING_VALUES- حقول المخطط:
-
string_domainوfeature.domain؛ أوfeature.string_domain -
feature.distribution_constraints.min_domain_mass
-
- مجالات الإحصاء:
-
features.string_stats.rank_histogram*
-
- شرط الكشف:
- إما (عدد القيم في
rank_histogram* التي ليست في المجال / إجمالي عدد القيم)> (1 -feature.distribution_constraints.min_domain_mass) أو -
feature.distribution_constraints.min_domain_mass== 1.0 وهناك قيم في المدرج التكراري ليست في المجال
- إما (عدد القيم في
- حقول المخطط:
FEATURE_TYPE_HIGH_NUMBER_VALUES- حقول المخطط:
-
feature.value_count.max -
feature.value_counts.value_count.max
-
- مجالات الإحصاء:
-
features.common_stats.max_num_values -
features.common_stats.presence_and_valency_stats.max_num_values
-
- شرط الكشف:
- إذا تم تحديد
feature.value_count.max-
features.common_stats.max_num_values>feature.value_count.max؛ أو
-
- إذا تم تحديد
feature.value_counts-
feature.value_counts.value_count.max<features.common_stats.presence_and_valency_stats.max_num_valuesعند مستوى تداخل معين
-
- إذا تم تحديد
- حقول المخطط:
FEATURE_TYPE_LOW_FRACTION_PRESENT- حقول المخطط:
-
feature.presence.min_fraction
-
- مجالات الإحصاء:
-
features.common_stats.num_non_missing* -
num_examples*
-
- شرط الكشف:
- تم تحديد
feature.presence.min_fractionو (features.common_stats.num_non_missing* /num_examples*) <feature.presence.min_fractionأو -
feature.presence.min_fraction== 1.0 وcommon_stats.num_missing! = 0
- تم تحديد
- حقول المخطط:
FEATURE_TYPE_LOW_NUMBER_PRESENT- حقول المخطط:
-
feature.presence.min_count
-
- مجالات الإحصاء:
-
features.common_stats.num_non_missing*
-
- شرط الكشف:
- يتم تحديد
feature.presence.min_countوإما-
features.common_stats.num_non_missing* == 0 أو -
features.common_stats.num_non_missing* <feature.presence.min_count
-
- يتم تحديد
- حقول المخطط:
FEATURE_TYPE_LOW_NUMBER_VALUES- حقول المخطط:
-
feature.value_count.min -
feature.value_counts.value_count.min
-
- مجالات الإحصاء:
-
features.common_stats.min_num_values -
features.common_stats.presence_and_valency_stats.min_num_values
-
- شرط الكشف:
- إذا تم تحديد
feature.value_count.min-
features.common_stats.min_num_values<feature.value_count.min؛ أو
-
- إذا تم تحديد
feature.value_counts-
features.common_stats.presence_and_valency_stats.min_num_values<feature.value_counts.value_count.minعند مستوى تداخل معين
-
- إذا تم تحديد
- حقول المخطط:
FEATURE_TYPE_NOT_PRESENT- حقول المخطط:
-
feature.in_environmentأوfeature.not_in_environmentأوschema.default_environment. البيئة الافتراضية -
feature.lifecycle_stage -
feature.presence.min_countأوfeature.presence.min_fraction
-
- مجالات الإحصاء:
-
features.common_stats.num_non_missing*
-
- شرط الكشف:
-
feature.lifecycle_stageليست في [PLANNED،ALPHA،DEBUG،DEPRECATED] و -
common_stats.num_non_missing* == 0 و - (
feature.presence.min_count> 0 أوfeature.presence.min_fraction> 0) وإما-
feature.in_environment== البيئة الحالية أو -
feature.not_in_environment! = البيئة الحالية أو -
schema.default_environment! = البيئة الحالية
-
-
- حقول المخطط:
FEATURE_TYPE_NO_VALUES- لم يتم اكتشاف نوع الانحراف في TFDV
FEATURE_TYPE_UNEXPECTED_REPEATED- لم يتم اكتشاف نوع الانحراف في TFDV
FEATURE_TYPE_HIGH_UNIQUE- حقول المخطط:
-
feature.unique_constraints.max
-
- مجالات الإحصاء:
-
features.string_stats.unique
-
- شرط الكشف:
-
features.string_stats.unique>feature.unique_constraints.max
-
- حقول المخطط:
FEATURE_TYPE_LOW_UNIQUE- حقول المخطط:
-
feature.unique_constraints.min
-
- مجالات الإحصاء:
-
features.string_stats.unique
-
- شرط الكشف:
-
features.string_stats.unique<feature.unique_constraints.min
-
- حقول المخطط:
FEATURE_TYPE_NO_UNIQUE- حقول المخطط:
-
feature.unique_constraints
-
- مجالات الإحصاء:
-
features.string_stats.unique
-
- شرط الكشف:
-
feature.unique_constraintsمحددة ولكن لا توجدfeatures.string_stats.uniqueموجودة (كما هو الحال عندما تكون الميزة ليست سلسلة أو قاطعة)
-
- حقول المخطط:
FLOAT_TYPE_BIG_FLOAT- حقول المخطط:
-
feature.float_domain.max
-
- مجالات الإحصاء:
-
features.type -
features.num_stats.maxأوfeatures.string_stats.rank_histogram
-
- شرط الكشف:
- إذا كانت
features.type==FLOAT،-
features.num_stats.max>feature.float_domain.max؛ أو
-
- إذا كانت
features.type==BYTESأوSTRING،- القيمة القصوى في
features.string_stats.rank_histogram(عند التحويل إلى تعويم)>feature.float_domain.max
- القيمة القصوى في
- إذا كانت
- حقول المخطط:
FLOAT_TYPE_NOT_FLOAT- لم يتم اكتشاف نوع الانحراف في TFDV
FLOAT_TYPE_SMALL_FLOAT- حقول المخطط:
-
feature.float_domain.min
-
- مجالات الإحصاء:
-
features.type -
features.num_stats.minأوfeatures.string_stats.rank_histogram
-
- شرط الكشف:
- إذا كانت
features.type==FLOAT،-
features.num_stats.min<feature.float_domain.min؛ أو
-
- إذا كانت
features.type==BYTESأوSTRING،- الحد الأدنى للقيمة في
features.string_stats.rank_histogram(عند التحويل إلى تعويم) <feature.float_domain.min
- الحد الأدنى للقيمة في
- إذا كانت
- حقول المخطط:
FLOAT_TYPE_STRING_NOT_FLOAT- حقول المخطط:
-
feature.float_domain
-
- مجالات الإحصاء:
-
features.type -
features.string_stats.rank_histogram
-
- شرط الكشف:
-
features.type==BYTESأوSTRINGو -
features.string_stats.rank_histogramله قيمة واحدة على الأقل لا يمكن تحويلها إلى عدد عشري
-
- حقول المخطط:
FLOAT_TYPE_NON_STRING- لم يتم اكتشاف نوع الانحراف في TFDV
FLOAT_TYPE_UNKNOWN_TYPE_NUMBER- لم يتم اكتشاف نوع الانحراف في TFDV
FLOAT_TYPE_HAS_NAN- حقول المخطط:
-
feature.float_domain.disallow_nan
-
- مجالات الإحصاء:
-
features.type -
features.num_stats.histograms.num_nan
-
- شرط الكشف:
- قيمة
float_domain.disallow_nanصحيحة و -
features.num_stats.histograms.num_nan> 0
- قيمة
- حقول المخطط:
FLOAT_TYPE_HAS_INF- حقول المخطط:
-
feature.float_domain.disallow_inf
-
- مجالات الإحصاء:
-
features.type -
features.num_stats.min -
features.num_stats.max
-
- شرط الكشف:
-
features.type==FLOAT - قيمة
float_domain.disallow_infصحيحة وأيًا منهما-
features.num_stats.min==inf/-infأو -
features.num_stats.max==inf/-inf
-
-
- حقول المخطط:
INT_TYPE_BIG_INT- حقول المخطط:
-
feature.int_domain.max
-
- مجالات الإحصاء:
-
features.type -
features.num_stats.max -
features.string_stats.rank_histogram
-
- شرط الكشف:
- إذا كانت
features.type==INT،-
features.num_stats.max>feature.int_domain.max؛ أو
-
- إذا كانت
features.type==BYTESأوSTRING،- القيمة القصوى في
features.string_stats.rank_histogram(عند التحويل إلى int)>feature.int_domain.max
- القيمة القصوى في
- إذا كانت
- حقول المخطط:
INT_TYPE_INT_EXPECTED- لم يتم اكتشاف نوع الانحراف في TFDV
INT_TYPE_NOT_INT_STRING- حقول المخطط:
-
feature.int_domain
-
- مجالات الإحصاء:
-
features.type -
features.string_stats.rank_histogram
-
- شرط الكشف:
-
features.type==BYTESأوSTRINGو -
features.string_stats.rank_histogramله قيمة واحدة على الأقل لا يمكن تحويلها إلى عدد صحيح
-
- حقول المخطط:
INT_TYPE_NOT_STRING- لم يتم اكتشاف نوع الانحراف في TFDV
INT_TYPE_SMALL_INT- حقول المخطط:
-
feature.int_domain.min
-
- مجالات الإحصاء:
-
features.type -
features.num_stats.min -
features.string_stats.rank_histogram
-
- شرط الكشف:
- إذا كانت
features.type==INT،-
features.num_stats.min<feature.int_domain.min؛ أو
-
- إذا كانت
features.type==BYTESأوSTRING،- الحد الأدنى للقيمة في
features.string_stats.rank_histogram(عند التحويل إلى int) <feature.int_domain.min
- الحد الأدنى للقيمة في
- إذا كانت
- حقول المخطط:
INT_TYPE_STRING_EXPECTED- لم يتم اكتشاف نوع الانحراف في TFDV
INT_TYPE_UNKNOWN_TYPE_NUMBER- لم يتم اكتشاف نوع الانحراف في TFDV
LOW_SUPPORTED_IMAGE_FRACTION- حقول المخطط:
-
feature.image_domain.minimum_supported_image_fraction
-
- مجالات الإحصاء:
-
features.custom_stats.rank_histogramfor the custom_stats مع الاسمimage_format_histogram. لاحظ أنه يجب تمكين إحصائيات المجال الدلالي من أجل إنشاء image_format_histogram ولكي يتم إجراء هذا التحقق من الصحة. لا يتم إنشاء احصائيات المجال الدلالي بشكل افتراضي.
-
- شرط الكشف:
- جزء القيم المدعومة من أنواع صور Tensorflow لجميع أنواع الصور أقل من
feature.image_domain.minimum_supported_image_fraction.
- جزء القيم المدعومة من أنواع صور Tensorflow لجميع أنواع الصور أقل من
- حقول المخطط:
SCHEMA_MISSING_COLUMN- حقول المخطط:
-
feature.in_environmentأوfeature.not_in_environmentأوschema.default_environment. البيئة الافتراضية -
feature.lifecycle_stage -
feature.presence.min_countأوfeature.presence.min_fraction
-
- شرط الكشف:
-
feature.lifecycle_stage! =PLANNEDأوALPHAأوDEBUGأوDEPRECATEDو -
feature.presence.min_count> 0 أوfeature.presence.min_fraction> 0 و -
feature.in_environment== البيئة الحالية أوfeature.not_in_environment! = البيئة الحالية أوschema.default_environment. - لم يتم العثور على ميزة بالاسم / المسار المحدد في بروتو الإحصائيات
-
- حقول المخطط:
SCHEMA_NEW_COLUMN- شرط الكشف:
- توجد ميزة في بروتو الإحصائيات ولكن لا توجد ميزة باسمها / مسارها في بروتو المخطط
- شرط الكشف:
SCHEMA_TRAINING_SERVING_SKEW- لم يتم اكتشاف نوع الانحراف في TFDV
STRING_TYPE_NOW_FLOAT- لم يتم اكتشاف نوع الانحراف في TFDV
STRING_TYPE_NOW_INT- لم يتم اكتشاف نوع الانحراف في TFDV
COMPARATOR_CONTROL_DATA_MISSING- حقول المخطط:
-
feature.skew_comparator.infinity_norm.threshold -
feature.drift_comparator.infinity_norm.threshold
-
- شرط الكشف:
- يتوفر بروتو إحصائيات التحكم (على سبيل المثال ، إحصائيات الخدمة للانحراف أو الإحصائيات السابقة للانجراف) ولكنها لا تحتوي على الميزة المحددة
- حقول المخطط:
COMPARATOR_TREATMENT_DATA_MISSING- لم يتم اكتشاف نوع الانحراف في TFDV
COMPARATOR_L_INFTY_HIGH- حقول المخطط:
-
feature.skew_comparator.infinity_norm.threshold -
feature.drift_comparator.infinity_norm.threshold
-
- مجالات الإحصاء:
-
features.string_stats.rank_histogram*
-
- شرط الكشف:
- معيار L- اللانهاية للمتجه الذي يمثل الفرق بين التعداد الطبيعي من السمات
features.string_stats.rank_histogram* في إحصائيات التحكم (أي ، إحصائيات الخدمة للانحراف أو الإحصائيات السابقة للانجراف) وإحصاءات المعالجة (أي إحصاءات التدريب لـ الانحراف أو الإحصائيات الحالية للانجراف)>feature.skew_comparator.infinity_norm.thresholdأوfeature.drift_comparator.infinity_norm.threshold
- معيار L- اللانهاية للمتجه الذي يمثل الفرق بين التعداد الطبيعي من السمات
- حقول المخطط:
COMPARATOR_NORMALIZED_ABSOLUTE_DIFFERENCE_HIGH- حقول المخطط:
-
feature.skew_comparator.normalized_abs_difference.threshold -
feature.drift_comparator.normalized_abs_difference.threshold
-
- مجالات الإحصاء:
-
features.string_stats.rank_histogram
-
- شرط الكشف:
- تم تجاوز فرق العد المطلق المعدل لأعداد القيمة من
features.string_stats.rank_histogramفي إحصائيات التحكم (على سبيل المثال ، إحصائيات الخدمة للانحراف أو الإحصائيات السابقة للانجراف) وإحصاءات المعالجة (أي إحصاءات التدريب للانحراف أو الإحصائيات الحالية للانجراف). feature.skew_comparator.normalized_abs_difference.threshold أو feature.drift_comparator.normalized_abs_difference.threshold. يتم تسوية فروق العد من خلال العدد الإجمالي عبر كلا الشرطين.
- تم تجاوز فرق العد المطلق المعدل لأعداد القيمة من
- حقول المخطط:
COMPARATOR_JENSEN_SHANNON_DIVERGENCE_HIGH- حقول المخطط:
-
feature.skew_comparator.jensen_shannon_divergence.threshold -
feature.drift_comparator.jensen_shannon_divergence.threshold
-
- مجالات الإحصاء:
-
features.num_stats.histogramsمن النوعSTANDARD -
features.string_stats.rank_histogram*
-
- شرط الكشف:
- تباعد جنسن-شانون التقريبي المحسوب بين إحصائيات التحكم (على سبيل المثال ، إحصائيات تقديم الانحراف أو الإحصائيات السابقة للانجراف) وإحصاءات المعالجة (أي إحصاءات التدريب للانحراف أو الإحصائيات الحالية للانجراف)>
feature.skew_comparator.jensen_shannon_divergence.thresholdأوfeature.drift_comparator.jensen_shannon_divergence.threshold. يُحسب تباعد جنسن-شانون التقريبي بناءً على عدد العينات المقيسة فيfeatures.string_stats.rank_histogramfeatures.num_stats.histograms
- تباعد جنسن-شانون التقريبي المحسوب بين إحصائيات التحكم (على سبيل المثال ، إحصائيات تقديم الانحراف أو الإحصائيات السابقة للانجراف) وإحصاءات المعالجة (أي إحصاءات التدريب للانحراف أو الإحصائيات الحالية للانجراف)>
- حقول المخطط:
NO_DATA_IN_SPAN- لم يتم اكتشاف نوع الانحراف في TFDV
SPARSE_FEATURE_MISSING_VALUE- حقول المخطط:
-
sparse_feature.value_feature
-
- مجالات الإحصاء:
-
features.custom_stats
-
- شرط الكشف:
-
features.custom_statsمع "مفقود_قيمة" كاسم و - stat_value المخصص
missing_value! = 0
-
- حقول المخطط:
SPARSE_FEATURE_MISSING_INDEX- حقول المخطط:
-
sparse_feature.index_feature
-
- مجالات الإحصاء:
-
features.custom_stats
-
- شرط الكشف:
-
features.custom_statsمع "الفهرس المفقود" كاسم و - يحتوي stat_index المخصص
missing_indexأي قيمة! = 0
-
- حقول المخطط:
SPARSE_FEATURE_LENGTH_MISMATCH- حقول المخطط:
-
sparse_feature.value_feature -
sparse_feature.index_feature
-
- مجالات الإحصاء:
-
features.custom_stats
-
- شرط الكشف:
-
features.custom_statsمع "min_length_diff" أو "max_length_diff" كاسم - تحتوي الإحصائيات المخصصة
min_length_diffأوmax_length_diffعلى أي قيمة! = 0
-
- حقول المخطط:
SPARSE_FEATURE_NAME_COLLISION- حقول المخطط:
-
sparse_feature.name -
sparse_feature.lifecycle_stage -
feature.name -
feature.lifecycle_stage
-
- شرط الكشف:
-
sparse_feature.lifecycle_stage! =PLANNEDأوALPHAأوDEBUGأوDEPRECATEDو -
feature.lifecycle_stage! =PLANNEDأوALPHAأوDEBUGأوDEPRECATEDو -
sparse_feature.name==feature.name
-
- حقول المخطط:
SEMANTIC_DOMAIN_UPDATE- حقول المخطط:
-
feature.domain_info
-
- مجالات الإحصاء:
-
features.custom_stats
-
- شرط الكشف:
-
features.custom_statsمع "domain_info" كاسم و - لم يتم تعيين
feature.domain_infoبالفعل في المخطط و - هناك إحصائيات مخصصة
domain_infoواحدة لهذه الميزة
-
- حقول المخطط:
COMPARATOR_LOW_NUM_EXAMPLES- حقول المخطط:
-
schema.dataset_constraints.num_examples_drift_comparator.min_fraction_threshold -
schema.dataset_constraints.num_examples_version_comparator.min_fraction_threshold
-
- مجالات الإحصاء:
-
num_examples*
-
- شرط الكشف:
-
num_examples*> 0 و - بروتو الإحصاءات السابقة متاح و
-
num_examples* / إحصاءات سابقةnum_examples* <المقارنةmin_fraction_threshold
-
- حقول المخطط:
COMPARATOR_HIGH_NUM_EXAMPLES- حقول المخطط:
-
schema.dataset_constraints.num_examples_drift_comparator.max_fraction_threshold -
schema.dataset_constraints.num_examples_version_comparator.max_fraction_threshold
-
- مجالات الإحصاء:
-
num_examples*
-
- شرط الكشف:
-
num_examples*> 0 و - بروتو الإحصاءات السابقة متاح و
-
num_examples* / الإحصائيات السابقةnum_examples*> المقارنةmax_fraction_threshold
-
- حقول المخطط:
DATASET_LOW_NUM_EXAMPLES- حقول المخطط:
-
schema.dataset_constraints.min_examples_count
-
- مجالات الإحصاء:
-
num_examples*
-
- شرط الكشف:
-
num_examples* <dataset_constraints.min_examples_count
-
- حقول المخطط:
DATASET_HIGH_NUM_EXAMPLES- حقول المخطط:
-
schema.dataset_constraints.max_examples_count
-
- مجالات الإحصاء:
-
num_examples*
-
- شرط الكشف:
-
num_examples*>dataset_constraints.max_examples_count
-
- حقول المخطط:
WEIGHTED_FEATURE_NAME_COLLISION- حقول المخطط:
-
weighted_feature.name -
weighted_feature.lifecycle_stage -
sparse_feature.name -
sparse_feature.lifecycle_stage -
feature.name -
feature.lifecycle_stage
-
- شرط الكشف:
-
weighted_feature.lifecycle_stage! =PLANNEDأوALPHAأوDEBUGأوDEPRECATEDوإما- إذا كانت
feature.lifecycle_stage! =PLANNEDأوALPHAأوDEBUGأوDEPRECATED،-
weighted_feature.name==feature.name؛ أو
-
- إذا
sparse_feature.lifecycle_stage! =PLANNEDأوALPHAأوDEBUGأوDEPRECATED،-
weighted_feature.name==sparse_feature.name
-
- إذا كانت
-
- حقول المخطط:
WEIGHTED_FEATURE_MISSING_VALUE- حقول المخطط:
-
weighted_feature.feature
-
- مجالات الإحصاء:
-
features.custom_stats
-
- شرط الكشف:
-
features.custom_statsمع "مفقود_قيمة" كاسم و - stat_value المخصص
missing_value! = 0
-
- حقول المخطط:
WEIGHTED_FEATURE_MISSING_WEIGHT- حقول المخطط:
-
weighted_feature.weight_feature
-
- مجالات الإحصاء:
-
features.custom_stats
-
- شرط الكشف:
-
features.custom_statsمع "مفقود_وزن" كاسم و - الإحصاء المخصص
missing_weight! = 0
-
- حقول المخطط:
WEIGHTED_FEATURE_LENGTH_MISMATCH- حقول المخطط:
-
weighted_feature.feature -
weighted_feature.weight_feature
-
- مجالات الإحصاء:
-
features.custom_stats
-
- شرط الكشف:
-
features.custom_statsمع "min_weighted_length_diff" أو "max_weight_length_diff" كاسم ، و -
min_weight_length_diffأوmax_weight_length_diffإحصائية مخصصة! = 0
-
- حقول المخطط:
VALUE_NESTEDNESS_MISMATCH- حقول المخطط:
-
feature.value_count -
feature.value_counts
-
- مجالات الإحصاء:
-
features.common_stats.presence_and_valency_stats
-
- شرط الكشف:
- يتم تحديد
feature.value_count، وهناكpresence_and_valency_stats(مما يشير إلى مستوى تداخل أكبر من واحد) و - يتم تحديد
feature.value_counts، وعدد مرات تكرارpresence_and_valency_statsللميزة لا يتطابق مع عدد مرات تكرارvalue_countداخلfeature.value_counts
- يتم تحديد
- حقول المخطط:
DOMAIN_INVALID_FOR_TYPE- حقول المخطط:
-
feature.type -
feature.domain_info
-
- مجالات الإحصاء:
-
features.type
-
- شرط الكشف:
- إذا كانت
features.type==BYTES،-
feature.domain_infoمن نوع غير متوافق ؛ أو
-
- إذا كانت
features.type! =BYTES،- لا يتطابق
feature.domain_infoمعfeature.type(على سبيل المثال ، تم تحديدint_domain، لكنtypeالميزة هوFLOAT)
- لا يتطابق
- إذا كانت
- حقول المخطط:
FEATURE_MISSING_NAME- حقول المخطط:
-
feature.name
-
- شرط الكشف:
- لم يتم تحديد
feature.name
- لم يتم تحديد
- حقول المخطط:
FEATURE_MISSING_TYPE- حقول المخطط:
-
feature.type
-
- شرط الكشف:
- لم يتم تحديد
feature.type
- لم يتم تحديد
- حقول المخطط:
INVALID_SCHEMA_SPECIFICATION- حقول المخطط:
-
feature.domain_info -
feature.presence.min_fraction -
feature.value_count.min -
feature.value_count.max -
feature.distribution_constraints
-
- شرط الكشف:
-
feature.presence.min_fraction<0.0 أو> 1.0 ، أو -
feature.value_count.min<0 أو>feature.value_count.maxأو - يتم تحديد مجال منطقي أو عدد صحيح أو عائم أو هيكلي أو
feature.distribution_constraintsلميزة وميزة. - تم تحديد
feature.distribution_constraintsلميزة ، ولكن لم يتم تحديد مجال على مستوى المخطط ولاfeature.string_domain.
-
- حقول المخطط:
INVALID_DOMAIN_SPECIFICATION- حقول المخطط:
-
feature.domain_info -
feature.bool_domain -
feature.string_domain
-
- شرط الكشف:
- تم تحديد نوع
feature.domain_infoغير معروف أو - تم تحديد
feature.domain، ولكن لم يتم تحديد مجال مطابق على مستوى المخطط ، أو - إذا تم تحديد
feature.bool_domainوfeature.bool_domain.true_valueوfeature.bool_domain.false_value،-
feature.bool_domain.true_value==feature.bool_domain.false_value، أو
-
- إذا تم تحديد
feature.string_domain،- يحتوي على
feature.string_domain.valuesمكررة أو - تتجاوز
feature.string_domainالحد الأقصى للحجم
- يحتوي على
- تم تحديد نوع
- حقول المخطط:
UNEXPECTED_DATA_TYPE- حقول المخطط:
-
feature.type
-
- مجالات الإحصاء:
-
features.type
-
- شرط الكشف:
-
features.typeليس من النوع المحدد فيfeature.type
-
- حقول المخطط:
SEQUENCE_VALUE_TOO_FEW_OCCURRENCES- حقول المخطط:
-
feature.natural_language_domain.token_constraints.min_per_sequence
-
- مجالات الإحصاء:
-
features.custom_stats.nl_statistics.token_statistics.per_sequence_min_frequency
-
- شرط الكشف:
-
min_per_sequence>per_sequence_min_frequency
-
- حقول المخطط:
SEQUENCE_VALUE_TOO_MANY_OCCURRENCES- حقول المخطط:
-
feature.natural_language_domain.token_constraints.max_per_sequence
-
- مجالات الإحصاء:
-
features.custom_stats.nl_statistics.token_statistics.per_sequence_max_frequency
-
- شرط الكشف:
-
max_per_sequence<per_sequence_max_frequency
-
- حقول المخطط:
SEQUENCE_VALUE_TOO_SMALL_FRACTION- حقول المخطط:
-
feature.natural_language_domain.token_constraints.min_fraction_of_sequences
-
- مجالات الإحصاء:
-
features.custom_stats.nl_statistics.token_statistics.fraction_of_sequences
-
- شرط الكشف:
-
min_fraction_of_sequences>fraction_of_sequences
-
- حقول المخطط:
SEQUENCE_VALUE_TOO_LARGE_FRACTION- حقول المخطط:
-
feature.natural_language_domain.token_constraints.max_fraction_of_sequences
-
- مجالات الإحصاء:
-
features.custom_stats.nl_statistics.token_statistics.fraction_of_sequences
-
- شرط الكشف:
-
max_fraction_of_sequences<fraction_of_sequences
-
- حقول المخطط:
FEATURE_COVERAGE_TOO_LOW- حقول المخطط:
-
feature.natural_language_domain.coverage.min_coverage
-
- مجالات الإحصاء:
-
features.custom_stats.nl_statistics.feature_coverage
-
- شرط الكشف:
-
feature_coverage<coverage.min_coverage
-
- حقول المخطط:
FEATURE_COVERAGE_TOO_SHORT_AVG_TOKEN_LENGTH- حقول المخطط:
-
feature.natural_language_domain.coverage.min_avg_token_length
-
- مجالات الإحصاء:
-
features.custom_stats.nl_statistics.avg_token_length
-
- شرط الكشف:
-
avg_token_length<min_avg_token_length
-
- حقول المخطط:
NLP_WRONG_LOCATION- لم يتم اكتشاف نوع الانحراف في TFDV
EMBEDDING_SHAPE_INVALID- لم يتم اكتشاف نوع الانحراف في TFDV
MAX_IMAGE_BYTE_SIZE_EXCEEDED- حقول المخطط:
-
feature.image_domain.max_image_byte_size
-
- مجالات الإحصاء:
-
features.bytes_stats.max_num_bytes_int
-
- شرط الكشف:
-
max_num_bytes_int>max_image_byte_size
-
- حقول المخطط:
INVALID_FEATURE_SHAPE- حقول المخطط:
-
feature.shape
-
- مجالات الإحصاء:
-
features.common_stats.num_missing -
features.common_stats.min_num_values -
features.common_stats.max_num_values -
features.common_stats.presence_and_valency_stats.num_missing -
features.common_stats.presence_and_valency_stats.min_num_values -
features.common_stats.presence_and_valency_stats.max_num_values -
features.common_stats.weighted_presence_and_valency_stats
-
- شرط الكشف:
- يتم تحديد
feature.shape، وإما- قد تكون الميزة مفقودة (
num_missing! = 0) في بعض مستويات العش أو - قد تحتوي الميزة على عدد متغير من القيم (
min_num_values! =max_num_values) في بعض مستويات العش أو - الشكل المحدد غير متوافق مع إحصائيات عدد قيم الميزة. على سبيل المثال ، الشكل
[16]متوافق مع (min_num_values==max_num_values==[2, 2, 4](لميزة ثلاثية متداخلة))
- قد تكون الميزة مفقودة (
- يتم تحديد
- حقول المخطط:
STATS_NOT_AVAILBLE- يحدث الشذوذ عندما لا تكون الإحصائيات اللازمة للتحقق من القيود موجودة.
DERIVED_FEATURE_BAD_LIFECYCLE- حقول المخطط:
-
feature.lifecycle_stage
-
- مجالات الإحصاء:
-
features.validation_derived_source
-
- شرط الكشف:
-
feature.lifecycle_stageليست واحدة منDERIVEDأوDISABLED، والميزاتfeatures.validation_derived_sourceموجودة ، مما يشير إلى أن هذه ميزة مشتقة.
-
- حقول المخطط:
DERIVED_FEATURE_INVALID_SOURCE- حقول المخطط:
-
feature.validation_derived_source
-
- مجالات الإحصاء:
-
features.validation_derived_source
-
- شرط الكشف:
-
features.validation_derived_sourceموجودة لميزة ، لكنfeature.validation_derived_sourceالمقابلة.
-
- حقول المخطط:
* في حالة توفر إحصاء مرجح لهذا الحقل ، فسيتم استخدامه بدلاً من الإحصاء غير الموزون.