TFDV, bir şema ve istatistik proto(lar)ını karşılaştırarak anormallikleri kontrol eder. Aşağıdaki tablo, TFDV'nin tespit edebileceği anormallik tiplerini, her bir anormallik tipini tespit etmek için kullanılan şema ve istatistik alanlarını ve her bir anormallik tipinin tespit edildiği koşulları listeler.
BOOL_TYPE_BIG_INT- Şema Alanları:
-
feature.bool_domain
-
- İstatistik Alanları:
-
features.num_stats.max -
features.type
-
- Algılama Koşulu:
-
feature.bool_domainbelirtilir ve -
features.type==INTve -
features.num_stats.max> 1
-
- Şema Alanları:
BOOL_TYPE_BYTES_NOT_INT- TFDV'de anormallik türü algılanmadı
BOOL_TYPE_BYTES_NOT_STRING- TFDV'de anormallik türü algılanmadı
BOOL_TYPE_FLOAT_NOT_INT- TFDV'de anormallik türü algılanmadı
BOOL_TYPE_FLOAT_NOT_STRING- TFDV'de anormallik türü algılanmadı
BOOL_TYPE_INT_NOT_STRING- TFDV'de anormallik türü algılanmadı
BOOL_TYPE_SMALL_INT- Şema Alanları:
-
feature.bool_domain
-
- İstatistik Alanları:
-
features.num_stats.min -
features.type
-
- Algılama Koşulu:
-
features.type==INTve -
feature.bool_domainbelirtilir ve -
features.num_stats.min< 0
-
- Şema Alanları:
BOOL_TYPE_STRING_NOT_INT- TFDV'de anormallik türü algılanmadı
BOOL_TYPE_UNEXPECTED_STRING- Şema Alanları:
-
feature.bool_domain
-
- İstatistik Alanları:
-
features.string_stats.rank_histogram*
-
- Algılama Koşulu:
-
features.type==STRINGve -
feature.bool_domainbelirtilir ve -
rank_histogram* içindeki en az bir değerfeature.bool_domain.true_valueveyafeature.bool_domain.false_valuedeğil
-
- Şema Alanları:
BOOL_TYPE_UNEXPECTED_FLOAT- Şema Alanları:
-
feature.bool_domain
-
- İstatistik Alanları:
-
features.num_stats.min -
features.num_stats.max -
features.num_stats.histograms.num_nan -
features.num_stats.histograms.buckets.low_value -
features.num_stats.histograms.buckets.high_value -
features.type
-
- Algılama Koşulu:
-
features.type==FLOATve -
feature.bool_domainbelirtilir ve- (
features.num_stats.min!= 0 veyafeatures.num_stats.min!= 1) veya - (
features.num_stats.max!= 0 veyafeatures.num_stats.max!= 1) veya -
features.num_stats.histograms.num_nan> 0 veya - (
features.num_stats.histograms.buckets.low_value!= 0 veyafeatures.num_stats.histograms.buckets.high_value!= 1) vefeatures.num_stats.histograms.buckets.sample_count> 0
- (
-
- Şema Alanları:
BOOL_TYPE_INVALID_CONFIG- Şema Alanları:
-
feature.bool_domain
-
- İstatistik Alanları:
-
features.type
-
- Algılama Koşulu:
-
features.type==INTveyaFLOATise,-
feature.bool_domainbelirtilir ve -
feature.bool_domain.true_valueveyafeature.bool_domain.false_valuebelirtilmiş veya
-
- eğer
features.type==STRING,-
feature.bool_domainbelirtilir ve -
feature.bool_domain.true_valuevefeature.bool_domain.false_valuebelirtilmedi
-
-
- Şema Alanları:
ENUM_TYPE_BYTES_NOT_STRING- TFDV'de anormallik türü algılanmadı
ENUM_TYPE_FLOAT_NOT_STRING- TFDV'de anormallik türü algılanmadı
ENUM_TYPE_INT_NOT_STRING- TFDV'de anormallik türü algılanmadı
ENUM_TYPE_INVALID_UTF8- İstatistik Alanları:
-
features.string_stats.invalid_utf8_count
-
- Algılama Koşulu:
-
invalid_utf8_count> 0
-
- İstatistik Alanları:
ENUM_TYPE_UNEXPECTED_STRING_VALUES- Şema Alanları:
-
string_domainvefeature.domain; veyafeature.string_domain -
feature.distribution_constraints.min_domain_mass
-
- İstatistik Alanları:
-
features.string_stats.rank_histogram*
-
- Algılama Koşulu:
- Ya (
rank_histogram* etki alanında olmayan değerlerin sayısı / toplam değer sayısı) > (1 -feature.distribution_constraints.min_domain_mass) veya -
feature.distribution_constraints.min_domain_mass== 1.0 ve histogramda etki alanında olmayan değerler var
- Ya (
- Şema Alanları:
FEATURE_TYPE_HIGH_NUMBER_VALUES- Şema Alanları:
-
feature.value_count.max -
feature.value_counts.value_count.max
-
- İstatistik Alanları:
-
features.common_stats.max_num_values -
features.common_stats.presence_and_valency_stats.max_num_values
-
- Algılama Koşulu:
-
feature.value_count.maxbelirtilmişse-
features.common_stats.max_num_values>feature.value_count.max; veya
-
-
feature.value_countsbelirtilmişse-
feature.value_counts.value_count.max<features.common_stats.presence_and_valency_stats.max_num_valuesbelirli bir yuvalanmışlık düzeyinde
-
-
- Şema Alanları:
FEATURE_TYPE_LOW_FRACTION_PRESENT- Şema Alanları:
-
feature.presence.min_fraction
-
- İstatistik Alanları:
-
features.common_stats.num_non_missing* -
num_examples*
-
- Algılama Koşulu:
-
feature.presence.min_fractionbelirtilir ve (features.common_stats.num_non_missing* /num_examples*) <feature.presence.min_fractionveya -
feature.presence.min_fraction== 1.0 vecommon_stats.num_missing!= 0
-
- Şema Alanları:
FEATURE_TYPE_LOW_NUMBER_PRESENT- Şema Alanları:
-
feature.presence.min_count
-
- İstatistik Alanları:
-
features.common_stats.num_non_missing*
-
- Algılama Koşulu:
-
feature.presence.min_countbelirtilir ve-
features.common_stats.num_non_missing* == 0 veya -
features.common_stats.num_non_missing* <feature.presence.min_count
-
-
- Şema Alanları:
FEATURE_TYPE_LOW_NUMBER_VALUES- Şema Alanları:
-
feature.value_count.min -
feature.value_counts.value_count.min
-
- İstatistik Alanları:
-
features.common_stats.min_num_values -
features.common_stats.presence_and_valency_stats.min_num_values
-
- Algılama Koşulu:
-
feature.value_count.minbelirtilmişse-
features.common_stats.min_num_values<feature.value_count.min; veya
-
-
feature.value_countsbelirtilmişse-
features.common_stats.presence_and_valency_stats.min_num_values<feature.value_counts.value_count.minbelirli bir yuvalanmışlık seviyesinde
-
-
- Şema Alanları:
FEATURE_TYPE_NOT_PRESENT- Şema Alanları:
-
feature.in_environmentveyafeature.not_in_environmentveyaschema.default_environment -
feature.lifecycle_stage -
feature.presence.min_countveyafeature.presence.min_fraction
-
- İstatistik Alanları:
-
features.common_stats.num_non_missing*
-
- Algılama Koşulu:
-
feature.lifecycle_stage[PLANNED,ALPHA,DEBUG,DEPRECATED] konumunda değil ve -
common_stats.num_non_missing* == 0 ve - (
feature.presence.min_count> 0 veyafeature.presence.min_fraction> 0) ve-
feature.in_environment== geçerli ortam veya -
feature.not_in_environment!= geçerli ortam veya -
schema.default_environment!= geçerli ortam
-
-
- Şema Alanları:
FEATURE_TYPE_NO_VALUES- TFDV'de anormallik türü algılanmadı
FEATURE_TYPE_UNEXPECTED_REPEATED- TFDV'de anormallik türü algılanmadı
FEATURE_TYPE_HIGH_UNIQUE- Şema Alanları:
-
feature.unique_constraints.max
-
- İstatistik Alanları:
-
features.string_stats.unique
-
- Algılama Koşulu:
-
features.string_stats.unique>feature.unique_constraints.max
-
- Şema Alanları:
FEATURE_TYPE_LOW_UNIQUE- Şema Alanları:
-
feature.unique_constraints.min
-
- İstatistik Alanları:
-
features.string_stats.unique
-
- Algılama Koşulu:
-
features.string_stats.unique<feature.unique_constraints.min
-
- Şema Alanları:
FEATURE_TYPE_NO_UNIQUE- Şema Alanları:
-
feature.unique_constraints
-
- İstatistik Alanları:
-
features.string_stats.unique
-
- Algılama Koşulu:
-
feature.unique_constraintsbelirtildi, ancakfeatures.string_stats.uniquemevcut değil (özelliğin bir dize veya kategorik olmadığı durumda olduğu gibi)
-
- Şema Alanları:
FLOAT_TYPE_BIG_FLOAT- Şema Alanları:
-
feature.float_domain.max
-
- İstatistik Alanları:
-
features.type -
features.num_stats.maxveyafeatures.string_stats.rank_histogram
-
- Algılama Koşulu:
-
features.type==FLOATise,-
features.num_stats.max>feature.float_domain.max; veya
-
- eğer
features.type==BYTESveyaSTRINGise,-
features.string_stats.rank_histogrammaksimum değer (kayana dönüştürüldüğünde) >feature.float_domain.max
-
-
- Şema Alanları:
FLOAT_TYPE_NOT_FLOAT- TFDV'de anormallik türü algılanmadı
FLOAT_TYPE_SMALL_FLOAT- Şema Alanları:
-
feature.float_domain.min
-
- İstatistik Alanları:
-
features.type -
features.num_stats.minveyafeatures.string_stats.rank_histogram
-
- Algılama Koşulu:
-
features.type==FLOATise,-
features.num_stats.min<feature.float_domain.min; veya
-
- eğer
features.type==BYTESveyaSTRINGise,-
features.string_stats.rank_histogramminimum değer (float'a dönüştürüldüğünde) <feature.float_domain.min
-
-
- Şema Alanları:
FLOAT_TYPE_STRING_NOT_FLOAT- Şema Alanları:
-
feature.float_domain
-
- İstatistik Alanları:
-
features.type -
features.string_stats.rank_histogram
-
- Algılama Koşulu:
-
features.type==BYTESveyaSTRINGve -
features.string_stats.rank_histogram, kayan değere dönüştürülemeyen en az bir değere sahip
-
- Şema Alanları:
FLOAT_TYPE_NON_STRING- TFDV'de anormallik türü algılanmadı
FLOAT_TYPE_UNKNOWN_TYPE_NUMBER- TFDV'de anormallik türü algılanmadı
FLOAT_TYPE_HAS_NAN- Şema Alanları:
-
feature.float_domain.disallow_nan
-
- İstatistik Alanları:
-
features.type -
features.num_stats.histograms.num_nan
-
- Algılama Koşulu:
-
float_domain.disallow_nandoğrudur ve -
features.num_stats.histograms.num_nan> 0
-
- Şema Alanları:
FLOAT_TYPE_HAS_INF- Şema Alanları:
-
feature.float_domain.disallow_inf
-
- İstatistik Alanları:
-
features.type -
features.num_stats.min -
features.num_stats.max
-
- Algılama Koşulu:
-
features.type==FLOAT -
float_domain.disallow_infdoğrudur ve ya-
features.num_stats.min==inf/-infveya -
features.num_stats.max==inf/-inf
-
-
- Şema Alanları:
INT_TYPE_BIG_INT- Şema Alanları:
-
feature.int_domain.max
-
- İstatistik Alanları:
-
features.type -
features.num_stats.max -
features.string_stats.rank_histogram
-
- Algılama Koşulu:
-
features.type==INTise,-
features.num_stats.max>feature.int_domain.max; veya
-
- eğer
features.type==BYTESveyaSTRINGise,-
features.string_stats.rank_histogrammaksimum değer (int'e dönüştürüldüğünde) >feature.int_domain.max
-
-
- Şema Alanları:
INT_TYPE_INT_EXPECTED- TFDV'de anormallik türü algılanmadı
INT_TYPE_NOT_INT_STRING- Şema Alanları:
-
feature.int_domain
-
- İstatistik Alanları:
-
features.type -
features.string_stats.rank_histogram
-
- Algılama Koşulu:
-
features.type==BYTESveyaSTRINGve -
features.string_stats.rank_histogramint'e dönüştürülemeyen en az bir değere sahip
-
- Şema Alanları:
INT_TYPE_NOT_STRING- TFDV'de anormallik türü algılanmadı
INT_TYPE_SMALL_INT- Şema Alanları:
-
feature.int_domain.min
-
- İstatistik Alanları:
-
features.type -
features.num_stats.min -
features.string_stats.rank_histogram
-
- Algılama Koşulu:
-
features.type==INTise,-
features.num_stats.min<feature.int_domain.min; veya
-
- eğer
features.type==BYTESveyaSTRINGise,-
features.string_stats.rank_histogramminimum değer (int'e dönüştürüldüğünde) <feature.int_domain.min
-
-
- Şema Alanları:
INT_TYPE_STRING_EXPECTED- TFDV'de anormallik türü algılanmadı
INT_TYPE_UNKNOWN_TYPE_NUMBER- TFDV'de anormallik türü algılanmadı
LOW_SUPPORTED_IMAGE_FRACTION- Şema Alanları:
-
feature.image_domain.minimum_supported_image_fraction
-
- İstatistik Alanları:
-
image_format_histogramadlı custom_stats içinfeatures.custom_stats.rank_histogram. image_format_histogram'ın oluşturulması ve bu doğrulamanın gerçekleştirilmesi için semantik etki alanı istatistiklerinin etkinleştirilmesi gerektiğini unutmayın. Anlamsal etki alanı istatistikleri varsayılan olarak oluşturulmaz.
-
- Algılama Koşulu:
- Tensorflow görüntü türlerinin tüm görüntü türleri için desteklenen değerlerinin oranı,
feature.image_domain.minimum_supported_image_fractiondeğerinden daha azdır.
- Tensorflow görüntü türlerinin tüm görüntü türleri için desteklenen değerlerinin oranı,
- Şema Alanları:
SCHEMA_MISSING_COLUMN- Şema Alanları:
-
feature.in_environmentveyafeature.not_in_environmentveyaschema.default_environment -
feature.lifecycle_stage -
feature.presence.min_countveyafeature.presence.min_fraction
-
- Algılama Koşulu:
-
feature.lifecycle_stage!=PLANNED,ALPHA,DEBUGveyaDEPRECATEDve -
feature.presence.min_count> 0 veyafeature.presence.min_fraction> 0 ve -
feature.in_environment== geçerli ortam veyafeature.not_in_environment!= geçerli ortam veyaschema.default_environment!= geçerli ortam ve - istatistik protokolünde belirtilen ada/yola sahip hiçbir özellik bulunamadı
-
- Şema Alanları:
SCHEMA_NEW_COLUMN- Algılama Koşulu:
- istatistik protosunda bir özellik var ama şema protosunda adı/yolu olan bir özellik yok
- Algılama Koşulu:
SCHEMA_TRAINING_SERVING_SKEW- TFDV'de anormallik türü algılanmadı
STRING_TYPE_NOW_FLOAT- TFDV'de anormallik türü algılanmadı
STRING_TYPE_NOW_INT- TFDV'de anormallik türü algılanmadı
COMPARATOR_CONTROL_DATA_MISSING- Şema Alanları:
-
feature.skew_comparator.infinity_norm.threshold -
feature.drift_comparator.infinity_norm.threshold
-
- Algılama Koşulu:
- kontrol istatistikleri protokolü (yani, çarpıklık için hizmet istatistikleri veya sapma için önceki istatistikler) mevcuttur, ancak belirtilen özelliği içermez
- Şema Alanları:
COMPARATOR_TREATMENT_DATA_MISSING- TFDV'de anormallik türü algılanmadı
COMPARATOR_L_INFTY_HIGH- Şema Alanları:
-
feature.skew_comparator.infinity_norm.threshold -
feature.drift_comparator.infinity_norm.threshold
-
- İstatistik Alanları:
-
features.string_stats.rank_histogram*
-
- Algılama Koşulu:
- Vektörün L-sonsuz normu, kontrol istatistiklerindeki (yani, çarpıklık için hizmet istatistikleri veya kayma için önceki istatistikler)
features.string_stats.rank_histogram*'daki normalize edilmiş sayımlar ile tedavi istatistikleri (yani, eğrilik veya kayma için geçerli istatistikler) >feature.skew_comparator.infinity_norm.thresholdveyafeature.drift_comparator.infinity_norm.threshold
- Vektörün L-sonsuz normu, kontrol istatistiklerindeki (yani, çarpıklık için hizmet istatistikleri veya kayma için önceki istatistikler)
- Şema Alanları:
COMPARATOR_NORMALIZED_ABSOLUTE_DIFFERENCE_HIGH- Şema Alanları:
-
feature.skew_comparator.normalized_abs_difference.threshold -
feature.drift_comparator.normalized_abs_difference.threshold
-
- İstatistik Alanları:
-
features.string_stats.rank_histogram
-
- Algılama Koşulu:
- Değerlerin normalize edilmiş mutlak sayım farkı, kontrol istatistiklerindeki (yani, sapma için hizmet istatistikleri veya sapma için önceki istatistikler) ve tedavi istatistiklerindeki (yani, sapma için eğitim istatistikleri veya sapma için geçerli istatistikler)
features.string_stats.rank_histogramalınan değer sayımlarıdır. feature.skew_comparator.normalized_abs_difference.threshold veya feature.drift_comparator.normalized_abs_difference.threshold. Sayım farkları, her iki koşuldaki toplam sayım tarafından normalleştirilir.
- Değerlerin normalize edilmiş mutlak sayım farkı, kontrol istatistiklerindeki (yani, sapma için hizmet istatistikleri veya sapma için önceki istatistikler) ve tedavi istatistiklerindeki (yani, sapma için eğitim istatistikleri veya sapma için geçerli istatistikler)
- Şema Alanları:
COMPARATOR_JENSEN_SHANNON_DIVERGENCE_HIGH- Şema Alanları:
-
feature.skew_comparator.jensen_shannon_divergence.threshold -
feature.drift_comparator.jensen_shannon_divergence.threshold
-
- İstatistik Alanları:
-
STANDARDtipifeatures.num_stats.histograms -
features.string_stats.rank_histogram*
-
- Algılama Koşulu:
- Kontrol istatistikleri (yani, sapma için hizmet istatistikleri veya sapma için önceki istatistikler) ile işleme istatistikleri (yani, sapma için eğitim istatistikleri veya sapma için mevcut istatistikler) arasında hesaplanan yaklaşık Jensen-Shannon sapması >
feature.skew_comparator.jensen_shannon_divergence.thresholdveyafeature.drift_comparator.jensen_shannon_divergence.threshold. Yaklaşık Jensen-Shannon sapması, hemfeatures.num_stats.histogramsstandart histogram hem defeatures.string_stats.rank_histogram* içindeki normalleştirilmiş numune sayılarına dayalı olarak hesaplanır.
- Kontrol istatistikleri (yani, sapma için hizmet istatistikleri veya sapma için önceki istatistikler) ile işleme istatistikleri (yani, sapma için eğitim istatistikleri veya sapma için mevcut istatistikler) arasında hesaplanan yaklaşık Jensen-Shannon sapması >
- Şema Alanları:
NO_DATA_IN_SPAN- TFDV'de anormallik türü algılanmadı
SPARSE_FEATURE_MISSING_VALUE- Şema Alanları:
-
sparse_feature.value_feature
-
- İstatistik Alanları:
-
features.custom_stats
-
- Algılama Koşulu:
-
features.custom_stats, ad olarak "eksik_değer" ve -
missing_valueözel statüsü != 0
-
- Şema Alanları:
SPARSE_FEATURE_MISSING_INDEX- Şema Alanları:
-
sparse_feature.index_feature
-
- İstatistik Alanları:
-
features.custom_stats
-
- Algılama Koşulu:
- ad olarak "missing_index" ile
features.custom_statsve -
missing_indexözel stat herhangi bir değer içeriyor != 0
- ad olarak "missing_index" ile
- Şema Alanları:
SPARSE_FEATURE_LENGTH_MISMATCH- Şema Alanları:
-
sparse_feature.value_feature -
sparse_feature.index_feature
-
- İstatistik Alanları:
-
features.custom_stats
-
- Algılama Koşulu:
- Adı "min_length_diff" veya "max_length_diff" olan
features.custom_stats -
min_length_diffveyamax_length_diffözel stat herhangi bir değer içeriyor != 0
- Adı "min_length_diff" veya "max_length_diff" olan
- Şema Alanları:
SPARSE_FEATURE_NAME_COLLISION- Şema Alanları:
-
sparse_feature.name -
sparse_feature.lifecycle_stage -
feature.name -
feature.lifecycle_stage
-
- Algılama Koşulu:
-
sparse_feature.lifecycle_stage!=PLANNED,ALPHA,DEBUGveyaDEPRECATED, ve -
feature.lifecycle_stage!=PLANNED,ALPHA,DEBUGveyaDEPRECATED, ve -
sparse_feature.name==feature.name
-
- Şema Alanları:
SEMANTIC_DOMAIN_UPDATE- Şema Alanları:
-
feature.domain_info
-
- İstatistik Alanları:
-
features.custom_stats
-
- Algılama Koşulu:
- ad olarak "domain_info" ile
features.custom_statsve -
feature.domain_infoşemada önceden ayarlanmamış ve - özellik için tek bir
domain_infoözel statüsü var
- ad olarak "domain_info" ile
- Şema Alanları:
COMPARATOR_LOW_NUM_EXAMPLES- Şema Alanları:
-
schema.dataset_constraints.num_examples_drift_comparator.min_fraction_threshold -
schema.dataset_constraints.num_examples_version_comparator.min_fraction_threshold
-
- İstatistik Alanları:
-
num_examples*
-
- Algılama Koşulu:
-
num_examples* > 0 ve - önceki istatistik protokolü mevcuttur ve
-
num_examples* / önceki istatistiklernum_examples* < karşılaştırıcımin_fraction_threshold
-
- Şema Alanları:
COMPARATOR_HIGH_NUM_EXAMPLES- Şema Alanları:
-
schema.dataset_constraints.num_examples_drift_comparator.max_fraction_threshold -
schema.dataset_constraints.num_examples_version_comparator.max_fraction_threshold
-
- İstatistik Alanları:
-
num_examples*
-
- Algılama Koşulu:
-
num_examples* > 0 ve - önceki istatistik protokolü mevcuttur ve
-
num_examples* / önceki istatistiklernum_examples* > karşılaştırıcımax_fraction_threshold
-
- Şema Alanları:
DATASET_LOW_NUM_EXAMPLES- Şema Alanları:
-
schema.dataset_constraints.min_examples_count
-
- İstatistik Alanları:
-
num_examples*
-
- Algılama Koşulu:
-
num_examples* <dataset_constraints.min_examples_count
-
- Şema Alanları:
DATASET_HIGH_NUM_EXAMPLES- Şema Alanları:
-
schema.dataset_constraints.max_examples_count
-
- İstatistik Alanları:
-
num_examples*
-
- Algılama Koşulu:
-
num_examples* >dataset_constraints.max_examples_count
-
- Şema Alanları:
WEIGHTED_FEATURE_NAME_COLLISION- Şema Alanları:
-
weighted_feature.name -
weighted_feature.lifecycle_stage -
sparse_feature.name -
sparse_feature.lifecycle_stage -
feature.name -
feature.lifecycle_stage
-
- Algılama Koşulu:
-
weighted_feature.lifecycle_stage!=PLANNED,ALPHA,DEBUGveyaDEPRECATEDve-
feature.lifecycle_stage!=PLANNED,ALPHA,DEBUGveyaDEPRECATEDise,-
weighted_feature.name==feature.name; veya
-
-
sparse_feature.lifecycle_stage!=PLANNED,ALPHA,DEBUGveyaDEPRECATEDise,-
weighted_feature.name==sparse_feature.name
-
-
-
- Şema Alanları:
WEIGHTED_FEATURE_MISSING_VALUE- Şema Alanları:
-
weighted_feature.feature
-
- İstatistik Alanları:
-
features.custom_stats
-
- Algılama Koşulu:
-
features.custom_stats, ad olarak "eksik_değer" ve -
missing_valueözel statüsü != 0
-
- Şema Alanları:
WEIGHTED_FEATURE_MISSING_WEIGHT- Şema Alanları:
-
weighted_feature.weight_feature
-
- İstatistik Alanları:
-
features.custom_stats
-
- Algılama Koşulu:
-
features.custom_stats, ad olarak "eksik_ağırlık" ve -
missing_weightözel statüsü != 0
-
- Şema Alanları:
WEIGHTED_FEATURE_LENGTH_MISMATCH- Şema Alanları:
-
weighted_feature.feature -
weighted_feature.weight_feature
-
- İstatistik Alanları:
-
features.custom_stats
-
- Algılama Koşulu:
- adı "min_weighted_length_diff" veya "max_weight_length_diff" olan
features.custom_statsve -
min_weight_length_diffveyamax_weight_length_diffözel istatistik != 0
- adı "min_weighted_length_diff" veya "max_weight_length_diff" olan
- Şema Alanları:
VALUE_NESTEDNESS_MISMATCH- Şema Alanları:
-
feature.value_count -
feature.value_counts
-
- İstatistik Alanları:
-
features.common_stats.presence_and_valency_stats
-
- Algılama Koşulu:
-
feature.value_countbelirtilir ve özelliğin yinelenen birpresence_and_valency_statsvardır (birden büyük bir iç içe olma düzeyini gösterir) ve -
feature.value_countsbelirtildi ve özelliğinpresence_and_valency_statstekrarlanma sayısı,feature.value_countsiçinde tekrarlananvalue_countsayısıyla eşleşmiyor
-
- Şema Alanları:
DOMAIN_INVALID_FOR_TYPE- Şema Alanları:
-
feature.type -
feature.domain_info
-
- İstatistik Alanları:
-
features.type
-
- Algılama Koşulu:
-
features.type==BYTESise,-
feature.domain_infouyumsuz bir türde; veya
-
- eğer
features.type!=BYTES,-
feature.domain_infofeature.typeile eşleşmiyor (örneğin,int_domainbelirtildi, ancak özelliğintypeFLOAT)
-
-
- Şema Alanları:
FEATURE_MISSING_NAME- Şema Alanları:
-
feature.name
-
- Algılama Koşulu:
-
feature.namebelirtilmedi
-
- Şema Alanları:
FEATURE_MISSING_TYPE- Şema Alanları:
-
feature.type
-
- Algılama Koşulu:
-
feature.typebelirtilmedi
-
- Şema Alanları:
INVALID_SCHEMA_SPECIFICATION- Şema Alanları:
-
feature.domain_info -
feature.presence.min_fraction -
feature.value_count.min -
feature.value_count.max -
feature.distribution_constraints
-
- Algılama Koşulu:
-
feature.presence.min_fraction< 0,0 veya > 1,0 veya -
feature.value_count.min< 0 veya >feature.value_count.max, veya - bir özellik için bir bool, int, float, struct veya anlamsal etki alanı belirtilmiş ve bu özellik için
feature.distribution_constraintsde belirtilmiş veya - Bir özellik için
feature.distribution_constraintsbelirtildi, ancak bu özellik için şema düzeyinde bir etki alanı veyafeature.string_domainbelirtilmedi
-
- Şema Alanları:
INVALID_DOMAIN_SPECIFICATION- Şema Alanları:
-
feature.domain_info -
feature.bool_domain -
feature.string_domain
-
- Algılama Koşulu:
- Bilinmeyen
feature.domain_infotürü belirtilmiş veya -
feature.domainbelirtildi, ancak şema düzeyinde belirtilen eşleşen etki alanı yok veya -
feature.bool_domain,feature.bool_domain.true_valuevefeature.bool_domain.false_valuebelirtilirse,-
feature.bool_domain.true_value==feature.bool_domain.false_valueveya
-
-
feature.string_domainbelirtilmişse,- yinelenen
feature.string_domain.valuesveya -
feature.string_domainmaksimum boyutu aşıyor
- yinelenen
- Bilinmeyen
- Şema Alanları:
UNEXPECTED_DATA_TYPE- Şema Alanları:
-
feature.type
-
- İstatistik Alanları:
-
features.type
-
- Algılama Koşulu:
-
features.typefeature.typeiçinde belirtilen türden değil
-
- Şema Alanları:
SEQUENCE_VALUE_TOO_FEW_OCCURRENCES- Şema Alanları:
-
feature.natural_language_domain.token_constraints.min_per_sequence
-
- İstatistik Alanları:
-
features.custom_stats.nl_statistics.token_statistics.per_sequence_min_frequency
-
- Algılama Koşulu:
-
min_per_sequence>per_sequence_min_frequency
-
- Şema Alanları:
SEQUENCE_VALUE_TOO_MANY_OCCURRENCES- Şema Alanları:
-
feature.natural_language_domain.token_constraints.max_per_sequence
-
- İstatistik Alanları:
-
features.custom_stats.nl_statistics.token_statistics.per_sequence_max_frequency
-
- Algılama Koşulu:
-
max_per_sequence<per_sequence_max_frequency
-
- Şema Alanları:
SEQUENCE_VALUE_TOO_SMALL_FRACTION- Şema Alanları:
-
feature.natural_language_domain.token_constraints.min_fraction_of_sequences
-
- İstatistik Alanları:
-
features.custom_stats.nl_statistics.token_statistics.fraction_of_sequences
-
- Algılama Koşulu:
-
min_fraction_of_sequences>fraction_of_sequences
-
- Şema Alanları:
SEQUENCE_VALUE_TOO_LARGE_FRACTION- Şema Alanları:
-
feature.natural_language_domain.token_constraints.max_fraction_of_sequences
-
- İstatistik Alanları:
-
features.custom_stats.nl_statistics.token_statistics.fraction_of_sequences
-
- Algılama Koşulu:
-
max_fraction_of_sequences<fraction_of_sequences
-
- Şema Alanları:
FEATURE_COVERAGE_TOO_LOW- Şema Alanları:
-
feature.natural_language_domain.coverage.min_coverage
-
- İstatistik Alanları:
-
features.custom_stats.nl_statistics.feature_coverage
-
- Algılama Koşulu:
-
feature_coverage<coverage.min_coverage
-
- Şema Alanları:
FEATURE_COVERAGE_TOO_SHORT_AVG_TOKEN_LENGTH- Şema Alanları:
-
feature.natural_language_domain.coverage.min_avg_token_length
-
- İstatistik Alanları:
-
features.custom_stats.nl_statistics.avg_token_length
-
- Algılama Koşulu:
-
avg_token_length<min_avg_token_length
-
- Şema Alanları:
NLP_WRONG_LOCATION- TFDV'de anormallik türü algılanmadı
EMBEDDING_SHAPE_INVALID- TFDV'de anormallik türü algılanmadı
MAX_IMAGE_BYTE_SIZE_EXCEEDED- Şema Alanları:
-
feature.image_domain.max_image_byte_size
-
- İstatistik Alanları:
-
features.bytes_stats.max_num_bytes_int
-
- Algılama Koşulu:
-
max_num_bytes_int>max_image_byte_size
-
- Şema Alanları:
INVALID_FEATURE_SHAPE- Şema Alanları:
-
feature.shape
-
- İstatistik Alanları:
-
features.common_stats.num_missing -
features.common_stats.min_num_values -
features.common_stats.max_num_values -
features.common_stats.presence_and_valency_stats.num_missing -
features.common_stats.presence_and_valency_stats.min_num_values -
features.common_stats.presence_and_valency_stats.max_num_values -
features.common_stats.weighted_presence_and_valency_stats
-
- Algılama Koşulu:
-
feature.shapebelirtilir ve- bazı yuva düzeylerinde özellik eksik olabilir (
num_missing!= 0) veya - özellik, bazı yuva düzeylerinde değişken sayıda değere (
min_num_values!=max_num_values) sahip olabilir veya - belirtilen şekil, özelliğin değer sayımı istatistikleriyle uyumlu değil. Örneğin,
[16]şekli (min_num_values==max_num_values==[2, 2, 4](3-iç içe özellik için)) ile uyumludur.
- bazı yuva düzeylerinde özellik eksik olabilir (
-
- Şema Alanları:
STATS_NOT_AVAILBLE- Kısıtlamaları doğrulamak için gereken istatistikler mevcut olmadığında anormallik oluşur.
DERIVED_FEATURE_BAD_LIFECYCLE- Şema Alanları:
-
feature.lifecycle_stage
-
- İstatistik Alanları:
-
features.validation_derived_source
-
- Algılama Koşulu:
-
feature.lifecycle_stage,DERIVEDveyaDISABLEDöğelerinden biri değildir vefeatures.validation_derived_sourcemevcut olup, bunun türetilmiş bir özellik olduğunu gösterir.
-
- Şema Alanları:
DERIVED_FEATURE_INVALID_SOURCE- Şema Alanları:
-
feature.validation_derived_source
-
- İstatistik Alanları:
-
features.validation_derived_source
-
- Algılama Koşulu:
- bir özellik için
features.validation_derived_sourcemevcut, ancak ilgilifeature.validation_derived_sourcemevcut değil.
- bir özellik için
- Şema Alanları:
* Bu alan için ağırlıklı bir istatistik varsa, ağırlıksız istatistik yerine kullanılacaktır.