TensorFlow डेटा सत्यापन विसंगतियाँ संदर्भ

टीएफडीवी एक स्कीमा और सांख्यिकी प्रोटो(ओं) की तुलना करके विसंगतियों की जांच करता है। निम्नलिखित चार्ट उन विसंगति प्रकारों को सूचीबद्ध करता है जिनका टीएफडीवी पता लगा सकता है, स्कीमा और सांख्यिकी फ़ील्ड जिनका उपयोग प्रत्येक विसंगति प्रकार का पता लगाने के लिए किया जाता है, और वे स्थितियाँ जिनके तहत प्रत्येक विसंगति प्रकार का पता लगाया जाता है।

  • BOOL_TYPE_BIG_INT

    • स्कीमा फ़ील्ड:
      • feature.bool_domain
    • सांख्यिकी क्षेत्र:
      • features.num_stats.max
      • features.type
    • पता लगाने की स्थिति:
      • feature.bool_domain निर्दिष्ट है और
      • features.type == INT और
      • features.num_stats.max > 1
  • BOOL_TYPE_BYTES_NOT_INT

    • टीएफडीवी में विसंगति प्रकार का पता नहीं चला
  • BOOL_TYPE_BYTES_NOT_STRING

    • टीएफडीवी में विसंगति प्रकार का पता नहीं चला
  • BOOL_TYPE_FLOAT_NOT_INT

    • टीएफडीवी में विसंगति प्रकार का पता नहीं चला
  • BOOL_TYPE_FLOAT_NOT_STRING

    • टीएफडीवी में विसंगति प्रकार का पता नहीं चला
  • BOOL_TYPE_INT_NOT_STRING

    • टीएफडीवी में विसंगति प्रकार का पता नहीं चला
  • BOOL_TYPE_SMALL_INT

    • स्कीमा फ़ील्ड:
      • feature.bool_domain
    • सांख्यिकी क्षेत्र:
      • features.num_stats.min
      • features.type
    • पता लगाने की स्थिति:
      • features.type == INT और
      • feature.bool_domain निर्दिष्ट है और
      • features.num_stats.min < 0
  • BOOL_TYPE_STRING_NOT_INT

    • टीएफडीवी में विसंगति प्रकार का पता नहीं चला
  • BOOL_TYPE_UNEXPECTED_STRING

    • स्कीमा फ़ील्ड:
      • feature.bool_domain
    • सांख्यिकी क्षेत्र:
      • features.string_stats.rank_histogram *
    • पता लगाने की स्थिति:
      • features.type == STRING और
      • feature.bool_domain निर्दिष्ट है और
      • rank_histogram * में कम से कम एक मान feature.bool_domain.true_value या feature.bool_domain.false_value नहीं है
  • BOOL_TYPE_UNEXPECTED_FLOAT

    • स्कीमा फ़ील्ड:
      • feature.bool_domain
    • सांख्यिकी क्षेत्र:
      • features.num_stats.min
      • features.num_stats.max
      • features.num_stats.histograms.num_nan
      • features.num_stats.histograms.buckets.low_value
      • features.num_stats.histograms.buckets.high_value
      • features.type
    • पता लगाने की स्थिति:
      • features.type == FLOAT और
      • feature.bool_domain निर्दिष्ट है और या तो
        • ( features.num_stats.min != 0 या features.num_stats.min != 1) या
        • ( features.num_stats.max != 0 या features.num_stats.max != 1) या
        • features.num_stats.histograms.num_nan > 0 या
        • ( features.num_stats.histograms.buckets.low_value != 0 या features.num_stats.histograms.buckets.high_value != 1) और features.num_stats.histograms.buckets.sample_count > 0
  • BOOL_TYPE_INVALID_CONFIG

    • स्कीमा फ़ील्ड:
      • feature.bool_domain
    • सांख्यिकी क्षेत्र:
      • features.type
    • पता लगाने की स्थिति:
      • यदि features.type == INT या FLOAT ,
        • feature.bool_domain निर्दिष्ट है और
        • feature.bool_domain.true_value या feature.bool_domain.false_value निर्दिष्ट है, या
      • यदि features.type == STRING ,
        • feature.bool_domain निर्दिष्ट है और
        • feature.bool_domain.true_value और feature.bool_domain.false_value निर्दिष्ट नहीं हैं
  • ENUM_TYPE_BYTES_NOT_STRING

    • टीएफडीवी में विसंगति प्रकार का पता नहीं चला
  • ENUM_TYPE_FLOAT_NOT_STRING

    • टीएफडीवी में विसंगति प्रकार का पता नहीं चला
  • ENUM_TYPE_INT_NOT_STRING

    • टीएफडीवी में विसंगति प्रकार का पता नहीं चला
  • ENUM_TYPE_INVALID_UTF8

    • सांख्यिकी क्षेत्र:
      • features.string_stats.invalid_utf8_count
    • पता लगाने की स्थिति:
      • invalid_utf8_count > 0
  • ENUM_TYPE_UNEXPECTED_STRING_VALUES

    • स्कीमा फ़ील्ड:
      • string_domain और feature.domain ; या feature.string_domain
      • feature.distribution_constraints.min_domain_mass
    • सांख्यिकी क्षेत्र:
      • features.string_stats.rank_histogram *
    • पता लगाने की स्थिति:
      • या तो ( rank_histogram में मानों की संख्या * जो डोमेन में नहीं हैं / मानों की कुल संख्या) > (1 - feature.distribution_constraints.min_domain_mass ) या
      • feature.distribution_constraints.min_domain_mass constraints.min_domain_mass == 1.0 और हिस्टोग्राम में ऐसे मान हैं जो डोमेन में नहीं हैं
  • FEATURE_TYPE_HIGH_NUMBER_VALUES

    • स्कीमा फ़ील्ड:
      • feature.value_count.max
      • feature.value_counts.value_count.max
    • सांख्यिकी क्षेत्र:
      • features.common_stats.max_num_values
      • features.common_stats.presence_and_valency_stats.max_num_values
    • पता लगाने की स्थिति:
      • यदि feature.value_count.max निर्दिष्ट है
        • features.common_stats.max_num_values > feature.value_count.max ; या
      • यदि feature.value_counts निर्दिष्ट है
        • feature.value_counts.value_count.max < features.common_stats.presence_and_valency_stats.max_num_values किसी दिए गए नेस्टेडनेस लेवल पर
  • FEATURE_TYPE_LOW_FRACTION_PRESENT

    • स्कीमा फ़ील्ड:
      • feature.presence.min_fraction
    • सांख्यिकी क्षेत्र:
      • features.common_stats.num_non_missing *
      • num_examples *
    • पता लगाने की स्थिति:
      • feature.presence.min_fraction निर्दिष्ट है और ( features.common_stats.num_non_missing * / num_examples *) < feature.presence.min_fraction या
      • feature.presence.min_fraction == 1.0 और common_stats.num_missing != 0
  • FEATURE_TYPE_LOW_NUMBER_PRESENT

    • स्कीमा फ़ील्ड:
      • feature.presence.min_count
    • सांख्यिकी क्षेत्र:
      • features.common_stats.num_non_missing *
    • पता लगाने की स्थिति:
      • feature.presence.min_count निर्दिष्ट है और या तो
        • features.common_stats.num_non_missing * == 0 या
        • features.common_stats.num_non_missing * < feature.presence.min_count
  • FEATURE_TYPE_LOW_NUMBER_VALUES

    • स्कीमा फ़ील्ड:
      • feature.value_count.min
      • feature.value_counts.value_count.min
    • सांख्यिकी क्षेत्र:
      • features.common_stats.min_num_values
      • features.common_stats.presence_and_valency_stats.min_num_values
    • पता लगाने की स्थिति:
      • यदि feature.value_count.min निर्दिष्ट है
        • features.common_stats.min_num_values < feature.value_count.min ; या
      • यदि feature.value_counts निर्दिष्ट है
        • features.common_stats.presence_and_valency_stats.min_num_values ​​< feature.value_counts.value_count.min किसी दिए गए नेस्टेडनेस स्तर पर
  • FEATURE_TYPE_NOT_PRESENT

    • स्कीमा फ़ील्ड:
      • feature.in_environment या feature.not_in_environment या schema.default_environment
      • feature.lifecycle_stage
      • feature.presence.min_count या feature.presence.min_fraction
    • सांख्यिकी क्षेत्र:
      • features.common_stats.num_non_missing *
    • पता लगाने की स्थिति:
      • feature.lifecycle_stage [ PLANNED , ALPHA , DEBUG , DEPRECATED ] में नहीं है और
      • common_stats.num_non_missing * == 0 और
      • ( feature.presence.min_count > 0 या feature.presence.min_fraction > 0) और या तो
        • feature.in_environment == वर्तमान परिवेश या
        • feature.not_in_environment !=वर्तमान परिवेश या
        • schema.default_environment != वर्तमान परिवेश
  • FEATURE_TYPE_NO_VALUES

    • टीएफडीवी में विसंगति प्रकार का पता नहीं चला
  • FEATURE_TYPE_UNEXPECTED_REPEATED

    • टीएफडीवी में विसंगति प्रकार का पता नहीं चला
  • FEATURE_TYPE_HIGH_UNIQUE

    • स्कीमा फ़ील्ड:
      • feature.unique_constraints.max
    • सांख्यिकी क्षेत्र:
      • features.string_stats.unique
    • पता लगाने की स्थिति:
      • features.string_stats.unique > feature.unique_constraints.max
  • FEATURE_TYPE_LOW_UNIQUE

    • स्कीमा फ़ील्ड:
      • feature.unique_constraints.min
    • सांख्यिकी क्षेत्र:
      • features.string_stats.unique
    • पता लगाने की स्थिति:
      • features.string_stats.unique < feature.unique_constraints.min
  • FEATURE_TYPE_NO_UNIQUE

    • स्कीमा फ़ील्ड:
      • feature.unique_constraints
    • सांख्यिकी क्षेत्र:
      • features.string_stats.unique
    • पता लगाने की स्थिति:
      • feature.unique_constraints निर्दिष्ट लेकिन कोई features.string_stats.unique मौजूद नहीं है (जैसा कि मामला है जहां फीचर एक स्ट्रिंग या श्रेणीबद्ध नहीं है)
  • FLOAT_TYPE_BIG_FLOAT

    • स्कीमा फ़ील्ड:
      • feature.float_domain.max
    • सांख्यिकी क्षेत्र:
      • features.type
      • features.num_stats.max या features.string_stats.rank_histogram
    • पता लगाने की स्थिति:
      • यदि features.type == FLOAT ,
        • features.num_stats.max > feature.float_domain.max ; या
      • यदि features.type == BYTES या STRING ,
        • features.string_stats.rank_histogram में अधिकतम मान (फ्लोट में परिवर्तित होने पर) > feature.float_domain.max
  • FLOAT_TYPE_NOT_FLOAT

    • टीएफडीवी में विसंगति प्रकार का पता नहीं चला
  • FLOAT_TYPE_SMALL_FLOAT

    • स्कीमा फ़ील्ड:
      • feature.float_domain.min
    • सांख्यिकी क्षेत्र:
      • features.type
      • features.num_stats.min या features.string_stats.rank_histogram
    • पता लगाने की स्थिति:
      • यदि features.type == FLOAT ,
        • features.num_stats.min < feature.float_domain.min ; या
      • यदि features.type == BYTES या STRING ,
        • features.string_stats.rank_histogram में न्यूनतम मान (फ्लोट में परिवर्तित होने पर) < feature.float_domain.min
  • FLOAT_TYPE_STRING_NOT_FLOAT

    • स्कीमा फ़ील्ड:
      • feature.float_domain
    • सांख्यिकी क्षेत्र:
      • features.type
      • features.string_stats.rank_histogram
    • पता लगाने की स्थिति:
      • features.type == BYTES या STRING और
      • features.string_stats.rank_histogram में कम से कम एक मान है जिसे फ्लोट में परिवर्तित नहीं किया जा सकता है
  • FLOAT_TYPE_NON_STRING

    • टीएफडीवी में विसंगति प्रकार का पता नहीं चला
  • FLOAT_TYPE_UNKNOWN_TYPE_NUMBER

    • टीएफडीवी में विसंगति प्रकार का पता नहीं चला
  • FLOAT_TYPE_HAS_NAN

    • स्कीमा फ़ील्ड:
      • feature.float_domain.disallow_nan
    • सांख्यिकी क्षेत्र:
      • features.type
      • features.num_stats.histograms.num_nan
    • पता लगाने की स्थिति:
      • float_domain.disallow_nan सत्य है और
      • features.num_stats.histograms.num_nan > 0
  • FLOAT_TYPE_HAS_INF

    • स्कीमा फ़ील्ड:
      • feature.float_domain.disallow_inf
    • सांख्यिकी क्षेत्र:
      • features.type
      • features.num_stats.min
      • features.num_stats.max
    • पता लगाने की स्थिति:
      • features.type == FLOAT
      • float_domain.disallow_inf सत्य है या तो
        • features.num_stats.min == inf/-inf या
        • features.num_stats.max == inf/-inf
  • INT_TYPE_BIG_INT

    • स्कीमा फ़ील्ड:
      • feature.int_domain.max
    • सांख्यिकी क्षेत्र:
      • features.type
      • features.num_stats.max
      • features.string_stats.rank_histogram
    • पता लगाने की स्थिति:
      • यदि features.type == INT ,
        • features.num_stats.max > feature.int_domain.max ; या
      • यदि features.type == BYTES या STRING ,
        • features.string_stats.rank_histogram में अधिकतम मान (इंट में परिवर्तित होने पर) > feature.int_domain.max
  • INT_TYPE_INT_EXPECTED

    • टीएफडीवी में विसंगति प्रकार का पता नहीं चला
  • INT_TYPE_NOT_INT_STRING

    • स्कीमा फ़ील्ड:
      • feature.int_domain
    • सांख्यिकी क्षेत्र:
      • features.type
      • features.string_stats.rank_histogram
    • पता लगाने की स्थिति:
      • features.type == BYTES या STRING और
      • features.string_stats.rank_histogram में कम से कम एक मान है जिसे इंट में परिवर्तित नहीं किया जा सकता है
  • INT_TYPE_NOT_STRING

    • टीएफडीवी में विसंगति प्रकार का पता नहीं चला
  • INT_TYPE_SMALL_INT

    • स्कीमा फ़ील्ड:
      • feature.int_domain.min
    • सांख्यिकी क्षेत्र:
      • features.type
      • features.num_stats.min
      • features.string_stats.rank_histogram
    • पता लगाने की स्थिति:
      • यदि features.type == INT ,
        • features.num_stats.min < feature.int_domain.min ; या
      • यदि features.type == BYTES या STRING ,
        • features.string_stats.rank_histogram में न्यूनतम मान (इंट में परिवर्तित होने पर) < feature.int_domain.min
  • INT_TYPE_STRING_EXPECTED

    • टीएफडीवी में विसंगति प्रकार का पता नहीं चला
  • INT_TYPE_UNKNOWN_TYPE_NUMBER

    • टीएफडीवी में विसंगति प्रकार का पता नहीं चला
  • LOW_SUPPORTED_IMAGE_FRACTION

    • स्कीमा फ़ील्ड:
      • feature.image_domain.minimum_supported_image_fraction
    • सांख्यिकी क्षेत्र:
      • image_format_histogram नाम वाले कस्टम_स्टैट्स के लिए features.custom_stats.rank_histogram । ध्यान दें कि image_format_histogram उत्पन्न करने और इस सत्यापन को निष्पादित करने के लिए सिमेंटिक डोमेन आँकड़े सक्षम होने चाहिए। सिमेंटिक डोमेन आँकड़े डिफ़ॉल्ट रूप से उत्पन्न नहीं होते हैं।
    • पता लगाने की स्थिति:
      • सभी छवि प्रकारों के लिए समर्थित Tensorflow छवि प्रकारों के मानों का अंश feature.image_domain.minimum_supported_image_fraction से कम है।
  • SCHEMA_MISSING_COLUMN

    • स्कीमा फ़ील्ड:
      • feature.in_environment या feature.not_in_environment या schema.default_environment
      • feature.lifecycle_stage
      • feature.presence.min_count या feature.presence.min_fraction
    • पता लगाने की स्थिति:
      • feature.lifecycle_stage != PLANNED , ALPHA , DEBUG , या DEPRECATED और
      • feature.presence.min_count > 0 या feature.presence.min_fraction > 0 और
      • feature.in_environment == वर्तमान परिवेश या feature.not_in_environment != वर्तमान परिवेश या schema.default_environment != वर्तमान परिवेश और
      • निर्दिष्ट नाम/पथ वाली कोई सुविधा सांख्यिकी प्रोटो में नहीं पाई जाती है
  • SCHEMA_NEW_COLUMN

    • पता लगाने की स्थिति:
      • सांख्यिकी प्रोटो में एक सुविधा है लेकिन स्कीमा प्रोटो में इसके नाम/पथ के साथ कोई सुविधा नहीं है
  • SCHEMA_TRAINING_SERVING_SKEW

    • टीएफडीवी में विसंगति प्रकार का पता नहीं चला
  • STRING_TYPE_NOW_FLOAT

    • टीएफडीवी में विसंगति प्रकार का पता नहीं चला
  • STRING_TYPE_NOW_INT

    • टीएफडीवी में विसंगति प्रकार का पता नहीं चला
  • COMPARATOR_CONTROL_DATA_MISSING

    • स्कीमा फ़ील्ड:
      • feature.skew_comparator.infinity_norm.threshold
      • feature.drift_comparator.infinity_norm.threshold
    • पता लगाने की स्थिति:
      • नियंत्रण आँकड़े प्रोटो (यानी, तिरछा के लिए आँकड़े या बहाव के लिए पिछले आँकड़े प्रस्तुत करना) उपलब्ध है लेकिन इसमें निर्दिष्ट सुविधा शामिल नहीं है
  • COMPARATOR_TREATMENT_DATA_MISSING

    • टीएफडीवी में विसंगति प्रकार का पता नहीं चला
  • COMPARATOR_L_INFTY_HIGH

    • स्कीमा फ़ील्ड:
      • feature.skew_comparator.infinity_norm.threshold
      • feature.drift_comparator.infinity_norm.threshold
    • सांख्यिकी क्षेत्र:
      • features.string_stats.rank_histogram *
    • पता लगाने की स्थिति:
      • वेक्टर का एल-अनंत मानदंड जो नियंत्रण आंकड़ों में features.string_stats.rank_histogram * से सामान्यीकृत गणनाओं के बीच अंतर का प्रतिनिधित्व करता है (यानी, तिरछा के लिए आंकड़ों की सेवा या बहाव के लिए पिछले आंकड़े) और उपचार आंकड़े (यानी, प्रशिक्षण आंकड़े) ड्रिफ्ट के लिए तिरछा या वर्तमान आँकड़े) > feature.skew_comparator.infinity_norm.threshold या feature.drift_comparator.infinity_norm.threshold
  • COMPARATOR_NORMALIZED_ABSOLUTE_DIFFERENCE_HIGH

    • स्कीमा फ़ील्ड:
      • feature.skew_comparator.normalized_abs_difference.threshold
      • feature.drift_comparator.normalized_abs_difference.threshold
    • सांख्यिकी क्षेत्र:
      • features.string_stats.rank_histogram
    • पता लगाने की स्थिति:
      • नियंत्रण आँकड़ों (यानी, तिरछापन के लिए सेवारत आँकड़े या बहाव के लिए पिछले आँकड़े) और उपचार आँकड़े (यानी, तिरछा के लिए प्रशिक्षण आँकड़े या बहाव के लिए वर्तमान आँकड़े) में features.string_stats.rank_histogram से मूल्य की सामान्यीकृत पूर्ण गणना का अंतर पार हो गया है फीचर.स्क्यू_कंपरेटर.नॉर्मलाइज्ड_एबीएस_डिफरेंस.थ्रेसहोल्ड या फीचर.ड्रिफ्ट_कंपेरेटर.नॉर्मलाइज्ड_एबीएस_डिफरेंस.थ्रेसहोल्ड। दोनों स्थितियों में कुल गणना द्वारा गणना अंतर को सामान्यीकृत किया जाता है।
  • COMPARATOR_JENSEN_SHANNON_DIVERGENCE_HIGH

    • स्कीमा फ़ील्ड:
      • feature.skew_comparator.jensen_shannon_divergence.threshold
      • feature.drift_comparator.jensen_shannon_divergence.threshold
    • सांख्यिकी क्षेत्र:
      • STANDARD प्रकार के फीचर्स. features.num_stats.histograms
      • features.string_stats.rank_histogram *
    • पता लगाने की स्थिति:
      • अनुमानित जेन्सेन-शैनन विचलन की गणना नियंत्रण आँकड़ों (यानी, तिरछा के लिए सेवा आँकड़े या बहाव के लिए पिछले आँकड़े) और उपचार आँकड़े (यानी, तिरछा के लिए प्रशिक्षण आँकड़े या बहाव के लिए वर्तमान आँकड़े) के बीच की जाती है > feature.skew_comparator.jensen_shannon_divergence.threshold या feature.drift_comparator.jensen_shannon_divergence.threshold । अनुमानित जेन्सेन-शैनन विचलन की गणना features.num_stats.histograms मानक हिस्टोग्राम और features.string_stats.rank_histogram * दोनों में सामान्यीकृत नमूना गणना के आधार पर की जाती है।
  • NO_DATA_IN_SPAN

    • टीएफडीवी में विसंगति प्रकार का पता नहीं चला
  • SPARSE_FEATURE_MISSING_VALUE

    • स्कीमा फ़ील्ड:
      • sparse_feature.value_feature
    • सांख्यिकी क्षेत्र:
      • features.custom_stats
    • पता लगाने की स्थिति:
      • features.custom_stats नाम के रूप में "missing_value" के साथ
      • missing_value कस्टम स्टेट != 0
  • SPARSE_FEATURE_MISSING_INDEX

    • स्कीमा फ़ील्ड:
      • sparse_feature.index_feature
    • सांख्यिकी क्षेत्र:
      • features.custom_stats
    • पता लगाने की स्थिति:
      • features.custom_stats नाम के रूप में "missing_index" के साथ
      • missing_index कस्टम स्टेट में कोई मान है != 0
  • SPARSE_FEATURE_LENGTH_MISMATCH

    • स्कीमा फ़ील्ड:
      • sparse_feature.value_feature
      • sparse_feature.index_feature
    • सांख्यिकी क्षेत्र:
      • features.custom_stats
    • पता लगाने की स्थिति:
      • features.custom_stats नाम के रूप में "min_length_diff" या "max_length_diff" के साथ
      • min_length_diff या max_length_diff कस्टम स्टेट में कोई भी मान है != 0
  • SPARSE_FEATURE_NAME_COLLISION

    • स्कीमा फ़ील्ड:
      • sparse_feature.name
      • sparse_feature.lifecycle_stage
      • feature.name
      • feature.lifecycle_stage
    • पता लगाने की स्थिति:
      • sparse_feature.lifecycle_stage != PLANNED , ALPHA , DEBUG , या DEPRECATED , और
      • feature.lifecycle_stage != PLANNED , ALPHA , DEBUG , या DEPRECATED , और
      • sparse_feature.name == feature.name
  • SEMANTIC_DOMAIN_UPDATE

    • स्कीमा फ़ील्ड:
      • feature.domain_info
    • सांख्यिकी क्षेत्र:
      • features.custom_stats
    • पता लगाने की स्थिति:
      • features.custom_stats नाम के रूप में "domain_info" के साथ
      • feature.domain_info स्कीमा में पहले से सेट नहीं है और
      • सुविधा के लिए एक एकल domain_info कस्टम स्टेट है
  • COMPARATOR_LOW_NUM_EXAMPLES

    • स्कीमा फ़ील्ड:
      • schema.dataset_constraints.num_examples_drift_comparator.min_fraction_threshold
      • schema.dataset_constraints.num_examples_version_comparator.min_fraction_threshold
    • सांख्यिकी क्षेत्र:
      • num_examples *
    • पता लगाने की स्थिति:
      • num_examples * > 0 और
      • पिछले आँकड़े प्रोटो उपलब्ध है और
      • num_examples * / पिछले आँकड़े num_examples * < तुलनित्र min_fraction_threshold
  • COMPARATOR_HIGH_NUM_EXAMPLES

    • स्कीमा फ़ील्ड:
      • schema.dataset_constraints.num_examples_drift_comparator.max_fraction_threshold
      • schema.dataset_constraints.num_examples_version_comparator.max_fraction_threshold
    • सांख्यिकी क्षेत्र:
      • num_examples *
    • पता लगाने की स्थिति:
      • num_examples * > 0 और
      • पिछले आँकड़े प्रोटो उपलब्ध है और
      • num_examples * / पिछले आँकड़े num_examples * > तुलनित्र max_fraction_threshold
  • DATASET_LOW_NUM_EXAMPLES

    • स्कीमा फ़ील्ड:
      • schema.dataset_constraints.min_examples_count
    • सांख्यिकी क्षेत्र:
      • num_examples *
    • पता लगाने की स्थिति:
      • num_examples * < dataset_constraints.min_examples_count
  • DATASET_HIGH_NUM_EXAMPLES

    • स्कीमा फ़ील्ड:
      • schema.dataset_constraints.max_examples_count
    • सांख्यिकी क्षेत्र:
      • num_examples *
    • पता लगाने की स्थिति:
      • num_examples * > dataset_constraints.max_examples_count
  • WEIGHTED_FEATURE_NAME_COLLISION

    • स्कीमा फ़ील्ड:
      • weighted_feature.name
      • weighted_feature.lifecycle_stage
      • sparse_feature.name
      • sparse_feature.lifecycle_stage
      • feature.name
      • feature.lifecycle_stage
    • पता लगाने की स्थिति:
      • weighted_feature.lifecycle_stage != PLANNED , ALPHA , DEBUG , या DEPRECATED और या तो
        • यदि feature.lifecycle_stage != PLANNED , ALPHA , DEBUG , या DEPRECATED ,
          • weighted_feature.name == feature.name ; या
        • यदि sparse_feature.lifecycle_stage != PLANNED , ALPHA , DEBUG , या DEPRECATED ,
          • weighted_feature.name == sparse_feature.name
  • WEIGHTED_FEATURE_MISSING_VALUE

    • स्कीमा फ़ील्ड:
      • weighted_feature.feature
    • सांख्यिकी क्षेत्र:
      • features.custom_stats
    • पता लगाने की स्थिति:
      • features.custom_stats नाम के रूप में "missing_value" के साथ
      • missing_value कस्टम स्टेट != 0
  • WEIGHTED_FEATURE_MISSING_WEIGHT

    • स्कीमा फ़ील्ड:
      • weighted_feature.weight_feature
    • सांख्यिकी क्षेत्र:
      • features.custom_stats
    • पता लगाने की स्थिति:
      • features.custom_stats नाम के रूप में "missing_weight" के साथ
      • missing_weight कस्टम आँकड़ा != 0
  • WEIGHTED_FEATURE_LENGTH_MISMATCH

    • स्कीमा फ़ील्ड:
      • weighted_feature.feature
      • weighted_feature.weight_feature
    • सांख्यिकी क्षेत्र:
      • features.custom_stats
    • पता लगाने की स्थिति:
      • features.custom_stats नाम के रूप में "min_weighted_length_diff" या "max_weight_length_diff" के साथ, और
      • min_weight_length_diff या max_weight_length_diff कस्टम स्टेट!= 0
  • VALUE_NESTEDNESS_MISMATCH

    • स्कीमा फ़ील्ड:
      • feature.value_count
      • feature.value_counts
    • सांख्यिकी क्षेत्र:
      • features.common_stats.presence_and_valency_stats
    • पता लगाने की स्थिति:
      • feature.value_count निर्दिष्ट है, और फीचर की बार-बार presence_and_valency_stats है (जो एक नेस्टेडनेस स्तर को इंगित करता है जो एक से अधिक है) और
      • feature.value_counts निर्दिष्ट है, और फीचर की presence_and_valency_stats जितनी बार दोहराया जाता है, feature.value_counts के भीतर value_count दोहराए जाने की संख्या से मेल नहीं खाता है।
  • DOMAIN_INVALID_FOR_TYPE

    • स्कीमा फ़ील्ड:
      • feature.type
      • feature.domain_info
    • सांख्यिकी क्षेत्र:
      • features.type
    • पता लगाने की स्थिति:
      • यदि features.type == BYTES ,
        • feature.domain_info असंगत प्रकार का है; या
      • यदि features.type != BYTES ,
        • feature.domain_info feature.type से मेल नहीं खाता (उदाहरण के लिए, int_domain निर्दिष्ट है, लेकिन फीचर का type FLOAT है)
  • FEATURE_MISSING_NAME

    • स्कीमा फ़ील्ड:
      • feature.name
    • पता लगाने की स्थिति:
      • feature.name निर्दिष्ट नहीं है
  • FEATURE_MISSING_TYPE

    • स्कीमा फ़ील्ड:
      • feature.type
    • पता लगाने की स्थिति:
      • feature.type निर्दिष्ट नहीं है
  • INVALID_SCHEMA_SPECIFICATION

    • स्कीमा फ़ील्ड:
      • feature.domain_info
      • feature.presence.min_fraction
      • feature.value_count.min
      • feature.value_count.max
      • feature.distribution_constraints
    • पता लगाने की स्थिति:
      • feature.presence.min_fraction < 0.0 या > 1.0, या
      • feature.value_count.min < 0 या > feature.value_count.max , या
      • एक फीचर के लिए एक बूल, इंट, फ्लोट, स्ट्रक्चर, या सिमेंटिक डोमेन निर्दिष्ट किया गया है और उस फीचर के लिए feature.distribution_constraints भी निर्दिष्ट किया गया है, या
      • feature.distribution_constraints एक फीचर के लिए निर्दिष्ट है, लेकिन उस सुविधा के लिए न तो स्कीमा-स्तरीय डोमेन और न ही feature.string_domain निर्दिष्ट है
  • INVALID_DOMAIN_SPECIFICATION

    • स्कीमा फ़ील्ड:
      • feature.domain_info
      • feature.bool_domain
      • feature.string_domain
    • पता लगाने की स्थिति:
      • अज्ञात feature.domain_info प्रकार निर्दिष्ट है या
      • feature.domain निर्दिष्ट है, लेकिन स्कीमा स्तर पर कोई मेल खाने वाला डोमेन निर्दिष्ट नहीं है, या
      • यदि feature.bool_domain , feature.bool_domain.true_value , और feature.bool_domain.false_value निर्दिष्ट हैं,
        • feature.bool_domain.true_value == feature.bool_domain.false_value , या
      • यदि feature.string_domain निर्दिष्ट है,
        • डुप्लिकेट feature.string_domain.values या है
        • feature.string_domain अधिकतम आकार से अधिक है
  • UNEXPECTED_DATA_TYPE

    • स्कीमा फ़ील्ड:
      • feature.type
    • सांख्यिकी क्षेत्र:
      • features.type
    • पता लगाने की स्थिति:
      • features.type feature.type में निर्दिष्ट प्रकार का नहीं है
  • SEQUENCE_VALUE_TOO_FEW_OCCURRENCES

    • स्कीमा फ़ील्ड:
      • feature.natural_language_domain.token_constraints.min_per_sequence
    • सांख्यिकी क्षेत्र:
      • features.custom_stats.nl_statistics.token_statistics.per_sequence_min_frequency
    • पता लगाने की स्थिति:
      • min_per_sequence > per_sequence_min_frequency
  • SEQUENCE_VALUE_TOO_MANY_OCCURRENCES

    • स्कीमा फ़ील्ड:
      • feature.natural_language_domain.token_constraints.max_per_sequence
    • सांख्यिकी क्षेत्र:
      • features.custom_stats.nl_statistics.token_statistics.per_sequence_max_frequency
    • पता लगाने की स्थिति:
      • max_per_sequence < per_sequence_max_frequency
  • SEQUENCE_VALUE_TOO_SMALL_FRACTION

    • स्कीमा फ़ील्ड:
      • feature.natural_language_domain.token_constraints.min_fraction_of_sequences
    • सांख्यिकी क्षेत्र:
      • features.custom_stats.nl_statistics.token_statistics.fraction_of_sequences
    • पता लगाने की स्थिति:
      • min_fraction_of_sequences > fraction_of_sequences
  • SEQUENCE_VALUE_TOO_LARGE_FRACTION

    • स्कीमा फ़ील्ड:
      • feature.natural_language_domain.token_constraints.max_fraction_of_sequences
    • सांख्यिकी क्षेत्र:
      • features.custom_stats.nl_statistics.token_statistics.fraction_of_sequences
    • पता लगाने की स्थिति:
      • max_fraction_of_sequences < fraction_of_sequences
  • FEATURE_COVERAGE_TOO_LOW

    • स्कीमा फ़ील्ड:
      • feature.natural_language_domain.coverage.min_coverage
    • सांख्यिकी क्षेत्र:
      • features.custom_stats.nl_statistics.feature_coverage
    • पता लगाने की स्थिति:
      • feature_coverage < coverage.min_coverage
  • FEATURE_COVERAGE_TOO_SHORT_AVG_TOKEN_LENGTH

    • स्कीमा फ़ील्ड:
      • feature.natural_language_domain.coverage.min_avg_token_length
    • सांख्यिकी क्षेत्र:
      • features.custom_stats.nl_statistics.avg_token_length
    • पता लगाने की स्थिति:
      • avg_token_length < min_avg_token_length
  • NLP_WRONG_LOCATION

    • टीएफडीवी में विसंगति प्रकार का पता नहीं चला
  • EMBEDDING_SHAPE_INVALID

    • टीएफडीवी में विसंगति प्रकार का पता नहीं चला
  • MAX_IMAGE_BYTE_SIZE_EXCEEDED

    • स्कीमा फ़ील्ड:
      • feature.image_domain.max_image_byte_size
    • सांख्यिकी क्षेत्र:
      • features.bytes_stats.max_num_bytes_int
    • पता लगाने की स्थिति:
      • max_num_bytes_int > max_image_byte_size
  • INVALID_FEATURE_SHAPE

    • स्कीमा फ़ील्ड:
      • feature.shape
    • सांख्यिकी क्षेत्र:
      • features.common_stats.num_missing
      • features.common_stats.min_num_values
      • features.common_stats.max_num_values
      • features.common_stats.presence_and_valency_stats.num_missing
      • features.common_stats.presence_and_valency_stats.min_num_values
      • features.common_stats.presence_and_valency_stats.max_num_values
      • features.common_stats.weighted_presence_and_valency_stats
    • पता लगाने की स्थिति:
      • feature.shape निर्दिष्ट है, और या तो
        • कुछ नेस्ट स्तर पर सुविधा गायब हो सकती है ( num_missing != 0)।
        • सुविधा में कुछ नेस्ट स्तर पर मानों की परिवर्तनशील संख्या ( min_num_values ​​!= max_num_values ​​) हो सकती है या
        • निर्दिष्ट आकार सुविधा के मूल्य गणना आँकड़ों के साथ संगत नहीं है। उदाहरण के लिए, आकार [16] ( min_num_values ​​== max_num_values ​​== [2, 2, 4] (3-नेस्टेड फीचर के लिए)) के साथ संगत है
  • STATS_NOT_AVAILBLE

    • विसंगति तब होती है जब बाधाओं को मान्य करने के लिए आवश्यक आँकड़े मौजूद नहीं होते हैं।
  • DERIVED_FEATURE_BAD_LIFECYCLE

    • स्कीमा फ़ील्ड:
      • feature.lifecycle_stage
    • सांख्यिकी क्षेत्र:
      • features.validation_derived_source
    • पता लगाने की स्थिति:
      • feature.lifecycle_stage DERIVED या DISABLED में से एक नहीं है, और features.validation_derived_source मौजूद है, जो दर्शाता है कि यह एक व्युत्पन्न सुविधा है।
  • DERIVED_FEATURE_INVALID_SOURCE

    • स्कीमा फ़ील्ड:
      • feature.validation_derived_source
    • सांख्यिकी क्षेत्र:
      • features.validation_derived_source
    • पता लगाने की स्थिति:
      • features.validation_derived_source एक फीचर के लिए मौजूद है, लेकिन संबंधित feature.validation_derived_source मौजूद नहीं है।

* यदि इस क्षेत्र के लिए एक भारित आँकड़ा उपलब्ध है, तो इसका उपयोग गैर-भारित आँकड़े के बजाय किया जाएगा।