TensorFlow ডেটা যাচাইকরণের অসঙ্গতির রেফারেন্স

TFDV একটি স্কিমা এবং পরিসংখ্যান প্রোটো(গুলি) তুলনা করে অসঙ্গতির জন্য পরীক্ষা করে। নিম্নলিখিত চার্টে TFDV শনাক্ত করতে পারে এমন অসঙ্গতির ধরনগুলি তালিকাভুক্ত করে, স্কিমা এবং পরিসংখ্যান ক্ষেত্রগুলি যেগুলি প্রতিটি অসঙ্গতির ধরন সনাক্ত করতে ব্যবহৃত হয় এবং যে শর্ত(গুলি) যার অধীনে প্রতিটি অসঙ্গতি টাইপ সনাক্ত করা হয়।

  • BOOL_TYPE_BIG_INT

    • স্কিমা ক্ষেত্র:
      • feature.bool_domain
    • পরিসংখ্যান ক্ষেত্র:
      • features.num_stats.max
      • features.type
    • সনাক্তকরণ শর্ত:
      • feature.bool_domain নির্দিষ্ট করা আছে এবং
      • features.type == INT এবং
      • features.num_stats.max > 1
  • BOOL_TYPE_BYTES_NOT_INT

    • TFDV-এ অসঙ্গতির ধরন শনাক্ত হয়নি
  • BOOL_TYPE_BYTES_NOT_STRING

    • TFDV-এ অসঙ্গতির ধরন শনাক্ত হয়নি
  • BOOL_TYPE_FLOAT_NOT_INT

    • TFDV-এ অসঙ্গতির ধরন শনাক্ত হয়নি
  • BOOL_TYPE_FLOAT_NOT_STRING

    • TFDV-এ অসঙ্গতির ধরন শনাক্ত হয়নি
  • BOOL_TYPE_INT_NOT_STRING

    • TFDV-এ অসঙ্গতির ধরন শনাক্ত হয়নি
  • BOOL_TYPE_SMALL_INT

    • স্কিমা ক্ষেত্র:
      • feature.bool_domain
    • পরিসংখ্যান ক্ষেত্র:
      • features.num_stats.min
      • features.type
    • সনাক্তকরণ শর্ত:
      • features.type == INT এবং
      • feature.bool_domain নির্দিষ্ট করা আছে এবং
      • features.num_stats.min < 0
  • BOOL_TYPE_STRING_NOT_INT

    • TFDV-এ অসঙ্গতির ধরন শনাক্ত হয়নি
  • BOOL_TYPE_UNEXPECTED_STRING

    • স্কিমা ক্ষেত্র:
      • feature.bool_domain
    • পরিসংখ্যান ক্ষেত্র:
      • features.string_stats.rank_histogram *
    • সনাক্তকরণ শর্ত:
      • features.type == STRING এবং
      • feature.bool_domain নির্দিষ্ট করা আছে এবং
      • rank_histogram * এ অন্তত একটি মান feature.bool_domain.true_value বা feature.bool_domain.false_value নয়
  • BOOL_TYPE_UNEXPECTED_FLOAT

    • স্কিমা ক্ষেত্র:
      • feature.bool_domain
    • পরিসংখ্যান ক্ষেত্র:
      • features.num_stats.min
      • features.num_stats.max
      • features.num_stats.histograms.num_nan
      • features.num_stats.histograms.buckets.low_value
      • features.num_stats.histograms.buckets.high_value
      • features.type
    • সনাক্তকরণ শর্ত:
      • features.type == FLOAT এবং
      • feature.bool_domain নির্দিষ্ট করা আছে এবং হয়
        • ( features.num_stats.min != 0 বা features.num_stats.min != 1) বা
        • ( features.num_stats.max != 0 বা features.num_stats.max != 1) বা
        • features.num_stats.histograms.num_nan > 0 বা
        • features.num_stats.histograms.buckets.high_value features.num_stats.histograms.buckets.low_value features.num_stats.histograms.buckets.sample_count
  • BOOL_TYPE_INVALID_CONFIG

    • স্কিমা ক্ষেত্র:
      • feature.bool_domain
    • পরিসংখ্যান ক্ষেত্র:
      • features.type
    • সনাক্তকরণ শর্ত:
      • যদি features.type == INT বা FLOAT ,
        • feature.bool_domain নির্দিষ্ট করা আছে এবং
        • feature.bool_domain.true_value বা feature.bool_domain.false_value নির্দিষ্ট করা আছে, অথবা
      • যদি features.type == STRING ,
        • feature.bool_domain নির্দিষ্ট করা আছে এবং
        • feature.bool_domain.true_value এবং feature.bool_domain.false_value নির্দিষ্ট করা নেই
  • ENUM_TYPE_BYTES_NOT_STRING

    • TFDV-এ অসঙ্গতির ধরন শনাক্ত হয়নি
  • ENUM_TYPE_FLOAT_NOT_STRING

    • TFDV-এ অসঙ্গতির ধরন শনাক্ত হয়নি
  • ENUM_TYPE_INT_NOT_STRING

    • TFDV-এ অসঙ্গতির ধরন শনাক্ত হয়নি
  • ENUM_TYPE_INVALID_UTF8

    • পরিসংখ্যান ক্ষেত্র:
      • features.string_stats.invalid_utf8_count
    • সনাক্তকরণ শর্ত:
      • invalid_utf8_count > 0
  • ENUM_TYPE_UNEXPECTED_STRING_VALUES

    • স্কিমা ক্ষেত্র:
      • string_domain এবং feature.domain ; অথবা feature.string_domain
      • feature.distribution_constraints.min_domain_mass
    • পরিসংখ্যান ক্ষেত্র:
      • features.string_stats.rank_histogram *
    • সনাক্তকরণ শর্ত:
      • হয় ( rank_histogram মানগুলির সংখ্যা * যেগুলি ডোমেনে নেই / মোট মানগুলির সংখ্যা) > (1 - feature.distribution_constraints.min_domain_mass ) বা
      • feature.distribution_constraints.min_domain_mass == 1.0 এবং হিস্টোগ্রামে এমন মান রয়েছে যা ডোমেনে নেই
  • FEATURE_TYPE_HIGH_NUMBER_VALUES

    • স্কিমা ক্ষেত্র:
      • feature.value_count.max
      • feature.value_counts.value_count.max
    • পরিসংখ্যান ক্ষেত্র:
      • features.common_stats.max_num_values
      • features.common_stats.presence_and_valency_stats.max_num_values
    • সনাক্তকরণ শর্ত:
      • যদি feature.value_count.max উল্লেখ করা থাকে
        • features.common_stats.max_num_values ​​> feature.value_count.max ; বা
      • যদি feature.value_counts নির্দিষ্ট করা থাকে
        • feature.value_counts.value_count.max < features.common_stats.presence_and_valency_stats.max_num_values ​​একটি প্রদত্ত নেস্টেডনেস স্তরে
  • FEATURE_TYPE_LOW_FRACTION_PRESENT

    • স্কিমা ক্ষেত্র:
      • feature.presence.min_fraction
    • পরিসংখ্যান ক্ষেত্র:
      • features.common_stats.num_non_missing *
      • num_examples *
    • সনাক্তকরণ শর্ত:
      • feature.presence.min_fraction নির্দিষ্ট করা আছে এবং ( features.common_stats.num_non_missing * / num_examples *) < feature.presence.min_fraction বা
      • feature.presence.min_fraction == 1.0 এবং common_stats.num_missing != 0
  • FEATURE_TYPE_LOW_NUMBER_PRESENT

    • স্কিমা ক্ষেত্র:
      • feature.presence.min_count
    • পরিসংখ্যান ক্ষেত্র:
      • features.common_stats.num_non_missing *
    • সনাক্তকরণ শর্ত:
      • feature.presence.min_count নির্দিষ্ট করা আছে এবং হয়
        • features.common_stats.num_non_missing * == 0 বা
        • features.common_stats.num_non_missing * < feature.presence.min_count
  • FEATURE_TYPE_LOW_NUMBER_VALUES

    • স্কিমা ক্ষেত্র:
      • feature.value_count.min
      • feature.value_counts.value_count.min
    • পরিসংখ্যান ক্ষেত্র:
      • features.common_stats.min_num_values
      • features.common_stats.presence_and_valency_stats.min_num_values
    • সনাক্তকরণ শর্ত:
      • যদি feature.value_count.min নির্দিষ্ট করা থাকে
        • features.common_stats.min_num_values ​​< feature.value_count.min ; বা
      • যদি feature.value_counts নির্দিষ্ট করা থাকে
        • features.common_stats.presence_and_valency_stats.min_num_values ​​< feature.value_counts.value_count.min প্রদত্ত নেস্টেডনেস স্তরে
  • FEATURE_TYPE_NOT_PRESENT

    • স্কিমা ক্ষেত্র:
      • feature.in_environment বা feature.not_in_environment বা schema.default_environment
      • feature.lifecycle_stage
      • feature.presence.min_count বা feature.presence.min_fraction
    • পরিসংখ্যান ক্ষেত্র:
      • features.common_stats.num_non_missing *
    • সনাক্তকরণ শর্ত:
      • feature.lifecycle_stage PLANNED ALPHA DEBUG DEPRECATED
      • common_stats.num_non_missing * == 0 এবং
      • ( feature.presence.min_count > 0 বা feature.presence.min_fraction > 0) এবং হয়
        • feature.in_environment == বর্তমান পরিবেশ বা
        • feature.not_in_environment != বর্তমান পরিবেশ বা
        • schema.default_environment != বর্তমান পরিবেশ
  • FEATURE_TYPE_NO_VALUES

    • TFDV-এ অসঙ্গতির ধরন শনাক্ত হয়নি
  • FEATURE_TYPE_UNEXPECTED_REPEATED

    • TFDV-এ অসঙ্গতির ধরন শনাক্ত হয়নি
  • FEATURE_TYPE_HIGH_UNIQUE

    • স্কিমা ক্ষেত্র:
      • feature.unique_constraints.max
    • পরিসংখ্যান ক্ষেত্র:
      • features.string_stats.unique
    • সনাক্তকরণ শর্ত:
      • features.string_stats.unique > feature.unique_constraints.max
  • FEATURE_TYPE_LOW_UNIQUE

    • স্কিমা ক্ষেত্র:
      • feature.unique_constraints.min
    • পরিসংখ্যান ক্ষেত্র:
      • features.string_stats.unique
    • সনাক্তকরণ শর্ত:
      • features.string_stats.unique < feature.unique_constraints.min
  • FEATURE_TYPE_NO_UNIQUE

    • স্কিমা ক্ষেত্র:
      • feature.unique_constraints
    • পরিসংখ্যান ক্ষেত্র:
      • features.string_stats.unique
    • সনাক্তকরণ শর্ত:
      • feature.unique_constraints নির্দিষ্ট করা হয়েছে কিন্তু কোনো features.string_stats.unique নেই (যেমন বৈশিষ্ট্যটি কোনো স্ট্রিং বা শ্রেণীবদ্ধ নয়)
  • FLOAT_TYPE_BIG_FLOAT

    • স্কিমা ক্ষেত্র:
      • feature.float_domain.max
    • পরিসংখ্যান ক্ষেত্র:
      • features.type
      • features.num_stats.max বা features.string_stats.rank_histogram
    • সনাক্তকরণ শর্ত:
      • যদি features.type == FLOAT ,
        • features.num_stats.max > feature.float_domain.max ; বা
      • যদি features.type == BYTES বা STRING ,
        • features.string_stats.rank_histogram এ সর্বোচ্চ মান (যখন ফ্লোটে রূপান্তরিত হয়) > feature.float_domain.max
  • FLOAT_TYPE_NOT_FLOAT

    • TFDV-এ অসঙ্গতির ধরন শনাক্ত হয়নি
  • FLOAT_TYPE_SMALL_FLOAT

    • স্কিমা ক্ষেত্র:
      • feature.float_domain.min
    • পরিসংখ্যান ক্ষেত্র:
      • features.type
      • features.num_stats.min বা features.string_stats.rank_histogram
    • সনাক্তকরণ শর্ত:
      • যদি features.type == FLOAT ,
        • features.num_stats.min < feature.float_domain.min ; বা
      • যদি features.type == BYTES বা STRING ,
        • features.string_stats.rank_histogram এ ন্যূনতম মান (যখন ফ্লোটে রূপান্তরিত হয়) < feature.float_domain.min
  • FLOAT_TYPE_STRING_NOT_FLOAT

    • স্কিমা ক্ষেত্র:
      • feature.float_domain
    • পরিসংখ্যান ক্ষেত্র:
      • features.type
      • features.string_stats.rank_histogram
    • সনাক্তকরণ শর্ত:
      • features.type == BYTES বা STRING এবং
      • features.string_stats.rank_histogram এর অন্তত একটি মান আছে যা একটি ফ্লোটে রূপান্তর করা যায় না
  • FLOAT_TYPE_NON_STRING

    • TFDV-এ অসঙ্গতির ধরন শনাক্ত হয়নি
  • FLOAT_TYPE_UNKNOWN_TYPE_NUMBER

    • TFDV-এ অসঙ্গতির ধরন শনাক্ত হয়নি
  • FLOAT_TYPE_HAS_NAN

    • স্কিমা ক্ষেত্র:
      • feature.float_domain.disallow_nan
    • পরিসংখ্যান ক্ষেত্র:
      • features.type
      • features.num_stats.histograms.num_nan
    • সনাক্তকরণ শর্ত:
      • float_domain.disallow_nan সত্য এবং
      • features.num_stats.histograms.num_nan > 0
  • FLOAT_TYPE_HAS_INF

    • স্কিমা ক্ষেত্র:
      • feature.float_domain.disallow_inf
    • পরিসংখ্যান ক্ষেত্র:
      • features.type
      • features.num_stats.min
      • features.num_stats.max
    • সনাক্তকরণ শর্ত:
      • features.type == FLOAT
      • float_domain.disallow_inf সত্য এবং হয়
        • features.num_stats.min == inf/-inf বা
        • features.num_stats.max == inf/-inf
  • INT_TYPE_BIG_INT

    • স্কিমা ক্ষেত্র:
      • feature.int_domain.max
    • পরিসংখ্যান ক্ষেত্র:
      • features.type
      • features.num_stats.max
      • features.string_stats.rank_histogram
    • সনাক্তকরণ শর্ত:
      • যদি features.type == INT ,
        • features.num_stats.max > feature.int_domain.max ; বা
      • যদি features.type == BYTES বা STRING ,
        • features.string_stats.rank_histogram এ সর্বোচ্চ মান (যখন int-এ রূপান্তরিত হয়) > feature.int_domain.max
  • INT_TYPE_INT_EXPECTED

    • TFDV-এ অসঙ্গতির ধরন শনাক্ত হয়নি
  • INT_TYPE_NOT_INT_STRING

    • স্কিমা ক্ষেত্র:
      • feature.int_domain
    • পরিসংখ্যান ক্ষেত্র:
      • features.type
      • features.string_stats.rank_histogram
    • সনাক্তকরণ শর্ত:
      • features.type == BYTES বা STRING এবং
      • features.string_stats.rank_histogram অন্তত একটি মান আছে যাকে int-এ রূপান্তর করা যায় না
  • INT_TYPE_NOT_STRING

    • TFDV-এ অসঙ্গতির ধরন শনাক্ত হয়নি
  • INT_TYPE_SMALL_INT

    • স্কিমা ক্ষেত্র:
      • feature.int_domain.min
    • পরিসংখ্যান ক্ষেত্র:
      • features.type
      • features.num_stats.min
      • features.string_stats.rank_histogram
    • সনাক্তকরণ শর্ত:
      • যদি features.type == INT ,
        • features.num_stats.min < feature.int_domain.min ; বা
      • যদি features.type == BYTES বা STRING ,
        • features.string_stats.rank_histogram এ ন্যূনতম মান (যখন int-এ রূপান্তরিত হয়) < feature.int_domain.min
  • INT_TYPE_STRING_EXPECTED

    • TFDV-এ অসঙ্গতির ধরন শনাক্ত হয়নি
  • INT_TYPE_UNKNOWN_TYPE_NUMBER

    • TFDV-এ অসঙ্গতির ধরন শনাক্ত হয়নি
  • LOW_SUPPORTED_IMAGE_FRACTION

    • স্কিমা ক্ষেত্র:
      • feature.image_domain.minimum_supported_image_fraction
    • পরিসংখ্যান ক্ষেত্র:
      • image_format_histogram নামের সাথে custom_stats এর জন্য features.custom_stats.rank_histogram । মনে রাখবেন যে ইমেজ_ফরম্যাট_হিস্টোগ্রাম তৈরি করার জন্য এবং এই বৈধতা সঞ্চালনের জন্য শব্দার্থিক ডোমেন পরিসংখ্যান সক্রিয় করা আবশ্যক। শব্দার্থিক ডোমেনের পরিসংখ্যান ডিফল্টরূপে তৈরি হয় না।
    • সনাক্তকরণ শর্ত:
      • মানের ভগ্নাংশ যা Tensorflow ইমেজ ধরনের সমর্থিত সব ইমেজ ধরনের feature.image_domain.minimum_supported_image_fraction থেকে কম।
  • SCHEMA_MISSING_COLUMN

    • স্কিমা ক্ষেত্র:
      • feature.in_environment বা feature.not_in_environment বা schema.default_environment
      • feature.lifecycle_stage
      • feature.presence.min_count বা feature.presence.min_fraction
    • সনাক্তকরণ শর্ত:
      • feature.lifecycle_stage != PLANNED , ALPHA , DEBUG , বা DEPRECATED এবং
      • feature.presence.min_count > 0 বা feature.presence.min_fraction > 0 এবং
      • feature.in_environment == বর্তমান পরিবেশ বা feature.not_in_environment != বর্তমান পরিবেশ বা schema.default_environment != বর্তমান পরিবেশ এবং
      • পরিসংখ্যান প্রোটোতে নির্দিষ্ট নাম/পথের কোনো বৈশিষ্ট্য পাওয়া যায় না
  • SCHEMA_NEW_COLUMN

    • সনাক্তকরণ শর্ত:
      • পরিসংখ্যান প্রোটোতে একটি বৈশিষ্ট্য রয়েছে তবে স্কিমা প্রোটোতে এর নাম/পথ সহ কোনও বৈশিষ্ট্য নেই
  • SCHEMA_TRAINING_SERVING_SKEW

    • TFDV-এ অসঙ্গতির ধরন শনাক্ত হয়নি
  • STRING_TYPE_NOW_FLOAT

    • TFDV-এ অসঙ্গতির ধরন শনাক্ত হয়নি
  • STRING_TYPE_NOW_INT

    • TFDV-এ অসঙ্গতির ধরন শনাক্ত হয়নি
  • COMPARATOR_CONTROL_DATA_MISSING

    • স্কিমা ক্ষেত্র:
      • feature.skew_comparator.infinity_norm.threshold
      • feature.drift_comparator.infinity_norm.threshold
    • সনাক্তকরণ শর্ত:
      • নিয়ন্ত্রণ পরিসংখ্যান প্রোটো (যেমন, স্কুয়ের জন্য পরিসংখ্যান পরিবেশন করা বা ড্রিফটের জন্য পূর্ববর্তী পরিসংখ্যান) উপলব্ধ কিন্তু নির্দিষ্ট বৈশিষ্ট্য ধারণ করে না
  • COMPARATOR_TREATMENT_DATA_MISSING

    • TFDV-এ অসঙ্গতির ধরন শনাক্ত হয়নি
  • COMPARATOR_L_INFTY_HIGH

    • স্কিমা ক্ষেত্র:
      • feature.skew_comparator.infinity_norm.threshold
      • feature.drift_comparator.infinity_norm.threshold
    • পরিসংখ্যান ক্ষেত্র:
      • features.string_stats.rank_histogram *
    • সনাক্তকরণ শর্ত:
      • ভেক্টরের L-ইনফিনিটি আদর্শ যা নিয়ন্ত্রণ পরিসংখ্যানে features.string_stats.rank_histogram * থেকে স্বাভাবিক গণনার মধ্যে পার্থক্যকে প্রতিনিধিত্ব করে (অর্থাৎ, ড্রিফটের জন্য তির্যক পরিসংখ্যান বা পূর্ববর্তী পরিসংখ্যান পরিবেশন করা) এবং চিকিত্সা পরিসংখ্যান (অর্থাৎ, প্রশিক্ষণের পরিসংখ্যান ড্রিফ্টের জন্য স্কু বা বর্তমান পরিসংখ্যান) > feature.skew_comparator.infinity_norm.threshold বা feature.drift_comparator.infinity_norm.threshold
  • COMPARATOR_NORMALIZED_ABSOLUTE_DIFFERENCE_HIGH

    • স্কিমা ক্ষেত্র:
      • feature.skew_comparator.normalized_abs_difference.threshold
      • feature.drift_comparator.normalized_abs_difference.threshold
    • পরিসংখ্যান ক্ষেত্র:
      • features.string_stats.rank_histogram
    • সনাক্তকরণ শর্ত:
      • নিয়ন্ত্রণ পরিসংখ্যানের features.string_stats.rank_histogram থেকে মান গণনার স্বাভাবিককৃত পরম গণনা পার্থক্য (অর্থাৎ, ড্রিফ্টের জন্য তির্যক পরিসংখ্যান বা পূর্ববর্তী পরিসংখ্যান) এবং চিকিত্সা পরিসংখ্যান (অর্থাৎ, স্কুয়ের জন্য প্রশিক্ষণের পরিসংখ্যান বা ড্রিফ্টের জন্য বর্তমান পরিসংখ্যান) অতিক্রম করেছে feature.skew_comparator.normalized_abs_difference.threshold বা feature.drift_comparator.normalized_abs_difference.threshold উভয় অবস্থার মধ্যে মোট গণনা দ্বারা গণনার পার্থক্য স্বাভাবিক করা হয়।
  • COMPARATOR_JENSEN_SHANNON_DIVERGENCE_HIGH

    • স্কিমা ক্ষেত্র:
      • feature.skew_comparator.jensen_shannon_divergence.threshold
      • feature.drift_comparator.jensen_shannon_divergence.threshold
    • পরিসংখ্যান ক্ষেত্র:
      • STANDARD টাইপের features.num_stats.histograms
      • features.string_stats.rank_histogram *
    • সনাক্তকরণ শর্ত:
      • আনুমানিক জেনসেন-শ্যানন ডিভারজেন্স নিয়ন্ত্রণ পরিসংখ্যানের মধ্যে গণনা করা হয়েছে (যেমন, স্কুয়ের জন্য পরিসংখ্যান পরিবেশন করা বা ড্রিফটের জন্য পূর্ববর্তী পরিসংখ্যান) এবং চিকিত্সার পরিসংখ্যান (যেমন, স্কুয়ের জন্য প্রশিক্ষণের পরিসংখ্যান বা ড্রিফ্টের জন্য বর্তমান পরিসংখ্যান) > feature.skew_comparator.jensen_shannon_divergence.threshold or feature.drift_comparator.jensen_shannon_divergence.threshold আনুমানিক জেনসেন-শ্যানন ডাইভারজেন্স ফিচার. features.num_stats.histograms স্ট্যান্ডার্ড হিস্টোগ্রাম এবং features.string_stats.rank_histogram * উভয় ক্ষেত্রেই স্বাভাবিক নমুনা গণনার ভিত্তিতে গণনা করা হয়।
  • NO_DATA_IN_SPAN

    • TFDV-এ অসঙ্গতির ধরন শনাক্ত হয়নি
  • SPARSE_FEATURE_MISSING_VALUE

    • স্কিমা ক্ষেত্র:
      • sparse_feature.value_feature
    • পরিসংখ্যান ক্ষেত্র:
      • features.custom_stats
    • সনাক্তকরণ শর্ত:
      • নাম হিসেবে "missing_value" সহ features.custom_stats এবং
      • missing_value কাস্টম স্ট্যাটাস != 0
  • SPARSE_FEATURE_MISSING_INDEX

    • স্কিমা ক্ষেত্র:
      • sparse_feature.index_feature
    • পরিসংখ্যান ক্ষেত্র:
      • features.custom_stats
    • সনাক্তকরণ শর্ত:
      • নাম হিসেবে "missing_index" সহ features.custom_stats এবং
      • missing_index কাস্টম স্ট্যাটে যেকোনো মান আছে!= 0
  • SPARSE_FEATURE_LENGTH_MISMATCH

    • স্কিমা ক্ষেত্র:
      • sparse_feature.value_feature
      • sparse_feature.index_feature
    • পরিসংখ্যান ক্ষেত্র:
      • features.custom_stats
    • সনাক্তকরণ শর্ত:
      • "min_length_diff" বা "max_length_diff" নামের সাথে features.custom_stats
      • min_length_diff বা max_length_diff কাস্টম স্ট্যাটে যেকোনো মান আছে!= 0
  • SPARSE_FEATURE_NAME_COLLISION

    • স্কিমা ক্ষেত্র:
      • sparse_feature.name
      • sparse_feature.lifecycle_stage
      • feature.name
      • feature.lifecycle_stage
    • সনাক্তকরণ শর্ত:
      • sparse_feature.lifecycle_stage != PLANNED , ALPHA , DEBUG , বা DEPRECATED , এবং
      • feature.lifecycle_stage != PLANNED , ALPHA , DEBUG , বা DEPRECATED , এবং
      • sparse_feature.name == feature.name
  • SEMANTIC_DOMAIN_UPDATE

    • স্কিমা ক্ষেত্র:
      • feature.domain_info
    • পরিসংখ্যান ক্ষেত্র:
      • features.custom_stats
    • সনাক্তকরণ শর্ত:
      • "domain_info" নামের সাথে features.custom_stats এবং
      • feature.domain_info ইতিমধ্যে স্কিমাতে সেট করা নেই এবং
      • বৈশিষ্ট্যটির জন্য একটি একক domain_info কাস্টম স্ট্যাটাস আছে
  • COMPARATOR_LOW_NUM_EXAMPLES

    • স্কিমা ক্ষেত্র:
      • schema.dataset_constraints.num_examples_drift_comparator.min_fraction_threshold
      • schema.dataset_constraints.num_examples_version_comparator.min_fraction_threshold
    • পরিসংখ্যান ক্ষেত্র:
      • num_examples *
    • সনাক্তকরণ শর্ত:
      • num_examples * > 0 এবং
      • পূর্ববর্তী পরিসংখ্যান প্রোটো উপলব্ধ এবং
      • num_examples * / আগের পরিসংখ্যান num_examples * < comparator min_fraction_threshold
  • COMPARATOR_HIGH_NUM_EXAMPLES

    • স্কিমা ক্ষেত্র:
      • schema.dataset_constraints.num_examples_drift_comparator.max_fraction_threshold
      • schema.dataset_constraints.num_examples_version_comparator.max_fraction_threshold
    • পরিসংখ্যান ক্ষেত্র:
      • num_examples *
    • সনাক্তকরণ শর্ত:
      • num_examples * > 0 এবং
      • পূর্ববর্তী পরিসংখ্যান প্রোটো উপলব্ধ এবং
      • num_examples * / আগের পরিসংখ্যান num_examples * > comparator max_fraction_threshold
  • DATASET_LOW_NUM_EXAMPLES

    • স্কিমা ক্ষেত্র:
      • schema.dataset_constraints.min_examples_count
    • পরিসংখ্যান ক্ষেত্র:
      • num_examples *
    • সনাক্তকরণ শর্ত:
      • num_examples * < dataset_constraints.min_examples_count
  • DATASET_HIGH_NUM_EXAMPLES

    • স্কিমা ক্ষেত্র:
      • schema.dataset_constraints.max_examples_count
    • পরিসংখ্যান ক্ষেত্র:
      • num_examples *
    • সনাক্তকরণ শর্ত:
      • num_examples * > dataset_constraints.max_examples_count
  • WEIGHTED_FEATURE_NAME_COLLISION

    • স্কিমা ক্ষেত্র:
      • weighted_feature.name
      • weighted_feature.lifecycle_stage
      • sparse_feature.name
      • sparse_feature.lifecycle_stage
      • feature.name
      • feature.lifecycle_stage
    • সনাক্তকরণ শর্ত:
      • weighted_feature.lifecycle_stage != PLANNED , ALPHA , DEBUG , অথবা DEPRECATED এবং হয়
        • যদি feature.lifecycle_stage != PLANNED , ALPHA , DEBUG , বা DEPRECATED ,
          • weighted_feature.name == feature.name ; বা
        • যদি sparse_feature.lifecycle_stage != PLANNED , ALPHA , DEBUG , বা DEPRECATED ,
          • weighted_feature.name == sparse_feature.name
  • WEIGHTED_FEATURE_MISSING_VALUE

    • স্কিমা ক্ষেত্র:
      • weighted_feature.feature
    • পরিসংখ্যান ক্ষেত্র:
      • features.custom_stats
    • সনাক্তকরণ শর্ত:
      • নাম হিসেবে "missing_value" সহ features.custom_stats এবং
      • missing_value কাস্টম স্ট্যাটাস != 0
  • WEIGHTED_FEATURE_MISSING_WEIGHT

    • স্কিমা ক্ষেত্র:
      • weighted_feature.weight_feature
    • পরিসংখ্যান ক্ষেত্র:
      • features.custom_stats
    • সনাক্তকরণ শর্ত:
      • নাম হিসেবে "missing_weight" সহ features.custom_stats এবং
      • missing_weight কাস্টম স্ট্যাটাস!= 0
  • WEIGHTED_FEATURE_LENGTH_MISMATCH

    • স্কিমা ক্ষেত্র:
      • weighted_feature.feature
      • weighted_feature.weight_feature
    • পরিসংখ্যান ক্ষেত্র:
      • features.custom_stats
    • সনাক্তকরণ শর্ত:
      • নাম হিসেবে "min_weighted_length_diff" বা "max_weight_length_diff" সহ features.custom_stats , এবং
      • min_weight_length_diff বা max_weight_length_diff কাস্টম স্ট্যাট != 0
  • VALUE_NESTEDNESS_MISMATCH

    • স্কিমা ক্ষেত্র:
      • feature.value_count
      • feature.value_counts
    • পরিসংখ্যান ক্ষেত্র:
      • features.common_stats.presence_and_valency_stats
    • সনাক্তকরণ শর্ত:
      • feature.value_count নির্দিষ্ট করা আছে, এবং বৈশিষ্ট্যটির পুনরাবৃত্ত presence_and_valency_stats রয়েছে (যা একটি নেস্টেডনেস লেভেল নির্দেশ করে যা একের বেশি) এবং
      • feature.value_counts নির্দিষ্ট করা আছে, এবং বৈশিষ্ট্যটির presence_and_valency_stats যতবার পুনরাবৃত্তি করা হয়েছে তার সাথে feature.value_counts এর মধ্যে value_count পুনরাবৃত্তির সংখ্যার সাথে মেলে না
  • DOMAIN_INVALID_FOR_TYPE

    • স্কিমা ক্ষেত্র:
      • feature.type
      • feature.domain_info
    • পরিসংখ্যান ক্ষেত্র:
      • features.type
    • সনাক্তকরণ শর্ত:
      • যদি features.type == BYTES ,
        • feature.domain_info একটি বেমানান ধরনের; বা
      • if features.type != BYTES ,
        • feature.domain_info feature.type সাথে মেলে না (যেমন, int_domain নির্দিষ্ট করা আছে, কিন্তু বৈশিষ্ট্যের type হল FLOAT )
  • FEATURE_MISSING_NAME

    • স্কিমা ক্ষেত্র:
      • feature.name
    • সনাক্তকরণ শর্ত:
      • feature.name নির্দিষ্ট করা নেই
  • FEATURE_MISSING_TYPE

    • স্কিমা ক্ষেত্র:
      • feature.type
    • সনাক্তকরণ শর্ত:
      • feature.type নির্দিষ্ট করা নেই
  • INVALID_SCHEMA_SPECIFICATION

    • স্কিমা ক্ষেত্র:
      • feature.domain_info
      • feature.presence.min_fraction
      • feature.value_count.min
      • feature.value_count.max
      • feature.distribution_constraints
    • সনাক্তকরণ শর্ত:
      • feature.presence.min_fraction < 0.0 বা > 1.0, বা
      • feature.value_count.min < 0 বা > feature.value_count.max , বা
      • একটি bool, int, float, struct, বা শব্দার্থিক ডোমেন একটি বৈশিষ্ট্যের জন্য নির্দিষ্ট করা হয় এবং বৈশিষ্ট্যের জন্য নির্দিষ্ট করা হয় feature.distribution_constraints ও সেই বৈশিষ্ট্যের জন্য নির্দিষ্ট করা হয়, অথবা
      • feature.distribution_constraints একটি বৈশিষ্ট্যের জন্য নির্দিষ্ট করা হয়েছে, কিন্তু সেই বৈশিষ্ট্যের জন্য স্কিমা-স্তরের ডোমেন বা feature.string_domain কোনোটিই নির্দিষ্ট করা নেই
  • INVALID_DOMAIN_SPECIFICATION

    • স্কিমা ক্ষেত্র:
      • feature.domain_info
      • feature.bool_domain
      • feature.string_domain
    • সনাক্তকরণ শর্ত:
      • অজানা feature.domain_info টাইপ নির্দিষ্ট করা হয়েছে বা
      • feature.domain নির্দিষ্ট করা আছে, কিন্তু স্কিমা লেভেলে কোনো মিলিত ডোমেন নির্দিষ্ট করা নেই, বা
      • যদি feature.bool_domain , feature.bool_domain.true_value , এবং feature.bool_domain.false_value নির্দিষ্ট করা থাকে,
        • feature.bool_domain.true_value == feature.bool_domain.false_value , বা
      • যদি feature.string_domain নির্দিষ্ট করা থাকে,
        • সদৃশ feature.string_domain.values ​​আছে বা
        • feature.string_domain সর্বাধিক আকার অতিক্রম করে
  • UNEXPECTED_DATA_TYPE

    • স্কিমা ক্ষেত্র:
      • feature.type
    • পরিসংখ্যান ক্ষেত্র:
      • features.type
    • সনাক্তকরণ শর্ত:
      • features.type feature.type এ উল্লেখিত টাইপের নয়
  • SEQUENCE_VALUE_TOO_FEW_OCCURRENCES

    • স্কিমা ক্ষেত্র:
      • feature.natural_language_domain.token_constraints.min_per_sequence
    • পরিসংখ্যান ক্ষেত্র:
      • features.custom_stats.nl_statistics.token_statistics.per_sequence_min_frequency
    • সনাক্তকরণ শর্ত:
      • min_per_sequence > per_sequence_min_frequency
  • SEQUENCE_VALUE_TOO_MANY_OCCURRENCES

    • স্কিমা ক্ষেত্র:
      • feature.natural_language_domain.token_constraints.max_per_sequence
    • পরিসংখ্যান ক্ষেত্র:
      • features.custom_stats.nl_statistics.token_statistics.per_sequence_max_frequency
    • সনাক্তকরণ শর্ত:
      • max_per_sequence < per_sequence_max_frequency
  • SEQUENCE_VALUE_TOO_SMALL_FRACTION

    • স্কিমা ক্ষেত্র:
      • feature.natural_language_domain.token_constraints.min_fraction_of_sequences
    • পরিসংখ্যান ক্ষেত্র:
      • features.custom_stats.nl_statistics.token_statistics.fraction_of_sequences
    • সনাক্তকরণ শর্ত:
      • min_fraction_of_sequences > fraction_of_sequences
  • SEQUENCE_VALUE_TOO_LARGE_FRACTION

    • স্কিমা ক্ষেত্র:
      • feature.natural_language_domain.token_constraints.max_fraction_of_sequences
    • পরিসংখ্যান ক্ষেত্র:
      • features.custom_stats.nl_statistics.token_statistics.fraction_of_sequences
    • সনাক্তকরণ শর্ত:
      • max_fraction_of_sequences < fraction_of_sequences
  • FEATURE_COVERAGE_TOO_LOW

    • স্কিমা ক্ষেত্র:
      • feature.natural_language_domain.coverage.min_coverage
    • পরিসংখ্যান ক্ষেত্র:
      • features.custom_stats.nl_statistics.feature_coverage
    • সনাক্তকরণ শর্ত:
      • feature_coverage < coverage.min_coverage
  • FEATURE_COVERAGE_TOO_SHORT_AVG_TOKEN_LENGTH

    • স্কিমা ক্ষেত্র:
      • feature.natural_language_domain.coverage.min_avg_token_length
    • পরিসংখ্যান ক্ষেত্র:
      • features.custom_stats.nl_statistics.avg_token_length
    • সনাক্তকরণ শর্ত:
      • avg_token_length < min_avg_token_length
  • NLP_WRONG_LOCATION

    • TFDV-এ অসঙ্গতির ধরন শনাক্ত হয়নি
  • EMBEDDING_SHAPE_INVALID

    • TFDV-এ অসঙ্গতির ধরন শনাক্ত হয়নি
  • MAX_IMAGE_BYTE_SIZE_EXCEEDED

    • স্কিমা ক্ষেত্র:
      • feature.image_domain.max_image_byte_size
    • পরিসংখ্যান ক্ষেত্র:
      • features.bytes_stats.max_num_bytes_int
    • সনাক্তকরণ শর্ত:
      • max_num_bytes_int > max_image_byte_size
  • INVALID_FEATURE_SHAPE

    • স্কিমা ক্ষেত্র:
      • feature.shape
    • পরিসংখ্যান ক্ষেত্র:
      • features.common_stats.num_missing
      • features.common_stats.min_num_values
      • features.common_stats.max_num_values
      • features.common_stats.presence_and_valency_stats.num_missing
      • features.common_stats.presence_and_valency_stats.min_num_values
      • features.common_stats.presence_and_valency_stats.max_num_values
      • features.common_stats.weighted_presence_and_valency_stats
    • সনাক্তকরণ শর্ত:
      • feature.shape নির্দিষ্ট করা আছে, এবং হয়
        • বৈশিষ্ট্যটি অনুপস্থিত হতে পারে ( num_missing != 0) কিছু নেস্ট স্তরে বা
        • বৈশিষ্ট্যটিতে কিছু নেস্ট স্তরে মানগুলির পরিবর্তনশীল সংখ্যা থাকতে পারে ( min_num_values ​​!= max_num_values ​​) বা
        • নির্দিষ্ট আকৃতি বৈশিষ্ট্যের মান গণনা পরিসংখ্যানের সাথে সামঞ্জস্যপূর্ণ নয়৷ উদাহরণস্বরূপ, আকৃতি [16] ( min_num_values ​​== max_num_values ​​== [2, 2, 4] (3-নেস্টেড বৈশিষ্ট্যের জন্য) এর সাথে সামঞ্জস্যপূর্ণ
  • STATS_NOT_AVAILBLE

    • সীমাবদ্ধতা যাচাই করার জন্য প্রয়োজনীয় পরিসংখ্যান উপস্থিত না থাকলে অসঙ্গতি ঘটে।
  • DERIVED_FEATURE_BAD_LIFECYCLE

    • স্কিমা ক্ষেত্র:
      • feature.lifecycle_stage
    • পরিসংখ্যান ক্ষেত্র:
      • features.validation_derived_source
    • সনাক্তকরণ শর্ত:
      • feature.lifecycle_stage DERIVED বা DISABLED এর মধ্যে একটি নয়, এবং features.validation_derived_source উপস্থিত রয়েছে, যা নির্দেশ করে যে এটি একটি উদ্ভূত বৈশিষ্ট্য।
  • DERIVED_FEATURE_INVALID_SOURCE

    • স্কিমা ক্ষেত্র:
      • feature.validation_derived_source
    • পরিসংখ্যান ক্ষেত্র:
      • features.validation_derived_source
    • সনাক্তকরণ শর্ত:
      • features.validation_derived_source একটি বৈশিষ্ট্যের জন্য উপস্থিত আছে, কিন্তু সংশ্লিষ্ট feature.validation_derived_source নেই।

* যদি এই ক্ষেত্রের জন্য একটি ওজনযুক্ত পরিসংখ্যান উপলব্ধ থাকে, তবে এটি অ-ওজন পরিসংখ্যানের পরিবর্তে ব্যবহার করা হবে।