TFDV একটি স্কিমা এবং পরিসংখ্যান প্রোটো(গুলি) তুলনা করে অসঙ্গতির জন্য পরীক্ষা করে। নিম্নলিখিত চার্টে TFDV শনাক্ত করতে পারে এমন অসঙ্গতির ধরনগুলি তালিকাভুক্ত করে, স্কিমা এবং পরিসংখ্যান ক্ষেত্রগুলি যেগুলি প্রতিটি অসঙ্গতির ধরন সনাক্ত করতে ব্যবহৃত হয় এবং যে শর্ত(গুলি) যার অধীনে প্রতিটি অসঙ্গতি টাইপ সনাক্ত করা হয়।
BOOL_TYPE_BIG_INT
- স্কিমা ক্ষেত্র:
-
feature.bool_domain
-
- পরিসংখ্যান ক্ষেত্র:
-
features.num_stats.max
-
features.type
-
- সনাক্তকরণ শর্ত:
-
feature.bool_domain
নির্দিষ্ট করা আছে এবং -
features.type
==INT
এবং -
features.num_stats.max
> 1
-
- স্কিমা ক্ষেত্র:
BOOL_TYPE_BYTES_NOT_INT
- TFDV-এ অসঙ্গতির ধরন শনাক্ত হয়নি
BOOL_TYPE_BYTES_NOT_STRING
- TFDV-এ অসঙ্গতির ধরন শনাক্ত হয়নি
BOOL_TYPE_FLOAT_NOT_INT
- TFDV-এ অসঙ্গতির ধরন শনাক্ত হয়নি
BOOL_TYPE_FLOAT_NOT_STRING
- TFDV-এ অসঙ্গতির ধরন শনাক্ত হয়নি
BOOL_TYPE_INT_NOT_STRING
- TFDV-এ অসঙ্গতির ধরন শনাক্ত হয়নি
BOOL_TYPE_SMALL_INT
- স্কিমা ক্ষেত্র:
-
feature.bool_domain
-
- পরিসংখ্যান ক্ষেত্র:
-
features.num_stats.min
-
features.type
-
- সনাক্তকরণ শর্ত:
-
features.type
==INT
এবং -
feature.bool_domain
নির্দিষ্ট করা আছে এবং -
features.num_stats.min
< 0
-
- স্কিমা ক্ষেত্র:
BOOL_TYPE_STRING_NOT_INT
- TFDV-এ অসঙ্গতির ধরন শনাক্ত হয়নি
BOOL_TYPE_UNEXPECTED_STRING
- স্কিমা ক্ষেত্র:
-
feature.bool_domain
-
- পরিসংখ্যান ক্ষেত্র:
-
features.string_stats.rank_histogram
*
-
- সনাক্তকরণ শর্ত:
-
features.type
==STRING
এবং -
feature.bool_domain
নির্দিষ্ট করা আছে এবং -
rank_histogram
* এ অন্তত একটি মানfeature.bool_domain.true_value
বাfeature.bool_domain.false_value
নয়
-
- স্কিমা ক্ষেত্র:
BOOL_TYPE_UNEXPECTED_FLOAT
- স্কিমা ক্ষেত্র:
-
feature.bool_domain
-
- পরিসংখ্যান ক্ষেত্র:
-
features.num_stats.min
-
features.num_stats.max
-
features.num_stats.histograms.num_nan
-
features.num_stats.histograms.buckets.low_value
-
features.num_stats.histograms.buckets.high_value
-
features.type
-
- সনাক্তকরণ শর্ত:
-
features.type
==FLOAT
এবং -
feature.bool_domain
নির্দিষ্ট করা আছে এবং হয়- (
features.num_stats.min
!= 0 বাfeatures.num_stats.min
!= 1) বা - (
features.num_stats.max
!= 0 বাfeatures.num_stats.max
!= 1) বা -
features.num_stats.histograms.num_nan
> 0 বা -
features.num_stats.histograms.buckets.high_value
features.num_stats.histograms.buckets.low_value
features.num_stats.histograms.buckets.sample_count
- (
-
- স্কিমা ক্ষেত্র:
BOOL_TYPE_INVALID_CONFIG
- স্কিমা ক্ষেত্র:
-
feature.bool_domain
-
- পরিসংখ্যান ক্ষেত্র:
-
features.type
-
- সনাক্তকরণ শর্ত:
- যদি
features.type
==INT
বাFLOAT
,-
feature.bool_domain
নির্দিষ্ট করা আছে এবং -
feature.bool_domain.true_value
বাfeature.bool_domain.false_value
নির্দিষ্ট করা আছে, অথবা
-
- যদি
features.type
==STRING
,-
feature.bool_domain
নির্দিষ্ট করা আছে এবং -
feature.bool_domain.true_value
এবংfeature.bool_domain.false_value
নির্দিষ্ট করা নেই
-
- যদি
- স্কিমা ক্ষেত্র:
ENUM_TYPE_BYTES_NOT_STRING
- TFDV-এ অসঙ্গতির ধরন শনাক্ত হয়নি
ENUM_TYPE_FLOAT_NOT_STRING
- TFDV-এ অসঙ্গতির ধরন শনাক্ত হয়নি
ENUM_TYPE_INT_NOT_STRING
- TFDV-এ অসঙ্গতির ধরন শনাক্ত হয়নি
ENUM_TYPE_INVALID_UTF8
- পরিসংখ্যান ক্ষেত্র:
-
features.string_stats.invalid_utf8_count
-
- সনাক্তকরণ শর্ত:
-
invalid_utf8_count
> 0
-
- পরিসংখ্যান ক্ষেত্র:
ENUM_TYPE_UNEXPECTED_STRING_VALUES
- স্কিমা ক্ষেত্র:
-
string_domain
এবংfeature.domain
; অথবাfeature.string_domain
-
feature.distribution_constraints.min_domain_mass
-
- পরিসংখ্যান ক্ষেত্র:
-
features.string_stats.rank_histogram
*
-
- সনাক্তকরণ শর্ত:
- হয় (
rank_histogram
মানগুলির সংখ্যা * যেগুলি ডোমেনে নেই / মোট মানগুলির সংখ্যা) > (1 -feature.distribution_constraints.min_domain_mass
) বা -
feature.distribution_constraints.min_domain_mass
== 1.0 এবং হিস্টোগ্রামে এমন মান রয়েছে যা ডোমেনে নেই
- হয় (
- স্কিমা ক্ষেত্র:
FEATURE_TYPE_HIGH_NUMBER_VALUES
- স্কিমা ক্ষেত্র:
-
feature.value_count.max
-
feature.value_counts.value_count.max
-
- পরিসংখ্যান ক্ষেত্র:
-
features.common_stats.max_num_values
-
features.common_stats.presence_and_valency_stats.max_num_values
-
- সনাক্তকরণ শর্ত:
- যদি
feature.value_count.max
উল্লেখ করা থাকে-
features.common_stats.max_num_values
>feature.value_count.max
; বা
-
- যদি
feature.value_counts
নির্দিষ্ট করা থাকে-
feature.value_counts.value_count.max
<features.common_stats.presence_and_valency_stats.max_num_values
একটি প্রদত্ত নেস্টেডনেস স্তরে
-
- যদি
- স্কিমা ক্ষেত্র:
FEATURE_TYPE_LOW_FRACTION_PRESENT
- স্কিমা ক্ষেত্র:
-
feature.presence.min_fraction
-
- পরিসংখ্যান ক্ষেত্র:
-
features.common_stats.num_non_missing
* -
num_examples
*
-
- সনাক্তকরণ শর্ত:
-
feature.presence.min_fraction
নির্দিষ্ট করা আছে এবং (features.common_stats.num_non_missing
* /num_examples
*) <feature.presence.min_fraction
বা -
feature.presence.min_fraction
== 1.0 এবংcommon_stats.num_missing
!= 0
-
- স্কিমা ক্ষেত্র:
FEATURE_TYPE_LOW_NUMBER_PRESENT
- স্কিমা ক্ষেত্র:
-
feature.presence.min_count
-
- পরিসংখ্যান ক্ষেত্র:
-
features.common_stats.num_non_missing
*
-
- সনাক্তকরণ শর্ত:
-
feature.presence.min_count
নির্দিষ্ট করা আছে এবং হয়-
features.common_stats.num_non_missing
* == 0 বা -
features.common_stats.num_non_missing
* <feature.presence.min_count
-
-
- স্কিমা ক্ষেত্র:
FEATURE_TYPE_LOW_NUMBER_VALUES
- স্কিমা ক্ষেত্র:
-
feature.value_count.min
-
feature.value_counts.value_count.min
-
- পরিসংখ্যান ক্ষেত্র:
-
features.common_stats.min_num_values
-
features.common_stats.presence_and_valency_stats.min_num_values
-
- সনাক্তকরণ শর্ত:
- যদি
feature.value_count.min
নির্দিষ্ট করা থাকে-
features.common_stats.min_num_values
<feature.value_count.min
; বা
-
- যদি
feature.value_counts
নির্দিষ্ট করা থাকে-
features.common_stats.presence_and_valency_stats.min_num_values
<feature.value_counts.value_count.min
প্রদত্ত নেস্টেডনেস স্তরে
-
- যদি
- স্কিমা ক্ষেত্র:
FEATURE_TYPE_NOT_PRESENT
- স্কিমা ক্ষেত্র:
-
feature.in_environment
বাfeature.not_in_environment
বাschema.default_environment
-
feature.lifecycle_stage
-
feature.presence.min_count
বাfeature.presence.min_fraction
-
- পরিসংখ্যান ক্ষেত্র:
-
features.common_stats.num_non_missing
*
-
- সনাক্তকরণ শর্ত:
-
feature.lifecycle_stage
PLANNED
ALPHA
DEBUG
DEPRECATED
-
common_stats.num_non_missing
* == 0 এবং - (
feature.presence.min_count
> 0 বাfeature.presence.min_fraction
> 0) এবং হয়-
feature.in_environment
== বর্তমান পরিবেশ বা -
feature.not_in_environment
!= বর্তমান পরিবেশ বা -
schema.default_environment
!= বর্তমান পরিবেশ
-
-
- স্কিমা ক্ষেত্র:
FEATURE_TYPE_NO_VALUES
- TFDV-এ অসঙ্গতির ধরন শনাক্ত হয়নি
FEATURE_TYPE_UNEXPECTED_REPEATED
- TFDV-এ অসঙ্গতির ধরন শনাক্ত হয়নি
FEATURE_TYPE_HIGH_UNIQUE
- স্কিমা ক্ষেত্র:
-
feature.unique_constraints.max
-
- পরিসংখ্যান ক্ষেত্র:
-
features.string_stats.unique
-
- সনাক্তকরণ শর্ত:
-
features.string_stats.unique
>feature.unique_constraints.max
-
- স্কিমা ক্ষেত্র:
FEATURE_TYPE_LOW_UNIQUE
- স্কিমা ক্ষেত্র:
-
feature.unique_constraints.min
-
- পরিসংখ্যান ক্ষেত্র:
-
features.string_stats.unique
-
- সনাক্তকরণ শর্ত:
-
features.string_stats.unique
<feature.unique_constraints.min
-
- স্কিমা ক্ষেত্র:
FEATURE_TYPE_NO_UNIQUE
- স্কিমা ক্ষেত্র:
-
feature.unique_constraints
-
- পরিসংখ্যান ক্ষেত্র:
-
features.string_stats.unique
-
- সনাক্তকরণ শর্ত:
-
feature.unique_constraints
নির্দিষ্ট করা হয়েছে কিন্তু কোনোfeatures.string_stats.unique
নেই (যেমন বৈশিষ্ট্যটি কোনো স্ট্রিং বা শ্রেণীবদ্ধ নয়)
-
- স্কিমা ক্ষেত্র:
FLOAT_TYPE_BIG_FLOAT
- স্কিমা ক্ষেত্র:
-
feature.float_domain.max
-
- পরিসংখ্যান ক্ষেত্র:
-
features.type
-
features.num_stats.max
বাfeatures.string_stats.rank_histogram
-
- সনাক্তকরণ শর্ত:
- যদি
features.type
==FLOAT
,-
features.num_stats.max
>feature.float_domain.max
; বা
-
- যদি
features.type
==BYTES
বাSTRING
,-
features.string_stats.rank_histogram
এ সর্বোচ্চ মান (যখন ফ্লোটে রূপান্তরিত হয়) >feature.float_domain.max
-
- যদি
- স্কিমা ক্ষেত্র:
FLOAT_TYPE_NOT_FLOAT
- TFDV-এ অসঙ্গতির ধরন শনাক্ত হয়নি
FLOAT_TYPE_SMALL_FLOAT
- স্কিমা ক্ষেত্র:
-
feature.float_domain.min
-
- পরিসংখ্যান ক্ষেত্র:
-
features.type
-
features.num_stats.min
বাfeatures.string_stats.rank_histogram
-
- সনাক্তকরণ শর্ত:
- যদি
features.type
==FLOAT
,-
features.num_stats.min
<feature.float_domain.min
; বা
-
- যদি
features.type
==BYTES
বাSTRING
,-
features.string_stats.rank_histogram
এ ন্যূনতম মান (যখন ফ্লোটে রূপান্তরিত হয়) <feature.float_domain.min
-
- যদি
- স্কিমা ক্ষেত্র:
FLOAT_TYPE_STRING_NOT_FLOAT
- স্কিমা ক্ষেত্র:
-
feature.float_domain
-
- পরিসংখ্যান ক্ষেত্র:
-
features.type
-
features.string_stats.rank_histogram
-
- সনাক্তকরণ শর্ত:
-
features.type
==BYTES
বাSTRING
এবং -
features.string_stats.rank_histogram
এর অন্তত একটি মান আছে যা একটি ফ্লোটে রূপান্তর করা যায় না
-
- স্কিমা ক্ষেত্র:
FLOAT_TYPE_NON_STRING
- TFDV-এ অসঙ্গতির ধরন শনাক্ত হয়নি
FLOAT_TYPE_UNKNOWN_TYPE_NUMBER
- TFDV-এ অসঙ্গতির ধরন শনাক্ত হয়নি
FLOAT_TYPE_HAS_NAN
- স্কিমা ক্ষেত্র:
-
feature.float_domain.disallow_nan
-
- পরিসংখ্যান ক্ষেত্র:
-
features.type
-
features.num_stats.histograms.num_nan
-
- সনাক্তকরণ শর্ত:
-
float_domain.disallow_nan
সত্য এবং -
features.num_stats.histograms.num_nan
> 0
-
- স্কিমা ক্ষেত্র:
FLOAT_TYPE_HAS_INF
- স্কিমা ক্ষেত্র:
-
feature.float_domain.disallow_inf
-
- পরিসংখ্যান ক্ষেত্র:
-
features.type
-
features.num_stats.min
-
features.num_stats.max
-
- সনাক্তকরণ শর্ত:
-
features.type
==FLOAT
-
float_domain.disallow_inf
সত্য এবং হয়-
features.num_stats.min
==inf/-inf
বা -
features.num_stats.max
==inf/-inf
-
-
- স্কিমা ক্ষেত্র:
INT_TYPE_BIG_INT
- স্কিমা ক্ষেত্র:
-
feature.int_domain.max
-
- পরিসংখ্যান ক্ষেত্র:
-
features.type
-
features.num_stats.max
-
features.string_stats.rank_histogram
-
- সনাক্তকরণ শর্ত:
- যদি
features.type
==INT
,-
features.num_stats.max
>feature.int_domain.max
; বা
-
- যদি
features.type
==BYTES
বাSTRING
,-
features.string_stats.rank_histogram
এ সর্বোচ্চ মান (যখন int-এ রূপান্তরিত হয়) >feature.int_domain.max
-
- যদি
- স্কিমা ক্ষেত্র:
INT_TYPE_INT_EXPECTED
- TFDV-এ অসঙ্গতির ধরন শনাক্ত হয়নি
INT_TYPE_NOT_INT_STRING
- স্কিমা ক্ষেত্র:
-
feature.int_domain
-
- পরিসংখ্যান ক্ষেত্র:
-
features.type
-
features.string_stats.rank_histogram
-
- সনাক্তকরণ শর্ত:
-
features.type
==BYTES
বাSTRING
এবং -
features.string_stats.rank_histogram
অন্তত একটি মান আছে যাকে int-এ রূপান্তর করা যায় না
-
- স্কিমা ক্ষেত্র:
INT_TYPE_NOT_STRING
- TFDV-এ অসঙ্গতির ধরন শনাক্ত হয়নি
INT_TYPE_SMALL_INT
- স্কিমা ক্ষেত্র:
-
feature.int_domain.min
-
- পরিসংখ্যান ক্ষেত্র:
-
features.type
-
features.num_stats.min
-
features.string_stats.rank_histogram
-
- সনাক্তকরণ শর্ত:
- যদি
features.type
==INT
,-
features.num_stats.min
<feature.int_domain.min
; বা
-
- যদি
features.type
==BYTES
বাSTRING
,-
features.string_stats.rank_histogram
এ ন্যূনতম মান (যখন int-এ রূপান্তরিত হয়) <feature.int_domain.min
-
- যদি
- স্কিমা ক্ষেত্র:
INT_TYPE_STRING_EXPECTED
- TFDV-এ অসঙ্গতির ধরন শনাক্ত হয়নি
INT_TYPE_UNKNOWN_TYPE_NUMBER
- TFDV-এ অসঙ্গতির ধরন শনাক্ত হয়নি
LOW_SUPPORTED_IMAGE_FRACTION
- স্কিমা ক্ষেত্র:
-
feature.image_domain.minimum_supported_image_fraction
-
- পরিসংখ্যান ক্ষেত্র:
-
image_format_histogram
নামের সাথে custom_stats এর জন্যfeatures.custom_stats.rank_histogram
। মনে রাখবেন যে ইমেজ_ফরম্যাট_হিস্টোগ্রাম তৈরি করার জন্য এবং এই বৈধতা সঞ্চালনের জন্য শব্দার্থিক ডোমেন পরিসংখ্যান সক্রিয় করা আবশ্যক। শব্দার্থিক ডোমেনের পরিসংখ্যান ডিফল্টরূপে তৈরি হয় না।
-
- সনাক্তকরণ শর্ত:
- মানের ভগ্নাংশ যা Tensorflow ইমেজ ধরনের সমর্থিত সব ইমেজ ধরনের
feature.image_domain.minimum_supported_image_fraction
থেকে কম।
- মানের ভগ্নাংশ যা Tensorflow ইমেজ ধরনের সমর্থিত সব ইমেজ ধরনের
- স্কিমা ক্ষেত্র:
SCHEMA_MISSING_COLUMN
- স্কিমা ক্ষেত্র:
-
feature.in_environment
বাfeature.not_in_environment
বাschema.default_environment
-
feature.lifecycle_stage
-
feature.presence.min_count
বাfeature.presence.min_fraction
-
- সনাক্তকরণ শর্ত:
-
feature.lifecycle_stage
!=PLANNED
,ALPHA
,DEBUG
, বাDEPRECATED
এবং -
feature.presence.min_count
> 0 বাfeature.presence.min_fraction
> 0 এবং -
feature.in_environment
== বর্তমান পরিবেশ বাfeature.not_in_environment
!= বর্তমান পরিবেশ বাschema.default_environment
!= বর্তমান পরিবেশ এবং - পরিসংখ্যান প্রোটোতে নির্দিষ্ট নাম/পথের কোনো বৈশিষ্ট্য পাওয়া যায় না
-
- স্কিমা ক্ষেত্র:
SCHEMA_NEW_COLUMN
- সনাক্তকরণ শর্ত:
- পরিসংখ্যান প্রোটোতে একটি বৈশিষ্ট্য রয়েছে তবে স্কিমা প্রোটোতে এর নাম/পথ সহ কোনও বৈশিষ্ট্য নেই
- সনাক্তকরণ শর্ত:
SCHEMA_TRAINING_SERVING_SKEW
- TFDV-এ অসঙ্গতির ধরন শনাক্ত হয়নি
STRING_TYPE_NOW_FLOAT
- TFDV-এ অসঙ্গতির ধরন শনাক্ত হয়নি
STRING_TYPE_NOW_INT
- TFDV-এ অসঙ্গতির ধরন শনাক্ত হয়নি
COMPARATOR_CONTROL_DATA_MISSING
- স্কিমা ক্ষেত্র:
-
feature.skew_comparator.infinity_norm.threshold
-
feature.drift_comparator.infinity_norm.threshold
-
- সনাক্তকরণ শর্ত:
- নিয়ন্ত্রণ পরিসংখ্যান প্রোটো (যেমন, স্কুয়ের জন্য পরিসংখ্যান পরিবেশন করা বা ড্রিফটের জন্য পূর্ববর্তী পরিসংখ্যান) উপলব্ধ কিন্তু নির্দিষ্ট বৈশিষ্ট্য ধারণ করে না
- স্কিমা ক্ষেত্র:
COMPARATOR_TREATMENT_DATA_MISSING
- TFDV-এ অসঙ্গতির ধরন শনাক্ত হয়নি
COMPARATOR_L_INFTY_HIGH
- স্কিমা ক্ষেত্র:
-
feature.skew_comparator.infinity_norm.threshold
-
feature.drift_comparator.infinity_norm.threshold
-
- পরিসংখ্যান ক্ষেত্র:
-
features.string_stats.rank_histogram
*
-
- সনাক্তকরণ শর্ত:
- ভেক্টরের L-ইনফিনিটি আদর্শ যা নিয়ন্ত্রণ পরিসংখ্যানে
features.string_stats.rank_histogram
* থেকে স্বাভাবিক গণনার মধ্যে পার্থক্যকে প্রতিনিধিত্ব করে (অর্থাৎ, ড্রিফটের জন্য তির্যক পরিসংখ্যান বা পূর্ববর্তী পরিসংখ্যান পরিবেশন করা) এবং চিকিত্সা পরিসংখ্যান (অর্থাৎ, প্রশিক্ষণের পরিসংখ্যান ড্রিফ্টের জন্য স্কু বা বর্তমান পরিসংখ্যান) >feature.skew_comparator.infinity_norm.threshold
বাfeature.drift_comparator.infinity_norm.threshold
- ভেক্টরের L-ইনফিনিটি আদর্শ যা নিয়ন্ত্রণ পরিসংখ্যানে
- স্কিমা ক্ষেত্র:
COMPARATOR_NORMALIZED_ABSOLUTE_DIFFERENCE_HIGH
- স্কিমা ক্ষেত্র:
-
feature.skew_comparator.normalized_abs_difference.threshold
-
feature.drift_comparator.normalized_abs_difference.threshold
-
- পরিসংখ্যান ক্ষেত্র:
-
features.string_stats.rank_histogram
-
- সনাক্তকরণ শর্ত:
- নিয়ন্ত্রণ পরিসংখ্যানের
features.string_stats.rank_histogram
থেকে মান গণনার স্বাভাবিককৃত পরম গণনা পার্থক্য (অর্থাৎ, ড্রিফ্টের জন্য তির্যক পরিসংখ্যান বা পূর্ববর্তী পরিসংখ্যান) এবং চিকিত্সা পরিসংখ্যান (অর্থাৎ, স্কুয়ের জন্য প্রশিক্ষণের পরিসংখ্যান বা ড্রিফ্টের জন্য বর্তমান পরিসংখ্যান) অতিক্রম করেছে feature.skew_comparator.normalized_abs_difference.threshold বা feature.drift_comparator.normalized_abs_difference.threshold উভয় অবস্থার মধ্যে মোট গণনা দ্বারা গণনার পার্থক্য স্বাভাবিক করা হয়।
- নিয়ন্ত্রণ পরিসংখ্যানের
- স্কিমা ক্ষেত্র:
COMPARATOR_JENSEN_SHANNON_DIVERGENCE_HIGH
- স্কিমা ক্ষেত্র:
-
feature.skew_comparator.jensen_shannon_divergence.threshold
-
feature.drift_comparator.jensen_shannon_divergence.threshold
-
- পরিসংখ্যান ক্ষেত্র:
-
STANDARD
টাইপেরfeatures.num_stats.histograms
-
features.string_stats.rank_histogram
*
-
- সনাক্তকরণ শর্ত:
- আনুমানিক জেনসেন-শ্যানন ডিভারজেন্স নিয়ন্ত্রণ পরিসংখ্যানের মধ্যে গণনা করা হয়েছে (যেমন, স্কুয়ের জন্য পরিসংখ্যান পরিবেশন করা বা ড্রিফটের জন্য পূর্ববর্তী পরিসংখ্যান) এবং চিকিত্সার পরিসংখ্যান (যেমন, স্কুয়ের জন্য প্রশিক্ষণের পরিসংখ্যান বা ড্রিফ্টের জন্য বর্তমান পরিসংখ্যান) >
feature.skew_comparator.jensen_shannon_divergence.threshold
orfeature.drift_comparator.jensen_shannon_divergence.threshold
আনুমানিক জেনসেন-শ্যানন ডাইভারজেন্স ফিচার.features.num_stats.histograms
স্ট্যান্ডার্ড হিস্টোগ্রাম এবংfeatures.string_stats.rank_histogram
* উভয় ক্ষেত্রেই স্বাভাবিক নমুনা গণনার ভিত্তিতে গণনা করা হয়।
- আনুমানিক জেনসেন-শ্যানন ডিভারজেন্স নিয়ন্ত্রণ পরিসংখ্যানের মধ্যে গণনা করা হয়েছে (যেমন, স্কুয়ের জন্য পরিসংখ্যান পরিবেশন করা বা ড্রিফটের জন্য পূর্ববর্তী পরিসংখ্যান) এবং চিকিত্সার পরিসংখ্যান (যেমন, স্কুয়ের জন্য প্রশিক্ষণের পরিসংখ্যান বা ড্রিফ্টের জন্য বর্তমান পরিসংখ্যান) >
- স্কিমা ক্ষেত্র:
NO_DATA_IN_SPAN
- TFDV-এ অসঙ্গতির ধরন শনাক্ত হয়নি
SPARSE_FEATURE_MISSING_VALUE
- স্কিমা ক্ষেত্র:
-
sparse_feature.value_feature
-
- পরিসংখ্যান ক্ষেত্র:
-
features.custom_stats
-
- সনাক্তকরণ শর্ত:
- নাম হিসেবে "missing_value" সহ
features.custom_stats
এবং -
missing_value
কাস্টম স্ট্যাটাস != 0
- নাম হিসেবে "missing_value" সহ
- স্কিমা ক্ষেত্র:
SPARSE_FEATURE_MISSING_INDEX
- স্কিমা ক্ষেত্র:
-
sparse_feature.index_feature
-
- পরিসংখ্যান ক্ষেত্র:
-
features.custom_stats
-
- সনাক্তকরণ শর্ত:
- নাম হিসেবে "missing_index" সহ
features.custom_stats
এবং -
missing_index
কাস্টম স্ট্যাটে যেকোনো মান আছে!= 0
- নাম হিসেবে "missing_index" সহ
- স্কিমা ক্ষেত্র:
SPARSE_FEATURE_LENGTH_MISMATCH
- স্কিমা ক্ষেত্র:
-
sparse_feature.value_feature
-
sparse_feature.index_feature
-
- পরিসংখ্যান ক্ষেত্র:
-
features.custom_stats
-
- সনাক্তকরণ শর্ত:
- "min_length_diff" বা "max_length_diff" নামের সাথে
features.custom_stats
-
min_length_diff
বাmax_length_diff
কাস্টম স্ট্যাটে যেকোনো মান আছে!= 0
- "min_length_diff" বা "max_length_diff" নামের সাথে
- স্কিমা ক্ষেত্র:
SPARSE_FEATURE_NAME_COLLISION
- স্কিমা ক্ষেত্র:
-
sparse_feature.name
-
sparse_feature.lifecycle_stage
-
feature.name
-
feature.lifecycle_stage
-
- সনাক্তকরণ শর্ত:
-
sparse_feature.lifecycle_stage
!=PLANNED
,ALPHA
,DEBUG
, বাDEPRECATED
, এবং -
feature.lifecycle_stage
!=PLANNED
,ALPHA
,DEBUG
, বাDEPRECATED
, এবং -
sparse_feature.name
==feature.name
-
- স্কিমা ক্ষেত্র:
SEMANTIC_DOMAIN_UPDATE
- স্কিমা ক্ষেত্র:
-
feature.domain_info
-
- পরিসংখ্যান ক্ষেত্র:
-
features.custom_stats
-
- সনাক্তকরণ শর্ত:
- "domain_info" নামের সাথে
features.custom_stats
এবং -
feature.domain_info
ইতিমধ্যে স্কিমাতে সেট করা নেই এবং - বৈশিষ্ট্যটির জন্য একটি একক
domain_info
কাস্টম স্ট্যাটাস আছে
- "domain_info" নামের সাথে
- স্কিমা ক্ষেত্র:
COMPARATOR_LOW_NUM_EXAMPLES
- স্কিমা ক্ষেত্র:
-
schema.dataset_constraints.num_examples_drift_comparator.min_fraction_threshold
-
schema.dataset_constraints.num_examples_version_comparator.min_fraction_threshold
-
- পরিসংখ্যান ক্ষেত্র:
-
num_examples
*
-
- সনাক্তকরণ শর্ত:
-
num_examples
* > 0 এবং - পূর্ববর্তী পরিসংখ্যান প্রোটো উপলব্ধ এবং
-
num_examples
* / আগের পরিসংখ্যানnum_examples
* < comparatormin_fraction_threshold
-
- স্কিমা ক্ষেত্র:
COMPARATOR_HIGH_NUM_EXAMPLES
- স্কিমা ক্ষেত্র:
-
schema.dataset_constraints.num_examples_drift_comparator.max_fraction_threshold
-
schema.dataset_constraints.num_examples_version_comparator.max_fraction_threshold
-
- পরিসংখ্যান ক্ষেত্র:
-
num_examples
*
-
- সনাক্তকরণ শর্ত:
-
num_examples
* > 0 এবং - পূর্ববর্তী পরিসংখ্যান প্রোটো উপলব্ধ এবং
-
num_examples
* / আগের পরিসংখ্যানnum_examples
* > comparatormax_fraction_threshold
-
- স্কিমা ক্ষেত্র:
DATASET_LOW_NUM_EXAMPLES
- স্কিমা ক্ষেত্র:
-
schema.dataset_constraints.min_examples_count
-
- পরিসংখ্যান ক্ষেত্র:
-
num_examples
*
-
- সনাক্তকরণ শর্ত:
-
num_examples
* <dataset_constraints.min_examples_count
-
- স্কিমা ক্ষেত্র:
DATASET_HIGH_NUM_EXAMPLES
- স্কিমা ক্ষেত্র:
-
schema.dataset_constraints.max_examples_count
-
- পরিসংখ্যান ক্ষেত্র:
-
num_examples
*
-
- সনাক্তকরণ শর্ত:
-
num_examples
* >dataset_constraints.max_examples_count
-
- স্কিমা ক্ষেত্র:
WEIGHTED_FEATURE_NAME_COLLISION
- স্কিমা ক্ষেত্র:
-
weighted_feature.name
-
weighted_feature.lifecycle_stage
-
sparse_feature.name
-
sparse_feature.lifecycle_stage
-
feature.name
-
feature.lifecycle_stage
-
- সনাক্তকরণ শর্ত:
-
weighted_feature.lifecycle_stage
!=PLANNED
,ALPHA
,DEBUG
, অথবাDEPRECATED
এবং হয়- যদি
feature.lifecycle_stage
!=PLANNED
,ALPHA
,DEBUG
, বাDEPRECATED
,-
weighted_feature.name
==feature.name
; বা
-
- যদি
sparse_feature.lifecycle_stage
!=PLANNED
,ALPHA
,DEBUG
, বাDEPRECATED
,-
weighted_feature.name
==sparse_feature.name
-
- যদি
-
- স্কিমা ক্ষেত্র:
WEIGHTED_FEATURE_MISSING_VALUE
- স্কিমা ক্ষেত্র:
-
weighted_feature.feature
-
- পরিসংখ্যান ক্ষেত্র:
-
features.custom_stats
-
- সনাক্তকরণ শর্ত:
- নাম হিসেবে "missing_value" সহ
features.custom_stats
এবং -
missing_value
কাস্টম স্ট্যাটাস != 0
- নাম হিসেবে "missing_value" সহ
- স্কিমা ক্ষেত্র:
WEIGHTED_FEATURE_MISSING_WEIGHT
- স্কিমা ক্ষেত্র:
-
weighted_feature.weight_feature
-
- পরিসংখ্যান ক্ষেত্র:
-
features.custom_stats
-
- সনাক্তকরণ শর্ত:
- নাম হিসেবে "missing_weight" সহ
features.custom_stats
এবং -
missing_weight
কাস্টম স্ট্যাটাস!= 0
- নাম হিসেবে "missing_weight" সহ
- স্কিমা ক্ষেত্র:
WEIGHTED_FEATURE_LENGTH_MISMATCH
- স্কিমা ক্ষেত্র:
-
weighted_feature.feature
-
weighted_feature.weight_feature
-
- পরিসংখ্যান ক্ষেত্র:
-
features.custom_stats
-
- সনাক্তকরণ শর্ত:
- নাম হিসেবে "min_weighted_length_diff" বা "max_weight_length_diff" সহ
features.custom_stats
, এবং -
min_weight_length_diff
বাmax_weight_length_diff
কাস্টম স্ট্যাট != 0
- নাম হিসেবে "min_weighted_length_diff" বা "max_weight_length_diff" সহ
- স্কিমা ক্ষেত্র:
VALUE_NESTEDNESS_MISMATCH
- স্কিমা ক্ষেত্র:
-
feature.value_count
-
feature.value_counts
-
- পরিসংখ্যান ক্ষেত্র:
-
features.common_stats.presence_and_valency_stats
-
- সনাক্তকরণ শর্ত:
-
feature.value_count
নির্দিষ্ট করা আছে, এবং বৈশিষ্ট্যটির পুনরাবৃত্তpresence_and_valency_stats
রয়েছে (যা একটি নেস্টেডনেস লেভেল নির্দেশ করে যা একের বেশি) এবং -
feature.value_counts
নির্দিষ্ট করা আছে, এবং বৈশিষ্ট্যটিরpresence_and_valency_stats
যতবার পুনরাবৃত্তি করা হয়েছে তার সাথেfeature.value_counts
এর মধ্যেvalue_count
পুনরাবৃত্তির সংখ্যার সাথে মেলে না
-
- স্কিমা ক্ষেত্র:
DOMAIN_INVALID_FOR_TYPE
- স্কিমা ক্ষেত্র:
-
feature.type
-
feature.domain_info
-
- পরিসংখ্যান ক্ষেত্র:
-
features.type
-
- সনাক্তকরণ শর্ত:
- যদি
features.type
==BYTES
,-
feature.domain_info
একটি বেমানান ধরনের; বা
-
- if
features.type
!=BYTES
,-
feature.domain_info
feature.type
সাথে মেলে না (যেমন,int_domain
নির্দিষ্ট করা আছে, কিন্তু বৈশিষ্ট্যেরtype
হলFLOAT
)
-
- যদি
- স্কিমা ক্ষেত্র:
FEATURE_MISSING_NAME
- স্কিমা ক্ষেত্র:
-
feature.name
-
- সনাক্তকরণ শর্ত:
-
feature.name
নির্দিষ্ট করা নেই
-
- স্কিমা ক্ষেত্র:
FEATURE_MISSING_TYPE
- স্কিমা ক্ষেত্র:
-
feature.type
-
- সনাক্তকরণ শর্ত:
-
feature.type
নির্দিষ্ট করা নেই
-
- স্কিমা ক্ষেত্র:
INVALID_SCHEMA_SPECIFICATION
- স্কিমা ক্ষেত্র:
-
feature.domain_info
-
feature.presence.min_fraction
-
feature.value_count.min
-
feature.value_count.max
-
feature.distribution_constraints
-
- সনাক্তকরণ শর্ত:
-
feature.presence.min_fraction
< 0.0 বা > 1.0, বা -
feature.value_count.min
< 0 বা >feature.value_count.max
, বা - একটি bool, int, float, struct, বা শব্দার্থিক ডোমেন একটি বৈশিষ্ট্যের জন্য নির্দিষ্ট করা হয় এবং বৈশিষ্ট্যের জন্য নির্দিষ্ট করা হয়
feature.distribution_constraints
ও সেই বৈশিষ্ট্যের জন্য নির্দিষ্ট করা হয়, অথবা -
feature.distribution_constraints
একটি বৈশিষ্ট্যের জন্য নির্দিষ্ট করা হয়েছে, কিন্তু সেই বৈশিষ্ট্যের জন্য স্কিমা-স্তরের ডোমেন বাfeature.string_domain
কোনোটিই নির্দিষ্ট করা নেই
-
- স্কিমা ক্ষেত্র:
INVALID_DOMAIN_SPECIFICATION
- স্কিমা ক্ষেত্র:
-
feature.domain_info
-
feature.bool_domain
-
feature.string_domain
-
- সনাক্তকরণ শর্ত:
- অজানা
feature.domain_info
টাইপ নির্দিষ্ট করা হয়েছে বা -
feature.domain
নির্দিষ্ট করা আছে, কিন্তু স্কিমা লেভেলে কোনো মিলিত ডোমেন নির্দিষ্ট করা নেই, বা - যদি
feature.bool_domain
,feature.bool_domain.true_value
, এবংfeature.bool_domain.false_value
নির্দিষ্ট করা থাকে,-
feature.bool_domain.true_value
==feature.bool_domain.false_value
, বা
-
- যদি
feature.string_domain
নির্দিষ্ট করা থাকে,- সদৃশ
feature.string_domain.values
আছে বা -
feature.string_domain
সর্বাধিক আকার অতিক্রম করে
- সদৃশ
- অজানা
- স্কিমা ক্ষেত্র:
UNEXPECTED_DATA_TYPE
- স্কিমা ক্ষেত্র:
-
feature.type
-
- পরিসংখ্যান ক্ষেত্র:
-
features.type
-
- সনাক্তকরণ শর্ত:
-
features.type
feature.type
এ উল্লেখিত টাইপের নয়
-
- স্কিমা ক্ষেত্র:
SEQUENCE_VALUE_TOO_FEW_OCCURRENCES
- স্কিমা ক্ষেত্র:
-
feature.natural_language_domain.token_constraints.min_per_sequence
-
- পরিসংখ্যান ক্ষেত্র:
-
features.custom_stats.nl_statistics.token_statistics.per_sequence_min_frequency
-
- সনাক্তকরণ শর্ত:
-
min_per_sequence
>per_sequence_min_frequency
-
- স্কিমা ক্ষেত্র:
SEQUENCE_VALUE_TOO_MANY_OCCURRENCES
- স্কিমা ক্ষেত্র:
-
feature.natural_language_domain.token_constraints.max_per_sequence
-
- পরিসংখ্যান ক্ষেত্র:
-
features.custom_stats.nl_statistics.token_statistics.per_sequence_max_frequency
-
- সনাক্তকরণ শর্ত:
-
max_per_sequence
<per_sequence_max_frequency
-
- স্কিমা ক্ষেত্র:
SEQUENCE_VALUE_TOO_SMALL_FRACTION
- স্কিমা ক্ষেত্র:
-
feature.natural_language_domain.token_constraints.min_fraction_of_sequences
-
- পরিসংখ্যান ক্ষেত্র:
-
features.custom_stats.nl_statistics.token_statistics.fraction_of_sequences
-
- সনাক্তকরণ শর্ত:
-
min_fraction_of_sequences
>fraction_of_sequences
-
- স্কিমা ক্ষেত্র:
SEQUENCE_VALUE_TOO_LARGE_FRACTION
- স্কিমা ক্ষেত্র:
-
feature.natural_language_domain.token_constraints.max_fraction_of_sequences
-
- পরিসংখ্যান ক্ষেত্র:
-
features.custom_stats.nl_statistics.token_statistics.fraction_of_sequences
-
- সনাক্তকরণ শর্ত:
-
max_fraction_of_sequences
<fraction_of_sequences
-
- স্কিমা ক্ষেত্র:
FEATURE_COVERAGE_TOO_LOW
- স্কিমা ক্ষেত্র:
-
feature.natural_language_domain.coverage.min_coverage
-
- পরিসংখ্যান ক্ষেত্র:
-
features.custom_stats.nl_statistics.feature_coverage
-
- সনাক্তকরণ শর্ত:
-
feature_coverage
<coverage.min_coverage
-
- স্কিমা ক্ষেত্র:
FEATURE_COVERAGE_TOO_SHORT_AVG_TOKEN_LENGTH
- স্কিমা ক্ষেত্র:
-
feature.natural_language_domain.coverage.min_avg_token_length
-
- পরিসংখ্যান ক্ষেত্র:
-
features.custom_stats.nl_statistics.avg_token_length
-
- সনাক্তকরণ শর্ত:
-
avg_token_length
<min_avg_token_length
-
- স্কিমা ক্ষেত্র:
NLP_WRONG_LOCATION
- TFDV-এ অসঙ্গতির ধরন শনাক্ত হয়নি
EMBEDDING_SHAPE_INVALID
- TFDV-এ অসঙ্গতির ধরন শনাক্ত হয়নি
MAX_IMAGE_BYTE_SIZE_EXCEEDED
- স্কিমা ক্ষেত্র:
-
feature.image_domain.max_image_byte_size
-
- পরিসংখ্যান ক্ষেত্র:
-
features.bytes_stats.max_num_bytes_int
-
- সনাক্তকরণ শর্ত:
-
max_num_bytes_int
>max_image_byte_size
-
- স্কিমা ক্ষেত্র:
INVALID_FEATURE_SHAPE
- স্কিমা ক্ষেত্র:
-
feature.shape
-
- পরিসংখ্যান ক্ষেত্র:
-
features.common_stats.num_missing
-
features.common_stats.min_num_values
-
features.common_stats.max_num_values
-
features.common_stats.presence_and_valency_stats.num_missing
-
features.common_stats.presence_and_valency_stats.min_num_values
-
features.common_stats.presence_and_valency_stats.max_num_values
-
features.common_stats.weighted_presence_and_valency_stats
-
- সনাক্তকরণ শর্ত:
-
feature.shape
নির্দিষ্ট করা আছে, এবং হয়- বৈশিষ্ট্যটি অনুপস্থিত হতে পারে (
num_missing
!= 0) কিছু নেস্ট স্তরে বা - বৈশিষ্ট্যটিতে কিছু নেস্ট স্তরে মানগুলির পরিবর্তনশীল সংখ্যা থাকতে পারে (
min_num_values
!=max_num_values
) বা - নির্দিষ্ট আকৃতি বৈশিষ্ট্যের মান গণনা পরিসংখ্যানের সাথে সামঞ্জস্যপূর্ণ নয়৷ উদাহরণস্বরূপ, আকৃতি
[16]
(min_num_values
==max_num_values
==[2, 2, 4]
(3-নেস্টেড বৈশিষ্ট্যের জন্য) এর সাথে সামঞ্জস্যপূর্ণ
- বৈশিষ্ট্যটি অনুপস্থিত হতে পারে (
-
- স্কিমা ক্ষেত্র:
STATS_NOT_AVAILBLE
- সীমাবদ্ধতা যাচাই করার জন্য প্রয়োজনীয় পরিসংখ্যান উপস্থিত না থাকলে অসঙ্গতি ঘটে।
DERIVED_FEATURE_BAD_LIFECYCLE
- স্কিমা ক্ষেত্র:
-
feature.lifecycle_stage
-
- পরিসংখ্যান ক্ষেত্র:
-
features.validation_derived_source
-
- সনাক্তকরণ শর্ত:
-
feature.lifecycle_stage
DERIVED
বাDISABLED
এর মধ্যে একটি নয়, এবংfeatures.validation_derived_source
উপস্থিত রয়েছে, যা নির্দেশ করে যে এটি একটি উদ্ভূত বৈশিষ্ট্য।
-
- স্কিমা ক্ষেত্র:
DERIVED_FEATURE_INVALID_SOURCE
- স্কিমা ক্ষেত্র:
-
feature.validation_derived_source
-
- পরিসংখ্যান ক্ষেত্র:
-
features.validation_derived_source
-
- সনাক্তকরণ শর্ত:
-
features.validation_derived_source
একটি বৈশিষ্ট্যের জন্য উপস্থিত আছে, কিন্তু সংশ্লিষ্টfeature.validation_derived_source
নেই।
-
- স্কিমা ক্ষেত্র:
* যদি এই ক্ষেত্রের জন্য একটি ওজনযুক্ত পরিসংখ্যান উপলব্ধ থাকে, তবে এটি অ-ওজন পরিসংখ্যানের পরিবর্তে ব্যবহার করা হবে।