ترجمت واجهة Cloud Translation API‏ هذه الصفحة.
Switch to English

مكون خط أنابيب SchemaGen TFX

تستخدم بعض مكونات TFX وصفًا لبيانات الإدخال الخاصة بك يسمى مخطط . مخطط قاعدة البيانات هو مثيل لـ schema.proto . يمكنه تحديد أنواع البيانات لقيم المعالم ، وما إذا كان يجب أن تكون الميزة موجودة في جميع الأمثلة ، ونطاقات القيم المسموح بها ، وخصائص أخرى. سيقوم مكون خط أنابيب SchemaGen تلقائيًا بإنشاء مخطط من خلال استنتاج الأنواع والفئات والنطاقات من بيانات التدريب.

  • يستهلك: إحصائيات من مكون StatisticsGen
  • ينبعث: مخطط البيانات الأولي

هذا مقتطف من مخطط أولي:

...
feature {
  name: "age"
  value_count {
    min: 1
    max: 1
  }
  type: FLOAT
  presence {
    min_fraction: 1
    min_count: 1
  }
}
feature {
  name: "capital-gain"
  value_count {
    min: 1
    max: 1
  }
  type: FLOAT
  presence {
    min_fraction: 1
    min_count: 1
  }
}
...

تستخدم مكتبات TFX التالية المخطط:

  • التحقق من صحة بيانات TensorFlow
  • تحويل TensorFlow
  • تحليل نموذج TensorFlow

في خط أنابيب TFX نموذجي ، ينشئ SchemaGen مخططًا ، تستهلكه مكونات خط الأنابيب الأخرى.

التحقق من صحة بيانات SchemaGen و TensorFlow

يستخدم SchemaGen بشكل مكثف التحقق من صحة بيانات TensorFlow لاستنتاج مخطط.

باستخدام مكون SchemaGen

عادةً ما يكون من السهل جدًا نشر مكون خط أنابيب SchemaGen ويتطلب القليل من التخصيص. يبدو الرمز النموذجي كما يلي:

from tfx import components

...

infer_schema = components.SchemaGen(
    statistics=compute_training_stats.outputs['statistics'])