توضح هذه الصفحة التوقيعات المشتركة التي ينبغي تنفيذها من قبل وحدات في شكل TF1 محور للمهام التي يقبل مدخلات النص. (بالنسبة لل شكل TF2 SavedModel ، راجع مماثل API SavedModel ).
ناقل ميزة النص
وحدة نمطية ناقلات ميزة النص يخلق التمثيل ناقلات كثيفة من ميزات النص. ما وافق على مجموعة من سلاسل من شكل [batch_size]
وخرائط لهم ل float32
موتر من شكل [batch_size, N]
. هذا وغالبا ما تسمى النص التضمين في البعد N
.
الاستخدام الأساسي
embed = hub.Module("path/to/module")
representations = embed([
"A long sentence.",
"single-word",
"http://example.com"])
استخدام عمود الميزة
feature_columns = [
hub.text_embedding_column("comment", "path/to/module", trainable=False),
]
input_fn = tf.estimator.inputs.numpy_input_fn(features, labels, shuffle=True)
estimator = tf.estimator.DNNClassifier(hidden_units, feature_columns)
estimator.train(input_fn, max_steps=100)
ملحوظات
تم تدريب الوحدات مسبقًا على مجالات و / أو مهام مختلفة ، وبالتالي لن تكون كل وحدة متجه لميزة النص مناسبة لمشكلتك. على سبيل المثال: ربما تم تدريب بعض الوحدات على لغة واحدة.
لا تسمح هذه الواجهة بضبط تمثيل النص على TPU ، لأنها تتطلب من الوحدة إنشاء مثيل لكل من معالجة السلسلة والمتغيرات القابلة للتدريب في نفس الوقت.