التواقيع المشتركة للنص

توضح هذه الصفحة التوقيعات المشتركة التي ينبغي تنفيذها من قبل وحدات في شكل TF1 محور للمهام التي يقبل مدخلات النص. (بالنسبة لل شكل TF2 SavedModel ، راجع مماثل API SavedModel ).

ناقل ميزة النص

وحدة نمطية ناقلات ميزة النص يخلق التمثيل ناقلات كثيفة من ميزات النص. ما وافق على مجموعة من سلاسل من شكل [batch_size] وخرائط لهم ل float32 موتر من شكل [batch_size, N] . هذا وغالبا ما تسمى النص التضمين في البعد N .

الاستخدام الأساسي

  embed = hub.Module("path/to/module")
  representations = embed([
      "A long sentence.",
      "single-word",
      "http://example.com"])

استخدام عمود الميزة

    feature_columns = [
      hub.text_embedding_column("comment", "path/to/module", trainable=False),
    ]
    input_fn = tf.estimator.inputs.numpy_input_fn(features, labels, shuffle=True)
    estimator = tf.estimator.DNNClassifier(hidden_units, feature_columns)
    estimator.train(input_fn, max_steps=100)

ملحوظات

تم تدريب الوحدات مسبقًا على مجالات و / أو مهام مختلفة ، وبالتالي لن تكون كل وحدة متجه لميزة النص مناسبة لمشكلتك. على سبيل المثال: ربما تم تدريب بعض الوحدات على لغة واحدة.

لا تسمح هذه الواجهة بضبط تمثيل النص على TPU ، لأنها تتطلب من الوحدة إنشاء مثيل لكل من معالجة السلسلة والمتغيرات القابلة للتدريب في نفس الوقت.