نظرة عامة على تصنيف TensorFlow ، نظرة عامة على تصنيف TensorFlow

تساعدك مكتبة تصنيف TensorFlow على بناء تعلم قابل للتطوير لتصنيف نماذج التعلم الآلي باستخدام أساليب وتقنيات راسخة من الأبحاث الحديثة. يأخذ نموذج الترتيب قائمة بالعناصر المتشابهة ، مثل صفحات الويب ، ويُنشئ قائمة محسّنة بهذه العناصر ، على سبيل المثال الأكثر صلة بالصفحات الأقل صلة. تعلم كيفية ترتيب النماذج له تطبيقات في البحث والإجابة على الأسئلة وأنظمة التوصية وأنظمة الحوار. يمكنك استخدام هذه المكتبة لتسريع بناء نموذج تصنيف لتطبيقك باستخدام Keras API . توفر مكتبة التصنيف أيضًا أدوات مساعدة لسير العمل لتسهيل توسيع نطاق تنفيذ النموذج الخاص بك للعمل بفعالية مع مجموعات البيانات الكبيرة باستخدام استراتيجيات المعالجة الموزعة.

تقدم هذه النظرة العامة ملخصًا موجزًا ​​لتطوير التعلم لترتيب النماذج مع هذه المكتبة ، وتقدم بعض التقنيات المتقدمة التي تدعمها المكتبة ، وتناقش أدوات سير العمل المقدمة لدعم المعالجة الموزعة لتطبيقات التصنيف.

تطوير التعلم لتصنيف النماذج

نموذج البناء باستخدام مكتبة تصنيف TensorFlow يتبع الخطوات العامة التالية:

  1. حدد وظيفة تسجيل النقاط باستخدام طبقات Keras ( tf.keras.layers )
  2. حدد المقاييس التي تريد استخدامها للتقييم ، مثل tfr.keras.metrics.NDCGMetric
  3. حدد دالة خسارة ، مثل tfr.keras.losses.SoftmaxLoss
  4. قم بتجميع النموذج باستخدام tf.keras.Model.compile() وقم بتدريبه باستخدام بياناتك

يرشدك البرنامج التعليمي "التوصية بالأفلام " خلال أساسيات بناء نموذج تعليمي لترتيب النماذج باستخدام هذه المكتبة. تحقق من قسم دعم التصنيف الموزع لمزيد من المعلومات حول بناء نماذج تصنيف واسعة النطاق.

تقنيات التصنيف المتقدمة

توفر مكتبة تصنيف TensorFlow الدعم لتطبيق تقنيات التصنيف المتقدمة التي تم بحثها وتنفيذها بواسطة باحثو ومهندسو Google. تقدم الأقسام التالية نظرة عامة على بعض هذه الأساليب وكيفية البدء في استخدامها في تطبيقك.

ترتيب إدخال قائمة BERT

توفر مكتبة التصنيف تطبيقًا لـ TFR-BERT ، وهي بنية تسجيل تجمع بين BERT ونمذجة LTR لتحسين ترتيب مدخلات القائمة. كتطبيق مثال لهذا الأسلوب ، ضع في اعتبارك استعلامًا وقائمة بعدد n من المستندات التي تريد ترتيبها استجابةً لهذا الاستعلام. بدلاً من تعلم تمثيل BERT الذي تم تسجيله بشكل مستقل عبر أزواج <query, document> ، تطبق نماذج LTR خسارة الترتيب لتعلم بشكل مشترك تمثيل BERT الذي يزيد من فائدة القائمة المصنفة بأكملها فيما يتعلق بتسميات الحقيقة الأساسية. يوضح الشكل التالي هذه التقنية:

TensorFlow Ranking BERT التخطيطي
الشكل 1 : مخطط هندسة BERT لترتيب TensorFlow يظهر نموذج LTR مشترك على قائمة عدد n من المستندات باستخدام تمثيلات BERT لأزواج <استعلام أو مستند> فردية.

يعمل هذا الأسلوب على تسوية قائمة المستندات لترتيبها استجابةً لاستعلام إلى قائمة من <query, document> مجموعات. يتم بعد ذلك إدخال هذه المجموعات في نموذج BERT للغة مدرب مسبقًا. يتم بعد ذلك ضبط مخرجات BERT المجمعة لقائمة المستندات بأكملها بشكل مشترك مع أحد خسائر التصنيف المتخصصة المتوفرة في TensorFlow Ranking.

يمكن أن تقدم هذه البنية تحسينات كبيرة في أداء نموذج اللغة المدربة مسبقًا ، مما ينتج عنه أداء متطور للعديد من مهام التصنيف الشائعة ، خاصةً عند دمج عدة نماذج لغوية سابقة التدريب. لمزيد من المعلومات حول هذه التقنية ، راجع البحث ذي الصلة. يمكنك البدء بتطبيق بسيط في مثال كود TensorFlow Ranking.

النماذج المضافة المعممة للتصنيف العصبي (GAM)

بالنسبة لبعض أنظمة التصنيف ، مثل تقييم الأهلية للقرض ، أو استهداف الإعلانات ، أو إرشادات العلاج الطبي ، تعتبر الشفافية وإمكانية الشرح من الاعتبارات الهامة. يمكن أن يساعد تطبيق النماذج المضافة المعممة (GAMs) مع عوامل الترجيح المفهومة جيدًا في أن يكون نموذج الترتيب الخاص بك أكثر قابلية للتفسير والتفسير.

تمت دراسة GAMs على نطاق واسع مع مهام الانحدار والتصنيف ، ولكن ليس من الواضح كيفية تطبيقها على تطبيق التصنيف. على سبيل المثال ، بينما يمكن تطبيق GAMs ببساطة لنمذجة كل عنصر فردي في القائمة ، فإن نمذجة تفاعلات العناصر والسياق الذي يتم فيه تصنيف هذه العناصر يمثل مشكلة أكثر صعوبة. يوفر ترتيب TensorFlow تطبيق التصنيف العصبي GAM ، وهو امتداد لنماذج مضافة معممة مصممة لمشاكل الترتيب. يتيح لك تطبيق ترتيب TensorFlow لألعاب GAM إضافة ترجيح معين إلى ميزات نموذجك.

يستخدم الرسم التوضيحي التالي لنظام تصنيف الفنادق الملاءمة والسعر والمسافة كميزات تصنيف أساسية. يطبق هذا النموذج تقنية GAM لوزن هذه الأبعاد بشكل مختلف ، بناءً على سياق جهاز المستخدم. على سبيل المثال ، إذا جاء طلب البحث من هاتف ، فسيتم ترجيح المسافة بشكل أكبر ، بافتراض أن المستخدمين يبحثون عن فندق قريب.

نموذج مضاف معمم لمثال الترتيب
الشكل 2 : تطبيق الترتيب العصبي GAM للبحث المحلي. لكل ميزة إدخال ، مثل السعر أو المسافة ، ينتج نموذج فرعي درجة فرعية يمكن فحصها ، مما يوفر الشفافية. يمكن استخدام ميزات السياق مثل نوع جهاز المستخدم لتحديد أوزان درجات النموذج الفرعي.

لمزيد من المعلومات حول استخدام GAMs مع نماذج الترتيب ، راجع البحث ذي الصلة. يمكنك البدء بتطبيق نموذج لهذه التقنية في مثال كود TensorFlow Ranking.

دعم الترتيب الموزع

تم تصميم ترتيب TensorFlow لبناء أنظمة تصنيف واسعة النطاق من البداية إلى النهاية: بما في ذلك معالجة البيانات وبناء النماذج والتقييم ونشر الإنتاج. يمكنه التعامل مع الميزات الكثيفة والمتفرقة غير المتجانسة ، وتوسيع نطاقه إلى ملايين نقاط البيانات ، وهو مصمم لدعم التدريب الموزع لتطبيقات التصنيف واسعة النطاق.

رسم تخطيطي لفئات تصنيف TensorFlow
الشكل 3 : رسم تخطيطي لفئات تصنيف TensorFlow لدعم المعالجة الموزعة. يمكن تخصيص الوحدات الخضراء لنموذج الترتيب الخاص بك.

توفر المكتبة تصميمًا محسنًا لخط أنابيب الترتيب ، لتجنب الكود المتكرر المعياري وإنشاء حلول موزعة يمكن تطبيقها من تدريب نموذج الترتيب الخاص بك إلى تقديمه. يدعم خط أنابيب التصنيف معظم استراتيجيات TensorFlow الموزعة ، بما في ذلك MirroredStrategy و TPUStrategy و MultiWorkerMirroredStrategy و ParameterServerStrategy . يمكن لخط أنابيب الترتيب تصدير نموذج التصنيف المدرَّب بتنسيق tf.saved_model ، والذي يدعم العديد من توقيعات الإدخال .. بالإضافة إلى ذلك ، يوفر خط أنابيب الترتيب عمليات رد اتصال مفيدة ، بما في ذلك دعم تصور بيانات TensorBoard و BackupAndRestore للمساعدة في التعافي من حالات الفشل على المدى الطويل عمليات التدريب.

تساعد مكتبة التصنيف في بناء تطبيق تدريب موزع من خلال توفير مجموعة من فئات tfr.keras.pipeline ، والتي تأخذ منشئ النماذج ومنشئ البيانات والمعلمات الفائقة كمدخلات. تمكّنك فئة tfr.keras.ModelBuilder المستندة إلى Keras من إنشاء نموذج للمعالجة الموزعة ، وتعمل مع فئات InputCreator و Preprocessor و Scorer القابلة للتوسيع:

تعمل فئات خطوط أنابيب TensorFlow Ranking أيضًا مع DatasetBuilder لإعداد بيانات التدريب ، والتي يمكن أن تتضمن معلمات تشعبية . أخيرًا ، يمكن أن يتضمن خط الأنابيب نفسه مجموعة من المعلمات الفائقة ككائن PipelineHparams .

ابدأ في بناء نماذج الترتيب الموزعة باستخدام البرنامج التعليمي للترتيب الموزع .

و

تساعدك مكتبة تصنيف TensorFlow على بناء تعلم قابل للتطوير لتصنيف نماذج التعلم الآلي باستخدام أساليب وتقنيات راسخة من الأبحاث الحديثة. يأخذ نموذج الترتيب قائمة بالعناصر المتشابهة ، مثل صفحات الويب ، ويُنشئ قائمة محسّنة بهذه العناصر ، على سبيل المثال الأكثر صلة بالصفحات الأقل صلة. تعلم كيفية ترتيب النماذج له تطبيقات في البحث والإجابة على الأسئلة وأنظمة التوصية وأنظمة الحوار. يمكنك استخدام هذه المكتبة لتسريع بناء نموذج تصنيف لتطبيقك باستخدام Keras API . توفر مكتبة التصنيف أيضًا أدوات مساعدة لسير العمل لتسهيل توسيع نطاق تنفيذ النموذج الخاص بك للعمل بفعالية مع مجموعات البيانات الكبيرة باستخدام استراتيجيات المعالجة الموزعة.

تقدم هذه النظرة العامة ملخصًا موجزًا ​​لتطوير التعلم لترتيب النماذج مع هذه المكتبة ، وتقدم بعض التقنيات المتقدمة التي تدعمها المكتبة ، وتناقش أدوات سير العمل المقدمة لدعم المعالجة الموزعة لتطبيقات التصنيف.

تطوير التعلم لتصنيف النماذج

نموذج البناء باستخدام مكتبة تصنيف TensorFlow يتبع الخطوات العامة التالية:

  1. حدد وظيفة تسجيل النقاط باستخدام طبقات Keras ( tf.keras.layers )
  2. حدد المقاييس التي تريد استخدامها للتقييم ، مثل tfr.keras.metrics.NDCGMetric
  3. حدد دالة خسارة ، مثل tfr.keras.losses.SoftmaxLoss
  4. قم بتجميع النموذج باستخدام tf.keras.Model.compile() وقم بتدريبه باستخدام بياناتك

يرشدك البرنامج التعليمي "التوصية بالأفلام " خلال أساسيات بناء نموذج تعليمي لترتيب النماذج باستخدام هذه المكتبة. تحقق من قسم دعم التصنيف الموزع لمزيد من المعلومات حول بناء نماذج تصنيف واسعة النطاق.

تقنيات التصنيف المتقدمة

توفر مكتبة تصنيف TensorFlow الدعم لتطبيق تقنيات التصنيف المتقدمة التي تم بحثها وتنفيذها بواسطة باحثو ومهندسو Google. تقدم الأقسام التالية نظرة عامة على بعض هذه الأساليب وكيفية البدء في استخدامها في تطبيقك.

ترتيب إدخال قائمة BERT

توفر مكتبة التصنيف تطبيقًا لـ TFR-BERT ، وهي بنية تسجيل تجمع بين BERT ونمذجة LTR لتحسين ترتيب مدخلات القائمة. كتطبيق مثال لهذا الأسلوب ، ضع في اعتبارك استعلامًا وقائمة بعدد n من المستندات التي تريد ترتيبها استجابةً لهذا الاستعلام. بدلاً من تعلم تمثيل BERT الذي تم تسجيله بشكل مستقل عبر أزواج <query, document> ، تطبق نماذج LTR خسارة الترتيب لتعلم بشكل مشترك تمثيل BERT الذي يزيد من فائدة القائمة المصنفة بأكملها فيما يتعلق بتسميات الحقيقة الأساسية. يوضح الشكل التالي هذه التقنية:

TensorFlow Ranking BERT التخطيطي
الشكل 1 : مخطط هندسة BERT لترتيب TensorFlow يظهر نموذج LTR مشترك على قائمة عدد n من المستندات باستخدام تمثيلات BERT لأزواج <استعلام أو مستند> فردية.

يعمل هذا الأسلوب على تسوية قائمة المستندات لترتيبها استجابةً لاستعلام إلى قائمة من <query, document> مجموعات. يتم بعد ذلك إدخال هذه المجموعات في نموذج BERT للغة مدرب مسبقًا. يتم بعد ذلك ضبط مخرجات BERT المجمعة لقائمة المستندات بأكملها بشكل مشترك مع أحد خسائر التصنيف المتخصصة المتوفرة في TensorFlow Ranking.

يمكن أن تقدم هذه البنية تحسينات كبيرة في أداء نموذج اللغة المدربة مسبقًا ، مما ينتج عنه أداء متطور للعديد من مهام التصنيف الشائعة ، خاصةً عند دمج عدة نماذج لغوية سابقة التدريب. لمزيد من المعلومات حول هذه التقنية ، راجع البحث ذي الصلة. يمكنك البدء بتطبيق بسيط في مثال كود TensorFlow Ranking.

النماذج المضافة المعممة للتصنيف العصبي (GAM)

بالنسبة لبعض أنظمة التصنيف ، مثل تقييم الأهلية للقرض ، أو استهداف الإعلانات ، أو إرشادات العلاج الطبي ، تعتبر الشفافية وإمكانية الشرح من الاعتبارات الهامة. يمكن أن يساعد تطبيق النماذج المضافة المعممة (GAMs) مع عوامل الترجيح المفهومة جيدًا في أن يكون نموذج الترتيب الخاص بك أكثر قابلية للتفسير والتفسير.

تمت دراسة GAMs على نطاق واسع مع مهام الانحدار والتصنيف ، ولكن ليس من الواضح كيفية تطبيقها على تطبيق التصنيف. على سبيل المثال ، بينما يمكن تطبيق GAMs ببساطة لنمذجة كل عنصر فردي في القائمة ، فإن نمذجة تفاعلات العناصر والسياق الذي يتم فيه تصنيف هذه العناصر يمثل مشكلة أكثر صعوبة. يوفر ترتيب TensorFlow تطبيق التصنيف العصبي GAM ، وهو امتداد لنماذج مضافة معممة مصممة لمشاكل الترتيب. يتيح لك تطبيق ترتيب TensorFlow لألعاب GAM إضافة ترجيح معين إلى ميزات نموذجك.

يستخدم الرسم التوضيحي التالي لنظام تصنيف الفنادق الملاءمة والسعر والمسافة كميزات تصنيف أساسية. يطبق هذا النموذج تقنية GAM لوزن هذه الأبعاد بشكل مختلف ، بناءً على سياق جهاز المستخدم. على سبيل المثال ، إذا جاء طلب البحث من هاتف ، فسيتم ترجيح المسافة بشكل أكبر ، بافتراض أن المستخدمين يبحثون عن فندق قريب.

نموذج مضاف معمم لمثال الترتيب
الشكل 2 : تطبيق الترتيب العصبي GAM للبحث المحلي. لكل ميزة إدخال ، مثل السعر أو المسافة ، ينتج نموذج فرعي درجة فرعية يمكن فحصها ، مما يوفر الشفافية. يمكن استخدام ميزات السياق مثل نوع جهاز المستخدم لتحديد أوزان درجات النموذج الفرعي.

لمزيد من المعلومات حول استخدام GAMs مع نماذج الترتيب ، راجع البحث ذي الصلة. يمكنك البدء بتطبيق نموذج لهذه التقنية في مثال كود TensorFlow Ranking.

دعم الترتيب الموزع

تم تصميم ترتيب TensorFlow لبناء أنظمة تصنيف واسعة النطاق من البداية إلى النهاية: بما في ذلك معالجة البيانات وبناء النماذج والتقييم ونشر الإنتاج. يمكنه التعامل مع الميزات الكثيفة والمتفرقة غير المتجانسة ، وتوسيع نطاقه إلى ملايين نقاط البيانات ، وهو مصمم لدعم التدريب الموزع لتطبيقات التصنيف واسعة النطاق.

رسم تخطيطي لفئات تصنيف TensorFlow
الشكل 3 : رسم تخطيطي لفئات تصنيف TensorFlow لدعم المعالجة الموزعة. يمكن تخصيص الوحدات الخضراء لنموذج الترتيب الخاص بك.

توفر المكتبة تصميمًا محسنًا لخط أنابيب الترتيب ، لتجنب الكود المتكرر المعياري وإنشاء حلول موزعة يمكن تطبيقها من تدريب نموذج الترتيب الخاص بك إلى تقديمه. يدعم خط أنابيب التصنيف معظم استراتيجيات TensorFlow الموزعة ، بما في ذلك MirroredStrategy و TPUStrategy و MultiWorkerMirroredStrategy و ParameterServerStrategy . يمكن لخط أنابيب الترتيب تصدير نموذج التصنيف المدرَّب بتنسيق tf.saved_model ، والذي يدعم العديد من توقيعات الإدخال .. بالإضافة إلى ذلك ، يوفر خط أنابيب الترتيب عمليات رد اتصال مفيدة ، بما في ذلك دعم تصور بيانات TensorBoard و BackupAndRestore للمساعدة في التعافي من حالات الفشل على المدى الطويل عمليات التدريب.

تساعد مكتبة التصنيف في بناء تطبيق تدريب موزع من خلال توفير مجموعة من فئات tfr.keras.pipeline ، والتي تأخذ منشئ النماذج ومنشئ البيانات والمعلمات الفائقة كمدخلات. تمكّنك فئة tfr.keras.ModelBuilder المستندة إلى Keras من إنشاء نموذج للمعالجة الموزعة ، وتعمل مع فئات InputCreator و Preprocessor و Scorer القابلة للتوسيع:

تعمل فئات خطوط أنابيب TensorFlow Ranking أيضًا مع DatasetBuilder لإعداد بيانات التدريب ، والتي يمكن أن تتضمن معلمات تشعبية . أخيرًا ، يمكن أن يتضمن خط الأنابيب نفسه مجموعة من المعلمات الفائقة ككائن PipelineHparams .

ابدأ في بناء نماذج الترتيب الموزعة باستخدام البرنامج التعليمي للترتيب الموزع .