עזרה להגן על שונית המחסום הגדולה עם TensorFlow על Kaggle הצטרפו אתגר

המלצה

צפה ב- TensorFlow.org הפעל בגוגל קולאב צפה במקור ב- GitHub

המלצות אישיות נעשות בשימוש נרחב למגוון מקרי שימוש במכשירים ניידים, כגון אחזור תוכן מדיה, הצעת מוצרים לקניות והמלצה הבאה לאפליקציה. אם אתה מעוניין לספק המלצות בהתאמה אישית ביישום שלך תוך שמירה על פרטיות המשתמשים, אנו ממליצים לבחון את הדוגמה הבאה וערכת הכלים הבאה.

להתחיל

אנו מספקים יישום לדוגמא TensorFlow Lite המדגים כיצד להמליץ ​​על פריטים רלוונטיים למשתמשים באנדרואיד.

דוגמה לאנדרואיד

אם אתה משתמש בפלטפורמה שאינה אנדרואיד, או שאתה כבר מכיר את ממשקי ה- API של TensorFlow Lite, אתה יכול להוריד את מודל ההמלצה שלנו למתחילים.

הורד את דגם המתנע

אנו מספקים גם סקריפט אימונים ב- Github כדי לאמן את המודל שלך בצורה הניתנת להגדרה.

קוד אימונים

להבין את ארכיטקטורת המודל

אנו ממנפים ארכיטקטורת מודל מקודדת כפולה, עם מקודד הקשר לקידוד היסטוריית משתמשים רציפה וקודן תוויות לקידוד מועמד המלצה צפוי. הדמיון בין קידוד ההקשר לקידוד התוויות משמש כדי לייצג את הסבירות שהמועמד החזוי עונה על צרכי המשתמש.

שלוש טכניקות קידוד שונות של היסטוריית משתמשים עוקבות מספקות בסיס קוד זה:

  • מקודד תיקי-מילים (BOW): ממוצע הטביעה של פעילויות המשתמש מבלי להתחשב בסדר ההקשר.
  • מקודד רשת עצבית קונבנציונאלי (CNN): החלת שכבות מרובות של רשתות עצביות קונבולוציות ליצירת קידוד הקשר.
  • מקודד רשת עצבית חוזרת (RNN): החלת רשת עצבית חוזרת לקידוד רצף ההקשר.

כדי לדגמן כל פעילות משתמש נוכל להשתמש במזהה של פריט הפעילות (מבוסס-ID), או בתכונות מרובות של הפריט (מבוסס-תכונה), או בשילוב של שניהם. המודל מבוסס התכונה המשתמש בתכונות מרובות לקידוד קולקטיבי של התנהגות המשתמשים. עם בסיס קוד זה, תוכל ליצור מודלים מבוססי זהות או מבוססי תכונות בצורה הניתנת להגדרה.

לאחר האימון, יוצא דגם TensorFlow Lite שיוכל לספק ישירות תחזיות מה- K בקרב המועמדים להמלצה.

השתמש בנתוני האימון שלך

בנוסף למודל המאומן, אנו מספקים ערכת כלים פתוחה ב- GitHub לאימון מודלים עם הנתונים שלך. אתה יכול לעקוב אחר הדרכה זו כדי ללמוד כיצד להשתמש בערכת הכלים ולפרוס מודלים מאומנים ביישומים ניידים משלך.

אנא עקוב אחר הדרכה זו כדי ליישם את אותה הטכניקה בה השתמשו כאן לאימון מודל המלצה באמצעות מערכי הנתונים שלך.

דוגמאות

כדוגמאות הכשרנו מודלים של המלצות בגישה מבוססת-זהות וגישות מבוססות-תכונה. המודל המבוסס על מזהה לוקח רק את מזהי הסרט כקלט, והמודל מבוסס התכונה לוקח גם את מזהי הסרט וגם את מזהי הז'אנר של הסרט כתשומות. אנא מצא את דוגמאות הכניסות והיציאות הבאות.

תשומות

  • מזהי סרטים בהקשר:

    • מלך האריות (ID: 362)
    • סיפור צעצוע (מזהה: 1)
    • (ועוד)
  • מזהי ז'אנר של סרטי הקשר:

    • אנימציה (מזהה: 15)
    • ילדים (תעודת זהות: 9)
    • מחזמר (מזהה: 13)
    • אנימציה (מזהה: 15)
    • ילדים (תעודת זהות: 9)
    • קומדיה (מזהה: 2)
    • (ועוד)

יציאות:

  • מזהי סרטים מומלצים:
    • צעצוע של סיפור 2 (מזהה: 3114)
    • (ועוד)

אמות מידה לביצועים

מספרי ביצועים מיוצרים בעזרת הכלי המתואר כאן .

שם המודל גודל הדגם התקן מעבד
המלצה (מזהה סרט כקלט) 0.52 Mb פיקסל 3 0.09ms *
פיקסל 4 0.05ms *
המלצה (מזהה סרט וז'אנר הסרט כתשומות) 1.3 Mb פיקסל 3 0.13ms *
פיקסל 4 0.06ms *

* 4 חוטים בשימוש.

השתמש בנתוני האימון שלך

בנוסף למודל המאומן, אנו מספקים ערכת כלים מקורית ב- GitHub לאימון מודלים עם הנתונים שלך. אתה יכול לעקוב אחר הדרכה זו כדי ללמוד כיצד להשתמש בערכת הכלים ולפרוס מודלים מאומנים ביישומים ניידים משלך.

אנא עקוב אחר הדרכה זו כדי ליישם את אותה הטכניקה בה השתמשו כאן לאימון מודל המלצה באמצעות מערכי הנתונים שלך.

טיפים להתאמה אישית של מודלים עם הנתונים שלך

המודל המאומן מראש המשולב ביישום הדגמה זה מאומן במערך הנתונים של MovieLens , ייתכן שתרצה לשנות את תצורת המודל על סמך נתונים משלך, כגון גודל אוצר מילים, העמדת העמדות ואורך הקשר קלט. להלן מספר טיפים:

  • אורך הקשר קלט: אורך הקשר הקלט הטוב ביותר משתנה עם מערכי הנתונים. אנו מציעים לבחור אורך הקשר קלט בהתבסס על כמה אירועי תווית קשורים לתחומי עניין ארוכי טווח לעומת הקשר לטווח קצר.

  • בחירת סוג מקודד: אנו מציעים לבחור סוג מקודד על בסיס אורך הקשר הקלט. מקודד תיקי-מילים עובד היטב לאורך הקלט הקצר של קלט (למשל <10), מקודדי CNN ו- RNN מביאים יכולת סיכום רבה יותר לאורך הקלט הקלט ארוך.

  • שימוש בתכונות הבסיסיות לייצוג פריטים או פעילויות משתמש יכול לשפר את ביצועי הדגם, להתאים טוב יותר לפריטים טריים, אולי למטה להטביע רווחים בהיקף המידה ומכאן להפחית את צריכת הזיכרון ויותר ידידותי על המכשיר.