סיווג טקסט

השתמש במודל TensorFlow Lite כדי לקטלג פסקה לקבוצות מוגדרות מראש.

להתחיל

אם אתה חדש ב-TensorFlow Lite ועובד עם אנדרואיד, אנו ממליצים לחקור את המדריך של ספריית המשימות של TensorFLow Lite כדי לשלב מודלים של סיווג טקסט בתוך מספר שורות קוד בלבד. אתה יכול גם לשלב את המודל באמצעות TensorFlow Lite Interpreter Java API .

הדוגמה של Android למטה מדגימה את היישום עבור שתי השיטות כמו lib_task_api ו- lib_interpreter , בהתאמה.

דוגמה לאנדרואיד

אם אתה משתמש בפלטפורמה שאינה אנדרואיד, או שאתה כבר מכיר את ממשקי API של TensorFlow Lite, אתה יכול להוריד את מודל סיווג הטקסט המתחיל שלנו.

הורד את דגם המתחיל

איך זה עובד

סיווג טקסט מחלק פסקה לקבוצות מוגדרות מראש על סמך התוכן שלה.

מודל מיומן מראש זה מנבא אם הסנטימנט של פסקה חיובי או שלילי. הוא הוכשר ב- Large Movie Review Dataset v1.0 מבית Mass et al, המורכב מביקורות סרטים IMDB המסומנות כחיוביות או שליליות.

להלן השלבים לסיווג פסקה עם המודל:

  1. אסימן את הפסקה והמר אותה לרשימה של מזהי מילים באמצעות אוצר מילים מוגדר מראש.
  2. הזינו את הרשימה לדגם TensorFlow Lite.
  3. קבל את ההסתברות שהפסקה תהיה חיובית או שלילית מתפוקות המודל.

הערה

  • רק אנגלית נתמכת.
  • מודל זה הוכשר על מערך נתונים של ביקורות סרטים, כך שאתה עשוי לחוות דיוק מופחת בעת סיווג טקסט של דומיינים אחרים.

מדדי ביצועים

מספרי אמת מידה לביצועים נוצרים עם הכלי המתואר כאן .

שם המודל גודל הדגם התקן מעבד
סיווג טקסט 0.6 מגה-ביט Pixel 3 (אנדרואיד 10) 0.05ms*
Pixel 4 (אנדרואיד 10) 0.05ms*
iPhone XS (iOS 12.4.1) 0.025ms**

* 4 חוטים בשימוש.

** 2 שרשורים בשימוש באייפון לקבלת תוצאת הביצועים הטובה ביותר.

פלט לדוגמה

טֶקסט שלילי (0) חיובי (1)
זה הסרט הכי טוב שראיתי בשנים האחרונות. ממליץ עליו בחום! 25.3% 74.7%
איזה בזבוז זמן שלי. 72.5% 27.5%

השתמש במערך הנתונים של ההדרכה שלך

עקוב אחר מדריך זה כדי ליישם את אותה טכניקה המשמשת כאן כדי להכשיר מודל סיווג טקסט באמצעות מערכי נתונים משלך. עם מערך הנתונים הנכון, אתה יכול ליצור מודל למקרי שימוש כגון סיווג מסמכים או זיהוי הערות רעילות.

קרא עוד על סיווג טקסט