การจัดประเภทข้อความ

ใช้โมเดล TensorFlow Lite เพื่อจัดหมวดหมู่ย่อหน้าออกเป็นกลุ่มที่กำหนดไว้ล่วงหน้า

เริ่ม

หากคุณยังใหม่กับ TensorFlow Lite และกำลังทำงานกับ Android เราขอแนะนำให้สำรวจคำแนะนำของ TensorFlow Lite Task Library เพื่อรวมโมเดลการจัดหมวดหมู่ข้อความไว้ภายในโค้ดเพียงไม่กี่บรรทัด คุณยังสามารถผสานรวมโมเดลโดยใช้ TensorFlow Lite Interpreter Java API

ตัวอย่าง Android ด้านล่างสาธิตการใช้งานทั้งสองวิธีเป็น lib_task_api และ lib_reapter ตามลำดับ

ตัวอย่างหุ่นยนต์

หากคุณใช้แพลตฟอร์มอื่นที่ไม่ใช่ Android หรือคุ้นเคยกับ TensorFlow Lite API อยู่แล้ว คุณสามารถดาวน์โหลดโมเดลการจัดหมวดหมู่ข้อความเริ่มต้นของเราได้

ดาวน์โหลดโมเดลเริ่มต้น

มันทำงานอย่างไร

การจัดหมวดหมู่ข้อความจะจัดหมวดหมู่ย่อหน้าออกเป็นกลุ่มที่กำหนดไว้ล่วงหน้าตามเนื้อหา

แบบจำลองที่ได้รับการฝึกล่วงหน้านี้จะคาดการณ์ว่าความคิดเห็นของย่อหน้านั้นเป็นเชิงบวกหรือเชิงลบ ได้รับการฝึกอบรมเกี่ยวกับ ชุดข้อมูลบทวิจารณ์ภาพยนตร์ขนาดใหญ่ v1.0 จาก Mass และคณะ ซึ่งประกอบด้วยบทวิจารณ์ภาพยนตร์ IMDB ที่มีป้ายกำกับว่าเป็นบวกหรือลบ

ต่อไปนี้เป็นขั้นตอนในการจำแนกย่อหน้าด้วยโมเดล:

  1. โทเค็นย่อหน้าและแปลงเป็นรายการรหัสคำโดยใช้คำศัพท์ที่กำหนดไว้ล่วงหน้า
  2. ป้อนรายการให้กับโมเดล TensorFlow Lite
  3. รับความน่าจะเป็นของย่อหน้าที่เป็นค่าบวกหรือลบจากผลลัพธ์ของแบบจำลอง

บันทึก

  • รองรับเฉพาะภาษาอังกฤษเท่านั้น
  • โมเดลนี้ได้รับการฝึกอบรมเกี่ยวกับชุดข้อมูลบทวิจารณ์ภาพยนตร์ ดังนั้นคุณอาจพบว่ามีความแม่นยำลดลงเมื่อจัดประเภทข้อความของโดเมนอื่น

เกณฑ์มาตรฐานประสิทธิภาพ

หมายเลขเกณฑ์มาตรฐานประสิทธิภาพสร้างขึ้นด้วยเครื่องมือ ที่อธิบายไว้ที่นี่

ชื่อรุ่น ขนาดโมเดล อุปกรณ์ ซีพียู
การจำแนกข้อความ 0.6 ลบ พิกเซล 3 (Android 10) 0.05ms*
พิกเซล 4 (Android 10) 0.05ms*
iPhone XS (iOS 12.4.1) 0.025ms**

* ใช้ 4 เธรด

** ใช้ 2 เธรดบน iPhone เพื่อผลลัพธ์ประสิทธิภาพที่ดีที่สุด

ตัวอย่างเอาต์พุต

ข้อความ เชิงลบ (0) แง่บวก (1)
นี่คือภาพยนตร์ที่ดีที่สุดที่ฉันเคยดูในช่วงไม่กี่ปีที่ผ่านมา ขอแนะนำอย่างยิ่ง! 25.3% 74.7%
เสียเวลาของฉันจริงๆ 72.5% 27.5%

ใช้ชุดข้อมูลการฝึกอบรมของคุณ

ทำตาม บทช่วยสอน นี้เพื่อใช้เทคนิคเดียวกับที่ใช้ในที่นี่เพื่อฝึกโมเดลการจัดหมวดหมู่ข้อความโดยใช้ชุดข้อมูลของคุณเอง ด้วยชุดข้อมูลที่ถูกต้อง คุณสามารถสร้างแบบจำลองสำหรับกรณีการใช้งาน เช่น การจัดหมวดหมู่เอกสารหรือการตรวจจับความคิดเห็นที่เป็นพิษ

อ่านเพิ่มเติมเกี่ยวกับการจัดประเภทข้อความ