การจัดประเภทข้อความ

ใช้แบบจำลอง TensorFlow Lite เพื่อจัดหมวดหมู่ย่อหน้าเป็นกลุ่มที่กำหนดไว้ล่วงหน้า

เริ่ม

หากคุณยังใหม่กับ TensorFlow Lite และกำลังทำงานกับ Android เราขอแนะนำให้สำรวจคำแนะนำของ ไลบรารีงาน TensorFLow Lite เพื่อรวมรูปแบบการจัดประเภทข้อความไว้ในโค้ดเพียงไม่กี่บรรทัด คุณยังสามารถรวมโมเดลโดยใช้ TensorFlow Lite Interpreter Java API

ตัวอย่าง Android ด้านล่างนี้แสดงให้เห็นถึงการใช้งานสำหรับทั้งสองวิธีเป็น lib_task_api และ lib_interpreter ตามลำดับ

ตัวอย่าง Android

หากคุณใช้แพลตฟอร์มอื่นที่ไม่ใช่ Android หรือคุ้นเคยกับ TensorFlow Lite API แล้วคุณสามารถดาวน์โหลดรูปแบบการจัดประเภทข้อความเริ่มต้นของเราได้

ดาวน์โหลดรุ่นเริ่มต้น

มันทำงานอย่างไร

การจัดประเภทข้อความจะจัดหมวดหมู่ย่อหน้าเป็นกลุ่มที่กำหนดไว้ล่วงหน้าตามเนื้อหา

แบบจำลองที่กำหนดไว้ล่วงหน้านี้คาดการณ์ว่าความเชื่อมั่นของย่อหน้าเป็นบวกหรือลบ ได้รับการฝึกอบรมเรื่อง Large Movie Review Dataset v1.0 จาก Mass et al ซึ่งประกอบด้วยบทวิจารณ์ภาพยนตร์ของ IMDB ที่ระบุว่าเป็นบวกหรือลบ

นี่คือขั้นตอนในการจัดประเภทย่อหน้าด้วยโมเดล:

  1. เพิ่มขนาดย่อหน้าและแปลงเป็นรายการรหัสคำศัพท์โดยใช้คำศัพท์ที่กำหนดไว้ล่วงหน้า
  2. ฟีดรายการไปยังโมเดล TensorFlow Lite
  3. รับความน่าจะเป็นที่ย่อหน้าจะเป็นบวกหรือลบจากผลลัพธ์แบบจำลอง

บันทึก

  • รองรับเฉพาะภาษาอังกฤษ
  • โมเดลนี้ได้รับการฝึกฝนเกี่ยวกับชุดข้อมูลบทวิจารณ์ภาพยนตร์ดังนั้นคุณอาจพบความแม่นยำลดลงเมื่อจัดประเภทข้อความของโดเมนอื่น

เกณฑ์มาตรฐานประสิทธิภาพ

ตัวเลขมาตรฐานประสิทธิภาพถูกสร้างขึ้นด้วยเครื่องมือที่ อธิบายไว้ที่นี่

ชื่อรุ่น ขนาดโมเดล อุปกรณ์ ซีพียู
การจัดประเภทข้อความ 0.6 ล้านบาท พิกเซล 3 (Android 10) 0.05 มิลลิวินาที *
พิกเซล 4 (Android 10) 0.05 มิลลิวินาที *
iPhone XS (iOS 12.4.1) 0.025 มิลลิวินาที **

* 4 เธรดที่ใช้

** 2 เธรดที่ใช้บน iPhone เพื่อให้ได้ผลลัพธ์ที่ดีที่สุด

ตัวอย่างผลลัพธ์

ข้อความ แง่ลบ (0) แง่บวก (1)
นี่คือภาพยนตร์ที่ดีที่สุดที่ฉันเคยดูในช่วงไม่กี่ปีที่ผ่านมา แนะนำเป็นอย่างยิ่ง! 25.3% 74.7%
ช่างเป็นอะไรที่เสียเวลาของฉัน 72.5% 27.5%

ใช้ชุดข้อมูลการฝึกอบรมของคุณ

ทำตาม บทช่วยสอน นี้เพื่อใช้เทคนิคเดียวกับที่ใช้ที่นี่เพื่อฝึกโมเดลการจัดประเภทข้อความโดยใช้ชุดข้อมูลของคุณเอง ด้วยชุดข้อมูลที่ถูกต้องคุณสามารถสร้างแบบจำลองสำหรับกรณีการใช้งานเช่นการจัดหมวดหมู่เอกสารหรือการตรวจจับความคิดเห็นที่เป็นพิษ

อ่านเพิ่มเติมเกี่ยวกับการจัดประเภทข้อความ