ใช้โมเดล TensorFlow Lite เพื่อจัดหมวดหมู่ย่อหน้าในกลุ่มที่กำหนดไว้ล่วงหน้า
เริ่ม
หากคุณเพิ่งเริ่มใช้ TensorFlow Lite และกำลังใช้งาน Android เราขอแนะนำให้ดูคำแนะนำของ TensorFlow Lite Task Library เพื่อรวมโมเดลการจัดประเภทข้อความภายในโค้ดเพียงไม่กี่บรรทัด คุณยังสามารถรวมโมเดลโดยใช้ TensorFlow Lite Interpreter Java API
ตัวอย่าง Android ด้านล่างสาธิตการใช้งานสำหรับทั้งสองวิธีเป็น lib_task_api และ lib_interpreter ตามลำดับ
หากคุณกำลังใช้แพลตฟอร์มอื่นที่ไม่ใช่ Android หรือคุ้นเคยกับ TensorFlow Lite API อยู่แล้ว คุณสามารถดาวน์โหลดแบบจำลองการจัดประเภทข้อความเริ่มต้นของเราได้
มันทำงานอย่างไร
การจัดประเภทข้อความจัดประเภทย่อหน้าออกเป็นกลุ่มที่กำหนดไว้ล่วงหน้าตามเนื้อหา
โมเดลที่ได้รับการฝึกมาล่วงหน้านี้คาดการณ์ว่าความคิดเห็นของย่อหน้าเป็นบวกหรือลบ ได้รับการฝึกอบรมเกี่ยวกับ Large Movie Review Dataset v1.0 จาก Mass et al ซึ่งประกอบด้วยบทวิจารณ์ภาพยนตร์ IMDB ที่ระบุว่าเป็นบวกหรือลบ
ต่อไปนี้เป็นขั้นตอนในการจัดประเภทย่อหน้าด้วยแบบจำลอง:
- แปลงย่อหน้าเป็นโทเค็นและแปลงเป็นรายการรหัสคำโดยใช้คำศัพท์ที่กำหนดไว้ล่วงหน้า
- ป้อนรายการไปยังรุ่น TensorFlow Lite
- รับความน่าจะเป็นของย่อหน้าที่เป็นบวกหรือลบจากผลลัพธ์ของแบบจำลอง
บันทึก
- รองรับเฉพาะภาษาอังกฤษเท่านั้น
- โมเดลนี้ได้รับการฝึกอบรมเกี่ยวกับชุดข้อมูลบทวิจารณ์ภาพยนตร์ ดังนั้นคุณอาจพบความแม่นยำที่ลดลงเมื่อจัดประเภทข้อความของโดเมนอื่น
มาตรฐานประสิทธิภาพ
ตัวเลขเปรียบเทียบประสิทธิภาพสร้างขึ้นด้วยเครื่องมือที่ อธิบายไว้ที่นี่
ชื่อรุ่น | ขนาดรุ่น | อุปกรณ์ | ซีพียู |
---|---|---|---|
การจัดประเภทข้อความ | 0.6 Mb | พิกเซล 3 (แอนดรอยด์ 10) | 0.05ms* |
พิกเซล 4 (แอนดรอยด์ 10) | 0.05ms* | ||
iPhone XS (iOS 12.4.1) | 0.025ms** |
* ใช้ 4 เธรด
** ใช้ 2 เธรดบน iPhone เพื่อผลลัพธ์ประสิทธิภาพที่ดีที่สุด
ตัวอย่างผลลัพธ์
ข้อความ | เชิงลบ (0) | แง่บวก (1) |
---|---|---|
นี่เป็นหนังที่ดีที่สุดที่ฉันเคยดูในช่วงไม่กี่ปีที่ผ่านมา ขอแนะนำอย่างยิ่ง! | 25.3% | 74.7% |
สิ่งที่เสียเวลาของฉัน | 72.5% | 27.5% |
ใช้ชุดข้อมูลการฝึกของคุณ
ทำตามบทช่วย สอน นี้เพื่อใช้เทคนิคเดียวกับที่ใช้ในที่นี้เพื่อฝึกโมเดลการจัดประเภทข้อความโดยใช้ชุดข้อมูลของคุณเอง ด้วยชุดข้อมูลที่ถูกต้อง คุณสามารถสร้างแบบจำลองสำหรับกรณีการใช้งาน เช่น การจัดประเภทเอกสารหรือการตรวจจับความคิดเห็นที่เป็นพิษ