पाठ वर्गीकरण

पैराग्राफ को पूर्वनिर्धारित समूहों में वर्गीकृत करने के लिए TensorFlow Lite मॉडल का उपयोग करें।

शुरू हो जाओ

यदि आप TensorFlow Lite में नए हैं और Android के साथ काम कर रहे हैं, तो हम कोड की कुछ पंक्तियों के भीतर पाठ वर्गीकरण मॉडल को एकीकृत करने के लिए TensorFLow Lite टास्क लाइब्रेरी की मार्गदर्शिका की खोज करने की सलाह देते हैं। आप TensorFlow Lite Interpreter Java API का उपयोग करके भी मॉडल को एकीकृत कर सकते हैं।

नीचे दिया गया एंड्रॉइड उदाहरण क्रमशः lib_task_api और lib_interpreter दोनों विधियों के कार्यान्वयन को दर्शाता है।

एंड्रॉइड उदाहरण

यदि आप Android के अलावा किसी अन्य प्लेटफ़ॉर्म का उपयोग कर रहे हैं, या आप पहले से ही TensorFlow Lite API से परिचित हैं, तो आप हमारे स्टार्टर टेक्स्ट वर्गीकरण मॉडल को डाउनलोड कर सकते हैं।

स्टार्टर मॉडल डाउनलोड करें

यह काम किस प्रकार करता है

पाठ वर्गीकरण किसी अनुच्छेद को उसकी सामग्री के आधार पर पूर्वनिर्धारित समूहों में वर्गीकृत करता है।

यह पूर्व-प्रशिक्षित मॉडल भविष्यवाणी करता है कि पैराग्राफ की भावना सकारात्मक है या नकारात्मक। इसे मास एट अल से लार्ज मूवी रिव्यू डेटासेट v1.0 पर प्रशिक्षित किया गया था, जिसमें सकारात्मक या नकारात्मक के रूप में लेबल की गई IMDB मूवी समीक्षाएं शामिल हैं।

मॉडल के साथ पैराग्राफ को वर्गीकृत करने के चरण यहां दिए गए हैं:

  1. पैराग्राफ को टोकनाइज़ करें और इसे पूर्वनिर्धारित शब्दावली का उपयोग करके शब्द आईडी की सूची में परिवर्तित करें।
  2. सूची को TensorFlow Lite मॉडल पर फ़ीड करें।
  3. मॉडल आउटपुट से पैराग्राफ के सकारात्मक या नकारात्मक होने की संभावना प्राप्त करें।

टिप्पणी

  • केवल अंग्रेजी समर्थित है.
  • इस मॉडल को मूवी समीक्षा डेटासेट पर प्रशिक्षित किया गया था ताकि आप अन्य डोमेन के पाठ को वर्गीकृत करते समय कम सटीकता का अनुभव कर सकें।

प्रदर्शन मानदंड

प्रदर्शन बेंचमार्क नंबर यहां वर्णित टूल से तैयार किए जाते हैं।

मॉडल नाम मॉडल का आकार उपकरण CPU
पाठ वर्गीकरण 0.6 एमबी पिक्सेल 3 (एंड्रॉइड 10) 0.05ms*
पिक्सेल 4 (एंड्रॉइड 10) 0.05ms*
आईफोन एक्सएस (आईओएस 12.4.1) 0.025ms**

* 4 धागों का प्रयोग किया गया।

** सर्वोत्तम प्रदर्शन परिणाम के लिए iPhone पर 2 थ्रेड का उपयोग किया जाता है।

उदाहरण आउटपुट

मूलपाठ नकारात्मक (0) सकारात्मक (1)
यह सबसे अच्छी फिल्म है जो मैंने हाल के वर्षों में देखी है। इसकी पुरजोर अनुशंसा करें! 25.3% 74.7%
मेरे समय की कितनी बर्बादी है. 72.5% 27.5%

अपने प्रशिक्षण डेटासेट का उपयोग करें

अपने स्वयं के डेटासेट का उपयोग करके टेक्स्ट वर्गीकरण मॉडल को प्रशिक्षित करने के लिए यहां उपयोग की गई उसी तकनीक को लागू करने के लिए इस ट्यूटोरियल का पालन करें। सही डेटासेट के साथ, आप दस्तावेज़ वर्गीकरण या विषाक्त टिप्पणियों का पता लगाने जैसे उपयोग के मामलों के लिए एक मॉडल बना सकते हैं।

पाठ वर्गीकरण के बारे में और पढ़ें