7 दिसंबर को महिला एमएल संगोष्ठी में भाग लें अभी पंजीकरण करें

पाठ वर्गीकरण

संग्रह की मदद से व्यवस्थित रहें अपनी प्राथमिकताओं के आधार पर, कॉन्टेंट को सेव करें और कैटगरी में बांटें.

अनुच्छेद को पूर्वनिर्धारित समूहों में श्रेणीबद्ध करने के लिए TensorFlow Lite मॉडल का उपयोग करें।

शुरू हो जाओ

यदि आप TensorFlow Lite के लिए नए हैं और Android के साथ काम कर रहे हैं, तो हम कोड की कुछ ही पंक्तियों में टेक्स्ट वर्गीकरण मॉडल को एकीकृत करने के लिए TensorFlow Lite टास्क लाइब्रेरी की मार्गदर्शिका की खोज करने की सलाह देते हैं। आप TensorFlow Lite Interpreter Java API का उपयोग करके भी मॉडल को एकीकृत कर सकते हैं।

नीचे दिया गया Android उदाहरण दोनों विधियों के कार्यान्वयन को क्रमशः lib_task_api और lib_interpreter के रूप में प्रदर्शित करता है।

एंड्रॉइड उदाहरण

यदि आप Android के अलावा किसी अन्य प्लेटफ़ॉर्म का उपयोग कर रहे हैं, या आप पहले से ही TensorFlow Lite API से परिचित हैं, तो आप हमारे स्टार्टर टेक्स्ट वर्गीकरण मॉडल को डाउनलोड कर सकते हैं।

स्टार्टर मॉडल डाउनलोड करें

यह काम किस प्रकार करता है

पाठ वर्गीकरण किसी अनुच्छेद को उसकी सामग्री के आधार पर पूर्वनिर्धारित समूहों में वर्गीकृत करता है।

यह पूर्व-प्रशिक्षित मॉडल भविष्यवाणी करता है कि अनुच्छेद की भावना सकारात्मक या नकारात्मक है या नहीं। इसे मास एट अल से लार्ज मूवी रिव्यू डेटासेट v1.0 पर प्रशिक्षित किया गया था, जिसमें IMDB मूवी समीक्षाएँ होती हैं जिन्हें सकारात्मक या नकारात्मक के रूप में लेबल किया जाता है।

यहाँ मॉडल के साथ एक पैराग्राफ को वर्गीकृत करने के चरण दिए गए हैं:

  1. पैराग्राफ को टोकनाइज़ करें और इसे पूर्वनिर्धारित शब्दावली का उपयोग करके शब्द आईडी की सूची में बदलें।
  2. सूची को TensorFlow Lite मॉडल में फीड करें।
  3. मॉडल आउटपुट से पैराग्राफ के सकारात्मक या नकारात्मक होने की संभावना प्राप्त करें।

टिप्पणी

  • केवल अंग्रेजी समर्थित है।
  • इस मॉडल को मूवी समीक्षा डेटासेट पर प्रशिक्षित किया गया था ताकि आप अन्य डोमेन के टेक्स्ट को वर्गीकृत करते समय कम सटीकता का अनुभव कर सकें।

प्रदर्शन बेंचमार्क

प्रदर्शन बेंचमार्क नंबर यहां वर्णित टूल से जेनरेट किए जाते हैं।

मॉडल नाम मॉडल का आकार उपकरण सी पी यू
पाठ वर्गीकरण 0.6 एमबी पिक्सेल 3 (एंड्रॉइड 10) 0.05ms*
पिक्सेल 4 (एंड्रॉइड 10) 0.05ms*
आईफोन एक्सएस (आईओएस 12.4.1) 0.025ms**

* 4 धागे का इस्तेमाल किया।

** सर्वश्रेष्ठ प्रदर्शन परिणाम के लिए iPhone पर उपयोग किए जाने वाले 2 धागे।

उदाहरण आउटपुट

मूलपाठ नकारात्मक (0) सकारात्मक (1)
यह हाल के वर्षों में मैंने देखी सबसे अच्छी फिल्म है। इसकी पुरजोर सिफारिश करें! 25.3% 74.7%
मेरे समय की क्या बर्बादी है। 72.5% 27.5%

अपने प्रशिक्षण डेटासेट का उपयोग करें

अपने स्वयं के डेटासेट का उपयोग करके टेक्स्ट वर्गीकरण मॉडल को प्रशिक्षित करने के लिए यहां उपयोग की गई उसी तकनीक को लागू करने के लिए इस ट्यूटोरियल का पालन करें। सही डेटासेट के साथ, आप उपयोग के मामलों जैसे दस्तावेज़ वर्गीकरण या विषाक्त टिप्पणियों का पता लगाने के लिए एक मॉडल बना सकते हैं।

टेक्स्ट वर्गीकरण के बारे में और पढ़ें