এই নথিটি মডেল ছাঁটাই সম্পর্কে একটি ওভারভিউ প্রদান করে যাতে এটি আপনার ব্যবহারের ক্ষেত্রে কীভাবে ফিট করে তা নির্ধারণ করতে আপনাকে সহায়তা করে।
- একটি এন্ড-টু-এন্ড উদাহরণ ডুব দিবেন ডানদিকে, দেখতে Keras সঙ্গে প্রুনিং উদাহরণ।
- দ্রুত API গুলি আপনার ব্যবহারের ক্ষেত্রে জন্য প্রয়োজন খুঁজতে, দেখতে ছাঁটাই ব্যাপক গাইড ।
- জন্য-ডিভাইস অনুমান ছাঁটাই প্রয়োগের অন্বেষণ করতে, দেখতে জন্য XNNPACK সঙ্গে-ডিভাইস অনুমান প্রুনিং ।
- কাঠামোগত কেঁটে সাফ একটি উদাহরণ দেখার জন্য, টিউটোরিয়াল চালানো 4 sparsity দ্বারা 2 কাঠামোগত কেঁটে সাফ ।
ওভারভিউ
মডেল স্প্যার্সিটি অর্জনের জন্য প্রশিক্ষণ প্রক্রিয়া চলাকালীন মাত্রা-ভিত্তিক ওজন ছাঁটাই ধীরে ধীরে মডেলের ওজনকে শূন্য করে দেয়। স্পার্স মডেলগুলি সংকুচিত করা সহজ, এবং আমরা লেটেন্সি উন্নতির জন্য অনুমানের সময় শূন্যগুলি এড়িয়ে যেতে পারি।
এই কৌশলটি মডেল কম্প্রেশনের মাধ্যমে উন্নতি নিয়ে আসে। ভবিষ্যতে, এই কৌশলটির জন্য ফ্রেমওয়ার্ক সমর্থন লেটেন্সি উন্নতি প্রদান করবে। আমরা নির্ভুলতার সর্বনিম্ন ক্ষতি সহ মডেল কম্প্রেশনে 6x পর্যন্ত উন্নতি দেখেছি।
কৌশলটি বিভিন্ন স্পিচ অ্যাপ্লিকেশানে মূল্যায়ন করা হচ্ছে, যেমন স্পিচ রিকগনিশন এবং টেক্সট-টু-স্পীচ, এবং বিভিন্ন দৃষ্টি ও অনুবাদ মডেল জুড়ে পরীক্ষা করা হয়েছে।
API সামঞ্জস্যতা ম্যাট্রিক্স
ব্যবহারকারীরা নিম্নলিখিত API গুলি দিয়ে ছাঁটাই প্রয়োগ করতে পারেন:
- মডেল ভবন:
tf.keras
শুধুমাত্র অনুক্রমিক এবং কার্যকরী মডেলের সঙ্গে - TensorFlow সংস্করণ: TF 1.x সংস্করণ 1.14+ এবং 2.x এর জন্য।
-
tf.compat.v1
একটি TF 2.x প্যাকেজ এবং সঙ্গেtf.compat.v2
একটি TF 1.x প্যাকেজের সাথে সমর্থিত নয়।
-
- টেনসরফ্লো এক্সিকিউশন মোড: গ্রাফ এবং আগ্রহী উভয়ই
- বন্টিত প্রশিক্ষণ:
tf.distribute
শুধুমাত্র গ্রাফ সঞ্চালনের সঙ্গে
নিম্নলিখিত ক্ষেত্রে সমর্থন যোগ করার জন্য এটি আমাদের রোডম্যাপে রয়েছে:
ফলাফল
ছবির শ্রেণীবিভাগ
মডেল | নন-স্পার্স টপ-১ নির্ভুলতা | র্যান্ডম স্পারস নির্ভুলতা | র্যান্ডম স্পারসিটি | স্ট্রাকচার্ড স্পারস নির্ভুলতা | স্ট্রাকচার্ড স্পারসিটি |
---|---|---|---|---|---|
ইনসেপশনV3 | 78.1% | 78.0% | ৫০% | 75.8% | 2 দ্বারা 4 |
76.1% | 75% | ||||
74.6% | 87.5% | ||||
মোবাইলনেটভি1 224 | 71.04% | 70.84% | ৫০% | 67.35% | 2 দ্বারা 4 |
মোবাইলনেটভি২২২৪ | 71.77% | 69.64% | ৫০% | 66.75% | 2 দ্বারা 4 |
মডেলগুলি ইমেজেনেটে পরীক্ষা করা হয়েছিল।
অনুবাদ
মডেল | অ-স্পার্স BLEU | স্পার্স BLEU | স্পারসিটি |
---|---|---|---|
GNMT EN-DE | 26.77 | 26.86 | 80% |
26.52 | ৮৫% | ||
26.19 | 90% | ||
GNMT DE-EN | ২৯.৪৭ | 29.50 | 80% |
২৯.২৪ | ৮৫% | ||
28.81 | 90% |
মডেলগুলি ডেভ সেট হিসাবে news-test2013 সহ WMT16 জার্মান এবং ইংরেজি ডেটাসেট এবং পরীক্ষা সেট হিসাবে news-test2015 ব্যবহার করে৷
কীওয়ার্ড স্পটিং মডেল
DS-CNN-L হল একটি কীওয়ার্ড স্পটিং মডেল যা এজ ডিভাইসগুলির জন্য তৈরি করা হয়েছে। এটা তোলে এআরএম সফটওয়্যারের খুঁজে পাওয়া যেতে পারে উদাহরণ সংগ্রহস্থলের ।
মডেল | অ-স্পার্স নির্ভুলতা | স্ট্রাকচার্ড স্পারস অ্যাকুরেসি (2 বাই 4 প্যাটার্ন) | র্যান্ডম স্পারস অ্যাকুরেসি (লক্ষ্য স্পার্সিটি 50%) |
---|---|---|---|
ডিএস-সিএনএন-এল | 95.23 | 94.33 | 94.84 |
উদাহরণ
ছাড়াও Keras সঙ্গে খেজুর টিউটোরিয়াল, নিম্নলিখিত উদাহরণ দেখুন:
- ছাঁটাই সঙ্গে MNIST হাতে লেখা অঙ্ক শ্রেণীবিন্যাস কাজের উপর একটি সিএনএন মডেল ট্রেন: কোড
- ছাঁটাই সঙ্গে IMDB, অনুভূতি শ্রেণীবিন্যাস কাজের উপর একটি LSTM ট্রেন: কোড
পৃষ্ঠভূমির জন্য, খেজুর, অথবা খেজুর না দেখুন: মডেল কম্প্রেশন [জন্য গাছ ছাঁটাই এর কার্যক্ষমতা অন্বেষণ কাগজ ]।