তুচ্ছ ওজন ছাঁটা

এই নথিটি মডেল ছাঁটাই সম্পর্কে একটি ওভারভিউ প্রদান করে যাতে এটি আপনার ব্যবহারের ক্ষেত্রে কীভাবে ফিট করে তা নির্ধারণ করতে আপনাকে সহায়তা করে।

ওভারভিউ

মডেল স্প্যার্সিটি অর্জনের জন্য প্রশিক্ষণ প্রক্রিয়া চলাকালীন মাত্রা-ভিত্তিক ওজন ছাঁটাই ধীরে ধীরে মডেলের ওজনকে শূন্য করে দেয়। স্পার্স মডেলগুলি সংকুচিত করা সহজ, এবং আমরা লেটেন্সি উন্নতির জন্য অনুমানের সময় শূন্যগুলি এড়িয়ে যেতে পারি।

এই কৌশলটি মডেল কম্প্রেশনের মাধ্যমে উন্নতি নিয়ে আসে। ভবিষ্যতে, এই কৌশলটির জন্য ফ্রেমওয়ার্ক সমর্থন লেটেন্সি উন্নতি প্রদান করবে। আমরা নির্ভুলতার সর্বনিম্ন ক্ষতি সহ মডেল কম্প্রেশনে 6x পর্যন্ত উন্নতি দেখেছি।

কৌশলটি বিভিন্ন স্পিচ অ্যাপ্লিকেশানে মূল্যায়ন করা হচ্ছে, যেমন স্পিচ রিকগনিশন এবং টেক্সট-টু-স্পীচ, এবং বিভিন্ন দৃষ্টি ও অনুবাদ মডেল জুড়ে পরীক্ষা করা হয়েছে।

API সামঞ্জস্যতা ম্যাট্রিক্স

ব্যবহারকারীরা নিম্নলিখিত API গুলি দিয়ে ছাঁটাই প্রয়োগ করতে পারেন:

  • মডেল ভবন: tf.keras শুধুমাত্র অনুক্রমিক এবং কার্যকরী মডেলের সঙ্গে
  • TensorFlow সংস্করণ: TF 1.x সংস্করণ 1.14+ এবং 2.x এর জন্য।
    • tf.compat.v1 একটি TF 2.x প্যাকেজ এবং সঙ্গে tf.compat.v2 একটি TF 1.x প্যাকেজের সাথে সমর্থিত নয়।
  • টেনসরফ্লো এক্সিকিউশন মোড: গ্রাফ এবং আগ্রহী উভয়ই
  • বন্টিত প্রশিক্ষণ: tf.distribute শুধুমাত্র গ্রাফ সঞ্চালনের সঙ্গে

নিম্নলিখিত ক্ষেত্রে সমর্থন যোগ করার জন্য এটি আমাদের রোডম্যাপে রয়েছে:

ফলাফল

ছবির শ্রেণীবিভাগ

মডেল নন-স্পার্স টপ-১ নির্ভুলতা র্যান্ডম স্পারস নির্ভুলতা র‍্যান্ডম স্পারসিটি স্ট্রাকচার্ড স্পারস নির্ভুলতা স্ট্রাকচার্ড স্পারসিটি
ইনসেপশনV3 78.1% 78.0% ৫০% 75.8% 2 দ্বারা 4
76.1% 75%
74.6% 87.5%
মোবাইলনেটভি1 224 71.04% 70.84% ৫০% 67.35% 2 দ্বারা 4
মোবাইলনেটভি২২২৪ 71.77% 69.64% ৫০% 66.75% 2 দ্বারা 4

মডেলগুলি ইমেজেনেটে পরীক্ষা করা হয়েছিল।

অনুবাদ

মডেল অ-স্পার্স BLEU স্পার্স BLEU স্পারসিটি
GNMT EN-DE 26.77 26.86 80%
26.52 ৮৫%
26.19 90%
GNMT DE-EN ২৯.৪৭ 29.50 80%
২৯.২৪ ৮৫%
28.81 90%

মডেলগুলি ডেভ সেট হিসাবে news-test2013 সহ WMT16 জার্মান এবং ইংরেজি ডেটাসেট এবং পরীক্ষা সেট হিসাবে news-test2015 ব্যবহার করে৷

কীওয়ার্ড স্পটিং মডেল

DS-CNN-L হল একটি কীওয়ার্ড স্পটিং মডেল যা এজ ডিভাইসগুলির জন্য তৈরি করা হয়েছে। এটা তোলে এআরএম সফটওয়্যারের খুঁজে পাওয়া যেতে পারে উদাহরণ সংগ্রহস্থলের

মডেল অ-স্পার্স নির্ভুলতা স্ট্রাকচার্ড স্পারস অ্যাকুরেসি (2 বাই 4 প্যাটার্ন) র্যান্ডম স্পারস অ্যাকুরেসি (লক্ষ্য স্পার্সিটি 50%)
ডিএস-সিএনএন-এল 95.23 94.33 94.84

উদাহরণ

ছাড়াও Keras সঙ্গে খেজুর টিউটোরিয়াল, নিম্নলিখিত উদাহরণ দেখুন:

  • ছাঁটাই সঙ্গে MNIST হাতে লেখা অঙ্ক শ্রেণীবিন্যাস কাজের উপর একটি সিএনএন মডেল ট্রেন: কোড
  • ছাঁটাই সঙ্গে IMDB, অনুভূতি শ্রেণীবিন্যাস কাজের উপর একটি LSTM ট্রেন: কোড

পৃষ্ঠভূমির জন্য, খেজুর, অথবা খেজুর না দেখুন: মডেল কম্প্রেশন [জন্য গাছ ছাঁটাই এর কার্যক্ষমতা অন্বেষণ কাগজ ]।