Google I/O-তে টিউন করার জন্য ধন্যবাদ। চাহিদা অনুযায়ী সব সেশন দেখুন চাহিদা অনুযায়ী দেখুন

টেনসরফ্লো অপারেশন ফিউশন, টেনসরফ্লো অপারেশন ফিউশন

ওভারভিউ

এই পৃষ্ঠাটি টেনসরফ্লো-তে কম্পোজিট অপারেশনগুলিকে টেনসরফ্লো লাইটে ফিউজড অপারেশনগুলিতে রূপান্তর করার জন্য প্রয়োজনীয় নকশা এবং পদক্ষেপগুলি বর্ণনা করে৷ এই অবকাঠামোটি সাধারণ উদ্দেশ্য এবং TensorFlow-এর যেকোনো কম্পোজিট অপারেশনকে TensorFlow Lite-এ সংশ্লিষ্ট ফিউজড অপারেশনে রূপান্তর করতে সহায়তা করে।

এই পরিকাঠামোর একটি উদাহরণ হল TensorFlow RNN অপারেশন ফিউশন থেকে TensorFlow Lite, এখানে বিস্তারিত বলা হয়েছে।

ফিউজড অপারেশন কি

অঙ্কন

TensorFlow অপারেশনগুলি হয় আদিম অপস হতে পারে যেমন tf.add অথবা সেগুলি অন্যান্য আদিম অপারেশন যেমন tf.einsum থেকে তৈরি করা যেতে পারে। একটি আদিম অপারেশন টেনসরফ্লো গ্রাফে একটি একক নোড হিসাবে প্রদর্শিত হয় যখন একটি যৌগিক অপারেশন হল টেনসরফ্লো গ্রাফে নোডগুলির একটি সংগ্রহ৷ একটি যৌগিক ক্রিয়াকলাপ নির্বাহ করা তার প্রতিটি উপাদানের আদিম ক্রিয়াকলাপ সম্পাদন করার সমতুল্য।

একটি ফিউজড অপারেশন একটি একক অপারেশনের সাথে মিলে যায় যা সংশ্লিষ্ট যৌগিক ক্রিয়াকলাপের মধ্যে প্রতিটি আদিম অপারেশন দ্বারা সম্পাদিত সমস্ত গণনাকে সাবসুম করে।

ফিউজড অপারেশনের সুবিধা

সামগ্রিক গণনা অপ্টিমাইজ করে এবং মেমরি ফুটপ্রিন্ট হ্রাস করে তাদের অন্তর্নিহিত কার্নেল বাস্তবায়নের কার্যক্ষমতা সর্বাধিক করার জন্য ফিউজড অপারেশন বিদ্যমান। এটি খুবই মূল্যবান, বিশেষ করে কম লেটেন্সি ইনফারেন্স ওয়ার্কলোড এবং রিসোর্স সীমাবদ্ধ মোবাইল প্ল্যাটফর্মের জন্য।

মিশ্রিত ক্রিয়াকলাপগুলি কোয়ান্টাইজেশনের মতো জটিল রূপান্তরগুলিকে সংজ্ঞায়িত করার জন্য একটি উচ্চ স্তরের ইন্টারফেস সরবরাহ করে, যা অন্যথায় আরও দানাদার স্তরে করা অসম্ভব বা খুব কঠিন হবে।

TensorFlow Lite-এ উপরে বর্ণিত কারণগুলির জন্য ফিউজড অপারেশনের অনেক উদাহরণ রয়েছে। এই ফিউজড অপারেশনগুলি সাধারণত সোর্স টেনসরফ্লো প্রোগ্রামের কম্পোজিট অপারেশনের সাথে মিলে যায়। TensorFlow-এ কম্পোজিট অপারেশনের উদাহরণ যা TensorFlow Lite-এ একক ফিউজড অপারেশন হিসাবে প্রয়োগ করা হয় তার মধ্যে রয়েছে বিভিন্ন RNN অপারেশন যেমন ইউনিডাইরেকশনাল এবং বাইডাইরেকশনাল সিকোয়েন্স LSTM, কনভল্যুশন (conv2d, বায়াস অ্যাড, রেলু), সম্পূর্ণ সংযুক্ত (matmul, বায়াস অ্যাড, relu) এবং আরও অনেক কিছু। . TensorFlow Lite-এ, LSTM কোয়ান্টাইজেশন বর্তমানে শুধুমাত্র ফিউজড LSTM অপারেশনগুলিতে প্রয়োগ করা হয়।

ফিউজড অপারেশনের সাথে চ্যালেঞ্জ

টেনসরফ্লো লাইটে কম্পোজিট অপারেশনগুলিকে টেনসরফ্লো থেকে ফিউজড অপারেশনে রূপান্তর করা একটি কঠিন সমস্যা। এই কারণ:

  1. যৌগিক ক্রিয়াকলাপগুলিকে টেনসরফ্লো গ্রাফে একটি সুনির্দিষ্ট সীমানা ছাড়াই আদিম ক্রিয়াকলাপের একটি সেট হিসাবে উপস্থাপন করা হয়। এই ধরনের একটি যৌগিক অপারেশনের সাথে সম্পর্কিত সাব-গ্রাফটি সনাক্ত করা (যেমন প্যাটার্ন ম্যাচিংয়ের মাধ্যমে) খুব চ্যালেঞ্জিং হতে পারে।

  2. একটি ফিউজড টেনসরফ্লো লাইট অপারেশনকে লক্ষ্য করে একাধিক TensorFlow বাস্তবায়ন হতে পারে। উদাহরণ স্বরূপ, TensorFlow (Keras, Babelfish/lingvo ইত্যাদি) তে অনেক LSTM ইমপ্লিমেন্টেশন রয়েছে এবং এগুলোর প্রত্যেকটি বিভিন্ন আদিম ক্রিয়াকলাপের সমন্বয়ে গঠিত কিন্তু সেগুলি এখনও টেনসরফ্লো লাইটে একই ফিউজড LSTM অপারেশনে রূপান্তরিত হতে পারে।

যেমন, ফিউজড অপারেশনের রূপান্তর বেশ চ্যালেঞ্জিং প্রমাণিত হয়েছে।

একটি tf.function মধ্যে যৌগিক অপারেশন মোড়ানো

অনেক ক্ষেত্রে, মডেলের কিছু অংশ TFLite-এ একটি একক অপারেশনে ম্যাপ করা যেতে পারে। নির্দিষ্ট ক্রিয়াকলাপগুলির জন্য একটি অপ্টিমাইজ করা বাস্তবায়ন লেখার সময় এটি কার্য সম্পাদনে সহায়তা করতে পারে। TFLite-এ একটি ফিউজড অপারেশন তৈরি করতে সক্ষম হতে, গ্রাফের অংশটি চিহ্নিত করুন যা একটি ফিউজড অপারেশনকে প্রতিনিধিত্ব করে এবং এটিকে একটি tf.function এ "experimental_implements" অ্যাট্রিবিউট সহ একটি tf.function এ মুড়ে দিন, যার মান true সহ tfl_fusable_op বৈশিষ্ট্য রয়েছে। যদি কাস্টম অপারেশন বৈশিষ্ট্যগুলি গ্রহণ করে তবে সেগুলিকে একই "পরীক্ষামূলক_ইমপ্লিমেন্ট" এর অংশ হিসাবে পাস করুন।

উদাহরণ,

def get_implements_signature():
  implements_signature = [
    # 'name' will be used as a name for the operation.
    'name: "my_custom_fused_op"',
    # attr "tfl_fusable_op" is required to be set with true value.
    'attr {key: "tfl_fusable_op" value { b: true } }',
    # Example attribute "example_option" that the op accepts.
    'attr {key: "example_option" value { i: %d } }' % 10
  ]
  return ' '.join(implements_signature)

@tf.function(experimental_implements=get_implements_signature())
def my_custom_fused_op(input_1, input_2):
  # An empty function that represents pre/post processing example that
  # is not represented as part of the Tensorflow graph.
  output_1 = tf.constant(0.0, dtype=tf.float32, name='first_output')
  output_2 = tf.constant(0.0, dtype=tf.float32, name='second_output')
  return output_1, output_2

class TestModel(tf.Module):
  def __init__(self):
    super(TestModel, self).__init__()
    self.conv_1 = tf.keras.layers.Conv2D(filters=1, kernel_size=(3, 3))
    self.conv_2 = tf.keras.layers.Conv2D(filters=1, kernel_size=(3, 3))

  @tf.function(input_signature=[
      tf.TensorSpec(shape=[1, 28, 28, 3], dtype=tf.float32),
      tf.TensorSpec(shape=[1, 28, 28, 3], dtype=tf.float32),
  ])
  def simple_eval(self, input_a, input_b):
    return my_custom_fused_op(self.conv_1(input_a), self.conv_2(input_b))

মনে রাখবেন যে আপনাকে কনভার্টারে allow_custom_ops সেট করতে হবে না কারণ tfl_fusable_op বৈশিষ্ট্য ইতিমধ্যেই এটিকে বোঝায়।

কাস্টম অপ প্রয়োগ করুন এবং TFLite ইন্টারপ্রেটারের সাথে নিবন্ধন করুন

একটি TFLite কাস্টম অপারেশন হিসাবে আপনার ফিউজড অপারেশন বাস্তবায়ন করুন - নির্দেশাবলী দেখুন৷

উল্লেখ্য যে, অপটি নিবন্ধন করার নামটি ইমপ্লিমেন্ট স্বাক্ষরের name বৈশিষ্ট্যে উল্লিখিত নামের অনুরূপ হওয়া উচিত।

উদাহরণে অপের জন্য একটি উদাহরণ হল

  TfLiteRegistration reg;
  // This name must match the name specified in the implements signature.
  static constexpr char kOpName[] = "my_custom_fused_op";
  reg.custom_name = kOpName;
  reg.prepare = [](TfLiteContext* context, TfLiteNode* node) -> TfLiteStatus {
    // Add your code.
    return kTfLiteOk;
  };
  reg.invoke = [](TfLiteContext* context, TfLiteNode* node) -> TfLiteStatus {
    // Add your coder.
    return kTfLiteOk;
  };
  reg.builtin_code = kTfLiteCustom;
  resolver->AddCustom(kOpName, &reg);

কম্পোজিট থেকে ফিউজড অপারেশনে রূপান্তর করা (উন্নত)

টেনসরফ্লো কম্পোজিট অপারেশনগুলিকে টেনসরফ্লো লাইট ফিউজড অপারেশনে রূপান্তর করার সামগ্রিক আর্কিটেকচার নীচে দেওয়া হল:

অঙ্কন

একটি tf.function মধ্যে যৌগিক অপারেশন মোড়ানো

TensorFlow মডেল সোর্স কোডে, পরীক্ষামূলক_ইমপ্লিমেন্ট ফাংশন টীকা দিয়ে একটি tf.function এ যৌগিক ক্রিয়াকলাপ সনাক্ত করুন এবং বিমূর্ত করুন। এম্বেডিং লুকআপের একটি উদাহরণ দেখুন। ফাংশন ইন্টারফেস সংজ্ঞায়িত করে এবং এর আর্গুমেন্টগুলি রূপান্তর যুক্তি প্রয়োগ করতে ব্যবহার করা উচিত।

রূপান্তর কোড লিখুন

রূপান্তর কোডটি implements টীকা সহ ফাংশনের ইন্টারফেস অনুসারে লেখা হয়। এমবেডিং লুকআপের জন্য একটি উদাহরণ ফিউশন দেখুন। ধারণাগতভাবে, রূপান্তর কোড এই ইন্টারফেসের যৌগিক বাস্তবায়নকে ফিউজডের সাথে প্রতিস্থাপন করে।

প্রস্তুতি-যৌগিক-ফাংশন পাসে, আপনার রূপান্তর কোডে প্লাগইন করুন।

আরও উন্নত ব্যবহারে, ফিউজড অপারেশনের অপারেন্ডগুলি বের করার জন্য যৌগিক অপারেশনের অপারেন্ডগুলির জটিল রূপান্তরগুলি বাস্তবায়ন করা সম্ভব। কেরাস এলএসটিএম দেখুন। একটি উদাহরণ হিসাবে রূপান্তর কোড.

টেনসরফ্লো লাইটে রূপান্তর করুন

টেনসরফ্লো লাইটে রূপান্তর করতে TFLiteConverter.from_saved_model API ব্যবহার করুন।

ফণা অধীনে

আমরা এখন TensorFlow Lite-এ ফিউজড অপারেশনে রূপান্তর করার জন্য সামগ্রিক ডিজাইনের উচ্চ স্তরের বিবরণ বর্ণনা করি।

TensorFlow-এ কম্পোজিং অপারেশন

Experimental_implements ফাংশন অ্যাট্রিবিউটের সাথে tf.function এর ব্যবহার ব্যবহারকারীদের TensorFlow আদিম ক্রিয়াকলাপগুলি ব্যবহার করে স্পষ্টভাবে নতুন ক্রিয়াকলাপ রচনা করতে এবং ফলস্বরূপ কম্পোজিট অপারেশন প্রয়োগ করা ইন্টারফেসটি নির্দিষ্ট করতে দেয়। এটি খুব দরকারী কারণ এটি প্রদান করে:

  1. অন্তর্নিহিত TensorFlow গ্রাফে যৌগিক অপারেশনের জন্য একটি সু-সংজ্ঞায়িত সীমানা।
  2. এই অপারেশনটি যে ইন্টারফেসটি প্রয়োগ করে তা স্পষ্টভাবে উল্লেখ করুন। tf.function এর আর্গুমেন্ট এই ইন্টারফেসের আর্গুমেন্টের সাথে মিলে যায়।

উদাহরণ হিসেবে, এম্বেডিং লুকআপ বাস্তবায়নের জন্য সংজ্ঞায়িত একটি যৌগিক অপারেশন বিবেচনা করা যাক। এটি টেনসরফ্লো লাইটে একটি ফিউজড অপারেশনের মানচিত্র।

  @tf.function(
        experimental_implements="embedding_lookup")
    def EmbFprop(embs, ids_vec):
      """Embedding forward prop.

      Effectively, it computes:
        num = size of ids_vec
        rets = zeros([num, embedding dim])
        for i in range(num):
          rets[i, :] = embs[ids_vec[i], :]
        return rets

      Args:
        embs: The embedding matrix.
        ids_vec: A vector of int32 embedding ids.

      Returns:
        The result of embedding lookups. A matrix of shape
        [num ids in ids_vec, embedding dims].
      """
      num = tf.shape(ids_vec)[0]
      rets = inplace_ops.empty([num] + emb_shape_suf, py_utils.FPropDtype(p))

      def EmbFpropLoop(i, embs, ids_vec, rets):
        # row_id = ids_vec[i]
        row_id = tf.gather(ids_vec, i)
        # row = embs[row_id]
        row = tf.reshape(tf.gather(embs, row_id), [1] + emb_shape_suf)
        # rets[i] = row
        rets = inplace_ops.alias_inplace_update(rets, [i], row)
        return embs, ids_vec, rets

      _, _, rets = functional_ops.For(
          start=0,
          limit=num,
          delta=1,
          inputs=[embs, ids_vec, rets],
          body=EmbFpropLoop,
          rewrite_with_while=compiled)
      if len(weight_shape) > 2:
        rets = tf.reshape(rets, [num, symbolic.ToStatic(p.embedding_dim)])
      return rets

মডেলগুলিকে tf.function এর মাধ্যমে যৌগিক ক্রিয়াকলাপগুলিকে উপরে চিত্রিত করার মাধ্যমে, এই ধরনের ক্রিয়াকলাপগুলিকে ফিউজড টেনসরফ্লো লাইট অপারেশনে সনাক্ত এবং রূপান্তর করার জন্য একটি সাধারণ অবকাঠামো তৈরি করা সম্ভব হয়।

TensorFlow Lite কনভার্টার প্রসারিত করা হচ্ছে

TensorFlow Lite কনভার্টার যা এই বছরের শুরুতে প্রকাশিত হয়েছিল শুধুমাত্র TensorFlow মডেলগুলিকে একটি গ্রাফ হিসাবে আমদানি করাকে সমর্থন করে যাতে সমস্ত ভেরিয়েবল তাদের সংশ্লিষ্ট ধ্রুবক মানগুলির সাথে প্রতিস্থাপিত হয়৷ এটি অপারেশন ফিউশনের জন্য কাজ করে না কারণ এই ধরনের গ্রাফগুলির সমস্ত ফাংশন ইনলাইনযুক্ত থাকে যাতে ভেরিয়েবলগুলিকে ধ্রুবকগুলিতে পরিণত করা যায়।

রূপান্তর প্রক্রিয়া চলাকালীন experimental_implements বৈশিষ্ট্যের সাথে tf.function কে লিভারেজ করার জন্য, রূপান্তর প্রক্রিয়ার পরে ফাংশনগুলিকে সংরক্ষণ করতে হবে।

যেমন, আমরা কম্পোজিট অপারেশন ফিউশন ব্যবহারের ক্ষেত্রে সমর্থন করার জন্য কনভার্টারে টেনসরফ্লো মডেল আমদানি এবং রূপান্তর করার একটি নতুন কর্মপ্রবাহ বাস্তবায়ন করেছি। বিশেষ করে, যোগ করা নতুন বৈশিষ্ট্য হল:

  1. MLIR-এ TensorFlow সংরক্ষিত মডেল আমদানি করা হচ্ছে
  2. ফিউজ যৌগিক অপারেশন
  3. পরিবর্তনশীল পরিবর্তনশীলতা বিশ্লেষণ
  4. সমস্ত পঠনযোগ্য ভেরিয়েবল ফ্রিজ করুন

এটি আমাদের ফাংশন ইনলাইনিং এবং ভেরিয়েবল ফ্রিজিংয়ের পূর্বে যৌগিক ক্রিয়াকলাপের প্রতিনিধিত্বকারী ফাংশনগুলি ব্যবহার করে অপারেশন ফিউশন সম্পাদন করতে দেয়।

অপারেশন ফিউশন বাস্তবায়ন

এর আরো বিস্তারিতভাবে অপারেশন ফিউশন পাস তাকান. এই পাস নিম্নলিখিত কাজ করে:

  1. MLIR মডিউলে সমস্ত ফাংশন লুপ করুন।
  2. যদি একটি ফাংশনে tf._implements অ্যাট্রিবিউট থাকে, অ্যাট্রিবিউট মানের উপর ভিত্তি করে, উপযুক্ত অপারেশন ফিউশন ইউটিলিটি কল করে।
  3. অপারেশন ফিউশন ইউটিলিটি ফাংশনের অপারেন্ড এবং বৈশিষ্ট্যের উপর কাজ করে (যা রূপান্তরের জন্য ইন্টারফেস হিসাবে কাজ করে) এবং ফাংশনের বডিকে ফিউজড অপারেশন ধারণকারী একটি সমতুল্য ফাংশন বডি দিয়ে প্রতিস্থাপন করে।
  4. অনেক ক্ষেত্রে, প্রতিস্থাপিত শরীরে ফিউজড অপারেশন ছাড়া অন্য অপারেশন থাকবে। এগুলি ফিউজড অপারেশনের অপারেন্ডগুলি পাওয়ার জন্য ফাংশনের অপারেন্ডে কিছু স্ট্যাটিক রূপান্তরের সাথে মিলে যায়। যেহেতু এই কম্পিউটেশনগুলি সবগুলি অবিচ্ছিন্নভাবে ভাঁজ করা যেতে পারে, সেগুলি রপ্তানি করা ফ্ল্যাটবাফারে উপস্থিত থাকবে না যেখানে শুধুমাত্র ফিউজড অপারেশন থাকবে৷

এখানে পাস থেকে কোড স্নিপেট প্রধান কর্মপ্রবাহ দেখাচ্ছে:

void PrepareCompositeFunctionsPass::ConvertTFImplements(FuncOp func,
                                                        StringAttr attr) {
  if (attr.getValue() == "embedding_lookup") {
    func.eraseBody();
    func.addEntryBlock();
    // Convert the composite embedding_lookup function body to a
    // TFLite fused embedding_lookup op.
    ConvertEmbeddedLookupFunc convert_embedded_lookup(func);
    if (failed(convert_embedded_lookup.VerifySignature())) {
      return signalPassFailure();
    }
    convert_embedded_lookup.RewriteFunc();
  } else if (attr.getValue() == mlir::TFL::kKerasLstm) {
     func.eraseBody();
     func.addEntryBlock();
     OpBuilder builder(func.getBody());
     if (failed(ConvertKerasLSTMLayer(func, &builder))) {
       return signalPassFailure();
     }
  } else if (.....) /* Other fusions can plug in here */
}

এখানে কোড স্নিপেট এই কম্পোজিট অপারেশনটিকে টেনসরফ্লো লাইটে একটি ফিউজড অপারেশনে ম্যাপিং দেখাচ্ছে যা একটি রূপান্তর ইন্টারফেস হিসাবে ফাংশনটি ব্যবহার করে।

void RewriteFunc() {
    Value lookup = func_.getArgument(1);
    Value value = func_.getArgument(0);
    auto output_type = func_.getType().getResult(0);

    OpBuilder builder(func_.getBody());
    auto op = builder.create<mlir::TFL::EmbeddingLookupOp>(
        func_.getLoc(), output_type, lookup, value);

    builder.create<mlir::ReturnOp>(func_.getLoc(), op.getResult());
  }