CTCLossV2

کلاس نهایی عمومی CTCLossV2

CTC Loss (احتمال ورود به سیستم) را برای هر ورودی دسته محاسبه می کند. همچنین محاسبه می کند

گرادیان این کلاس عملیات softmax را برای شما انجام می دهد، بنابراین ورودی ها باید به عنوان مثال پیش بینی خطی خروجی ها توسط یک LSTM باشد.

کلاس های تو در تو

کلاس CTCLossV2.Options ویژگی های اختیاری برای CTCLossV2

روش های عمومی

استاتیک CTCLossV2
ایجاد ( دامنه دامنه ، ورودی های عملوند <Float>، عملوند <طولانی> labelsIndices، عملوند <Integer> labelsValues، عملوند <Integer> sequenceLength، گزینه ها... گزینه ها)
روش کارخانه برای ایجاد کلاسی که یک عملیات جدید CTCLossV2 را بسته بندی می کند.
استاتیک CTCLossV2.Options
ctcMergeRepeated (Boolean ctcMergeRepeated)
خروجی <Float>
شیب ()
گرادیان «از دست دادن».
استاتیک CTCLossV2.Options
ignoreLongerOutputsThanInputs (بولی ignoreLongerOutputsThanInputs)
خروجی <Float>
ضرر - زیان ()
بردار (دسته ای) حاوی log-احتمالات.
استاتیک CTCLossV2.Options
preprocessCollapseRepeated (پیش پردازش بولی CollapseRepeated)

روش های ارثی

روش های عمومی

ایجاد عمومی ایستا CTCLossV2 ( دامنه دامنه ، ورودی های عملوند <Float>، عملوند <Long> labelsIndices، عملوند <Integer> labelsValues، عملوند <Integer> sequenceLength، گزینه ها... گزینه ها)

روش کارخانه برای ایجاد کلاسی که یک عملیات جدید CTCLossV2 را بسته بندی می کند.

مولفه های
محدوده محدوده فعلی
ورودی ها 3-بعدی، شکل: «(حداکثر_زمان x دسته_اندازه x تعداد_کلاس ها)"، logits. برچسب خالی پیش‌فرض 0 به جای num_classes - 1 است.
labelsشاخص ها شاخص های یک `SparseTensor `. `labels_indices(i, :) == [b, t]` به این معنی است که "labels_values(i)" شناسه را برای "(دسته b، زمان t)" ذخیره می کند.
labelsValues مقادیر (برچسب ها) مرتبط با دسته و زمان داده شده.
طول دنباله بردار حاوی طول های دنباله ای (بچ).
گزینه ها مقادیر ویژگی های اختیاری را حمل می کند
برمی گرداند
  • یک نمونه جدید از CTCLossV2

عمومی ایستا CTCLossV2. Options ctcMergeRepeated (Boolean ctcMergeRepeated)

مولفه های
ctcMergeRepeated اسکالر. اگر روی false تنظیم شود، در طول محاسبه CTC، برچسب‌های غیر خالی مکرر ادغام نمی‌شوند و به عنوان برچسب‌های جداگانه تفسیر می‌شوند. این یک نسخه ساده شده از CTC است.

شیب خروجی عمومی <Float> ()

گرادیان «از دست دادن». 3-بعدی، شکل: «(حداکثر_زمان x دسته_اندازه x تعداد_کلاس ها)".

عمومی ایستا CTCLossV2.Options ignoreLongerOutputsThanInputs (بولی ignoreLongerOutputsThanInputs)

مولفه های
نادیده گرفتن Longer Outputs ThanInputs اسکالر. اگر روی درست تنظیم شود، در طول محاسبه CTC، مواردی که دنباله‌های خروجی طولانی‌تری نسبت به دنباله‌های ورودی دارند نادیده گرفته می‌شوند: آن‌ها به مدت ضرر کمک نمی‌کنند و دارای گرادیان صفر هستند.

از دست دادن خروجی عمومی <Float> ()

بردار (دسته ای) حاوی log-احتمالات.

عمومی ایستا CTCLossV2. Options preprocessCollapseRepeated (پیش پردازش بولیCollapseRepeated)

مولفه های
preprocessCollapseRepeated اسکالر، اگر درست باشد، برچسب های مکرر قبل از محاسبه CTC جمع می شوند.