چارچوب یادگیری ساختاریافته عصبی

با مجموعه‌ها، منظم بمانید ذخیره و دسته‌بندی محتوا براساس اولویت‌های شما.

یادگیری ساخت‌یافته عصبی (NSL) بر آموزش شبکه‌های عصبی عمیق با استفاده از سیگنال‌های ساختاریافته (در صورت وجود) همراه با ورودی‌های ویژگی تمرکز دارد. همانطور که توسط Bui et al. (WSDM'18) ، از این سیگنال‌های ساخت‌یافته برای منظم کردن آموزش شبکه عصبی استفاده می‌شود، و مدل را مجبور می‌کند تا پیش‌بینی‌های دقیق را (با به حداقل رساندن تلفات نظارت‌شده) یاد بگیرد، در حالی که در عین حال شباهت ساختاری ورودی را حفظ می‌کند (با حداقل کردن تلفات همسایه). ، شکل زیر را ببینید). این تکنیک عمومی است و می‌تواند در معماری‌های عصبی دلخواه (مانند NN‌های فید فوروارد، NN‌های Convolutional و NN‌های بازگشتی) اعمال شود.

مفهوم NSL

توجه داشته باشید که معادله از دست دادن همسایه تعمیم‌یافته انعطاف‌پذیر است و می‌تواند شکل‌های دیگری غیر از آنچه در بالا نشان داده شده باشد. برای مثال، ما همچنین می‌توانیم\(\sum_{x_j \in \mathcal{N}(x_i)}\mathcal{E}(y_i,g_\theta(x_j))\) را به عنوان ضرر همسایه انتخاب کنیم، که فاصله بین حقیقت زمین \(y_i\)و پیش‌بینی همسایه \(g_\theta(x_j)\)محاسبه می‌کند. این معمولاً در یادگیری خصمانه استفاده می شود (Goodfellow et al., ICLR'15) . بنابراین، NSL به یادگیری نمودار عصبی تعمیم می‌یابد اگر همسایه‌ها به طور صریح با یک نمودار نشان داده شوند، و اگر همسایه‌ها به طور ضمنی توسط اغتشاش خصمانه القا شوند، به یادگیری مخالف تعمیم می‌یابد.

گردش کار کلی برای یادگیری ساختاریافته عصبی در زیر نشان داده شده است. فلش‌های سیاه نشان‌دهنده گردش کار آموزشی معمولی و فلش‌های قرمز نشان‌دهنده گردش کار جدید است که توسط NSL برای استفاده از سیگنال‌های ساختاریافته معرفی شده است. ابتدا، نمونه‌های آموزشی برای گنجاندن سیگنال‌های ساختاریافته تکمیل می‌شوند. هنگامی که سیگنال های ساخت یافته به طور صریح ارائه نمی شوند، می توان آنها را ساخت یا القا کرد (این مورد برای یادگیری خصمانه کاربرد دارد). سپس، نمونه‌های آموزشی تقویت‌شده (شامل نمونه‌های اصلی و همسایه‌های متناظر آنها) برای محاسبه تعبیه‌های آنها به شبکه عصبی تغذیه می‌شوند. فاصله بین تعبیه نمونه و جاسازی همسایه آن محاسبه و به عنوان ضرر همسایه استفاده می شود که به عنوان یک اصطلاح منظم در نظر گرفته می شود و به ضرر نهایی اضافه می شود. برای نظم‌دهی صریح مبتنی بر همسایه، ما معمولاً از دست دادن همسایه را به عنوان فاصله بین جاسازی نمونه و جاسازی همسایه محاسبه می‌کنیم. با این حال، هر لایه از شبکه عصبی ممکن است برای محاسبه از دست دادن همسایه استفاده شود. از سوی دیگر، برای نظم‌دهی مبتنی بر همسایه القایی (مخالف)، از دست دادن همسایه را به عنوان فاصله بین پیش‌بینی خروجی همسایه متخاصم القایی و برچسب حقیقت زمین محاسبه می‌کنیم.

گردش کار NSL

چرا از NSL استفاده کنیم؟

NSL مزایای زیر را به همراه دارد:

  • دقت بالاتر : سیگنال(های) ساختار یافته در بین نمونه ها می تواند اطلاعاتی را ارائه دهد که همیشه در ورودی های ویژگی موجود نیست. بنابراین، نشان داده شده است که رویکرد آموزشی مشترک (هم با سیگنال‌ها و هم ویژگی‌های ساختاریافته) از بسیاری از روش‌های موجود (که فقط به آموزش با ویژگی‌ها متکی هستند) در طیف گسترده‌ای از وظایف، مانند طبقه‌بندی اسناد و طبقه‌بندی هدف معنایی، بهتر عمل می‌کند ( Bui et al. .، WSDM'18 & Kipf و همکاران، ICLR'17 ).
  • استحکام : نشان داده شده است که مدل‌هایی که با نمونه‌های متخاصم آموزش داده شده‌اند در برابر اغتشاشات متخاصم که برای گمراه‌کردن پیش‌بینی یا طبقه‌بندی یک مدل طراحی شده‌اند، مقاوم هستند (Godfellow و همکاران ، ICLR'15 & Miyato و همکاران، ICLR'16 ). هنگامی که تعداد نمونه های آموزشی کم است، آموزش با نمونه های متضاد نیز به بهبود دقت مدل کمک می کند ( Tsipras et al., ICLR'19 ).
  • داده‌های برچسب‌دار کمتر مورد نیاز : NSL شبکه‌های عصبی را قادر می‌سازد تا از داده‌های برچسب‌دار و بدون برچسب استفاده کنند، که الگوی یادگیری را به یادگیری نیمه نظارت شده گسترش می‌دهد. به طور خاص، NSL به شبکه اجازه می‌دهد تا با استفاده از داده‌های برچسب‌گذاری شده مانند تنظیمات نظارت‌شده، آموزش ببیند، و در عین حال شبکه را به یادگیری نمایش‌های پنهان مشابه برای «نمونه‌های همسایه» که ممکن است دارای برچسب باشند یا نداشته باشند، هدایت می‌کند. این تکنیک نوید بزرگی را برای بهبود دقت مدل در زمانی که مقدار داده‌های برچسب‌گذاری شده نسبتاً کم است، نشان داده است ( Bui et al., WSDM'18 & Miyato et al., ICLR'16 ).

آموزش های گام به گام

برای به دست آوردن تجربه عملی با یادگیری ساختاریافته عصبی، ما آموزش هایی داریم که سناریوهای مختلفی را پوشش می دهد که در آن سیگنال های ساخت یافته ممکن است به صراحت داده شوند، ساخته شوند یا القا شوند. اینجا چندتایی هستند:

نمونه‌ها و آموزش‌های بیشتر را می‌توانید در فهرست نمونه‌های مخزن GitHub ما پیدا کنید.