Transfer öğrenme nedir?

Gelişmiş derin öğrenme modellerinde milyonlarca parametre (ağırlık) bulunur ve bunları sıfırdan eğitmek genellikle büyük miktarda veri ve bilgi işlem kaynağı gerektirir. Transfer öğrenimi, ilgili bir görev için önceden eğitilmiş bir modelin bir parçasını alıp yeni bir modelde yeniden kullanarak bunun çoğunu kısaltan bir tekniktir.

Örneğin, bu bölümdeki bir sonraki öğretici, görüntülerdeki binlerce farklı türde nesneyi tanımak için zaten eğitilmiş bir modelden yararlanan kendi görüntü tanıyıcınızı nasıl oluşturacağınızı gösterecektir. Gerekli orijinal modelden çok daha az eğitim verisi kullanarak kendi görüntü sınıflarınızı algılamak için önceden eğitilmiş modeldeki mevcut bilgileri uyarlayabilirsiniz.

Bu, tarayıcılar ve mobil cihazlar gibi kısıtlı kaynaklara sahip ortamlarda modelleri özelleştirmenin yanı sıra hızla yeni modeller geliştirmek için kullanışlıdır.

Transfer öğrenimi yaparken çoğunlukla orijinal modelin ağırlıklarını ayarlamayız. Bunun yerine, son katmanı kaldırıyoruz ve budanmış modelin çıktısının üzerine yeni (genellikle oldukça sığ) bir model eğitiyoruz. Bu bölümdeki eğitimlerde gösterildiğini göreceğiniz teknik budur:

TensorFlow.js kullanarak öğrenmeyi aktarmanın ek bir örneği için bkz. Önceden eğitilmiş bir model kullanma .