Che cos'è l'apprendimento di trasferimento?

Mantieni tutto organizzato con le raccolte Salva e classifica i contenuti in base alle tue preferenze.

Sofisticati modelli di deep learning hanno milioni di parametri (pesi) e addestrarli da zero spesso richiede grandi quantità di dati di risorse di calcolo. L'apprendimento del trasferimento è una tecnica che abbrevia gran parte di questo prendendo un pezzo di un modello che è già stato addestrato su un'attività correlata e riutilizzandolo in un nuovo modello.

Ad esempio, il prossimo tutorial in questa sezione ti mostrerà come costruire il tuo riconoscitore di immagini che sfrutta un modello che è stato già addestrato per riconoscere migliaia di diversi tipi di oggetti all'interno delle immagini. È possibile adattare le conoscenze esistenti nel modello pre-addestrato per rilevare le proprie classi di immagini utilizzando molti meno dati di addestramento rispetto al modello originale richiesto.

Ciò è utile per lo sviluppo rapido di nuovi modelli e per la personalizzazione di modelli in ambienti con risorse limitate come browser e dispositivi mobili.

Molto spesso, quando si esegue il trasferimento di apprendimento, non regoliamo i pesi del modello originale. Invece, rimuoviamo lo strato finale e addestriamo un nuovo modello (spesso abbastanza superficiale) sopra l'output del modello troncato. Questa è la tecnica che vedrai dimostrata nei tutorial in questa sezione.