Reti neurali convoluzionali (CNN)
1. Visione artificiale e architetture CNN
Le CNN sono alla base della visione artificiale, permettendo al modello di “vedere” e interpretare immagini. Concetti chiave:
- Convoluzione: filtri che estraggono caratteristiche locali dall’immagine
- Pooling: riduce le dimensioni mantenendo le informazioni principali (max pooling, average pooling)
- Architetture famose: LeNet, VGG, ResNet
2. Interpretazione e visualizzazione dei filtri
Visualizzare i filtri e le mappe di attivazione aiuta a capire cosa impara la rete: - Individuare pattern e feature rilevanti - Diagnostica del modello in caso di errori
3. Compiti principali delle CNN
- Classificazione: assegnare etichette a intere immagini
- Segmentazione: identificare ogni pixel con la sua categoria
- Object Detection: localizzare oggetti e classificarli all’interno dell’immagine
4. Lab pratico
Applicazione concreta:
- Riconoscimento di immagini su dataset MNIST
- Personalizzazione di una rete ResNet per compiti specifici
- Osservazione di come cambiano le performance modificando i layer e i filtri

Nessun commento:
Posta un commento