Valutazione oggettiva della qualità delle immagini e del video

Nell’ultimo decennio la pervasività delle immagini e dei video digitali nella rappresentazione e comunicazione dell’informazione ha portato l’individuo a relazionarsi con sistemi ricchi di segnali multimediali. Esempi tipici del massivo impiego dell’informazione visiva sono la televisione digitale, le applicazioni mobili sui telefoni cellulari, le applicazioni di social networking per la condivisione di  archivi personali di immagini (Flicker, Picasa, Facebook). La presenza di contenuti visivi nelle applicazioni multimediali e la conseguente gestione di quantità elevate di immagini e video digitali pone la necessità di disporre di sistemi automatici per la valutazione e differenziazione oggettiva della qualità delle immagini.

I sistemi automatici sono essenziali per quantificare in tempo reale l’entità delle degradazioni introdotte dai processi di acquisizione, compressione e trasmissione delle immagini e dei video. Tali sistemi, inoltre, rivestono un ruolo importante per controllare, mantenere e migliorare la qualità dell’informazione visiva percepita dagli utenti dei servizi multimediali.

Queste motivazioni sono alla base dell’interesse della comunità scientifica verso gli algoritmi e i metodi automatici di valutazione oggettiva della qualità delle immagini.

In tale contesto si colloca  l’attività  della FUB sullo sviluppo di metriche oggettive di qualità delle immagini di tipo ‘full reference’ che ha portato alla proposta dell’indice di qualità E-SSIM (Equalized Structural Similarity Index ). L’obiettivo dell’attività FUB è stato quello di sviluppare un indice di qualità capace di predire in modo uniforme i valori del MOS di un’immagine anche in presenza di differenti tipologie di degradazione. L’equalizzazione delle prestazioni dell’indice di qualità rispetto ai vari tipi di degradazione è stata ottenuta attraverso una combinazione polinomiale di una metrica di similarità strutturale e di una metrica ausiliaria di categorizzazione del disturbo capace di mostrare una sensibilità diversa rispetto al rumore e al blur. La metrica di similarità strutturale è una statistica globale ottenuta nel dominio wavelet mediando l’errore quadratico sull’informazione locale di  luminanza e di tessitura. La metrica ausiliaria è una statistica del primo ordine ottenuta calcolando la correlazione mutua locale tra i gradienti dell’immagine di test e di  quella di riferimento. L’ottimizzazione dei parametri dell’indice E-SSIM è effettuata secondo il criterio di minimizzazione LSE utilizzando un ristretto dataset di immagini di cui è noto il valore empirico del MOS. Questa procedura di ottimizzazione ha il vantaggio di fornire un indice di qualità oggettivo caratterizzato dallo stesso range di valori del MOS.

La sperimentazione effettuata sui database internazionali di immagini ha consentito di verificare l'accuratezza e la consistenza dell’indice E-SSIM come modello computazionale oggettivo di misura della qualità dell’immagine percepita da un osservatore umano.