Analisi dei log di un motore di ricerca multimediale

Questa attività riguarda l'analisi dei log delle ricerche effettuate dagli utenti nel corso del 2010 sul Catalogo Multimediale Teche di RAI.

Questo tipo di studi non è molto comune in letteratura, dove invece c'è una forte attenzione sui log dei motori di ricerca per il Web. I dati originali (circa sei milioni di interrogazioni) sono stati pre-elaborati per ripulirli, normalizzare il testo, comprimerlo mediante codifica, ed estrarre mediante procedure euristiche dati strutturati nella forma di coppie attributo-valore. Successivamente sono state effettuate una serie di analisi sia a livello di singole interrogazioni sia a livello di sessione di ricerca, quest'ultima essendo stata modellata come una sequenza di interrogazioni legate cronologicamente e concettualmente. L'estrazione delle sessioni ha consentito in particolare di modellare e studiare le strategie di riformulazione delle interrogazioni impiegate dagli utenti nelle loro ricerche.

È stato evidenziato che il dimensionamento dell'insieme di risultati recuperati in seguito ad una interrogazione ha un impatto modesto sul comportamento degli utenti, i quali invece adottano decisioni che non sembrano compatibili con la logica di reperimento delle informazioni del sistema, con la conseguenza di una utilizzazione non ottimale delle risorse disponibili.