Information mining: tracce digitali dati utili alla conoscenza strategica

L'Information Mining può essere spiegata in maniera semplice come l'estrazione di informazione utile da insiemi di dati. Nella società cosiddetta dell'informazione i dati raccolti e le analisi dei dati raccolti diventano sempre più determinanti per promuovere business a qualsiasi livello. Questo numero de "I Quaderni di Telèma", dedicato al settore ci accompagna in questo universo in cui la matematica viene applicata all'analisi dei dati. Questo tipo di attività è cruciale in molti ambiti della ricerca scientifica, ma anche in altri settori (per esempio in quello delle ricerche di mercato). Nel mondo professionale è utilizzata per risolvere problematiche diverse tra loro, che vanno dalla gestione delle relazioni con i clienti (CRM), all'individuazione di comportamenti fraudolenti per finire all'ottimizzazione di siti web.
In futuro i processi decisionali delle aziende potrebbero basarsi esclusivamente su questo genere di analisi, infatti la possibilità di analizzare automaticamente dati apre nuovi scenari applicativi finora inimmaginabili permettendo la creazione di una nuova gamma di servizi basati sulla conoscenza. La ricerca proposta nelle pagine seguenti dalla Fondazione Bordoni può por tare alla scoper ta di regole e associazioni nascoste nelle sequenze di dati, al riconoscimento di entità semantiche nei testi, alla modellazione in tempo reale delle rilevazioni sensoriali e strumentali, e alla profilazione implicita dell'utente. La quantità di dati digitali prodotti dall'utente aumenta vertiginosamente di giorno in giorno e dunque è quanto mai impor tante far divulgazione su questo concetto: ognuno di noi lascia una quantità sempre maggiore di tracce digitali. Da queste tracce è possibile risalire ai gusti, alle preferenze, finanche alle manie di ciascuno. La conferenza annuale più importante del settore è la KDD (Knowledge Discovery in Databases) Conference; inaugurata nel 1995, nelle ultime edizioni è arrivata a totalizzare 1000 partecipanti, con sponsorizzazioni milionarie da parte delle aziende informatiche e dei motori di ricerca. In queste pagine sono tre le tecniche specifiche approfondite: la classificazione automatica basata sugli esempi principalmente con riferimento a basi di dati); la strutturazione automatica dei risultati delle ricerche Web; e l'analisi delle opinioni ("sentiment analysis").

 Scarica il testo del quaderno in formato pdf