Il prodotto di Business Intelligence di Cognos

Il prodotto di Business Intelligence di Cognos: COGNOSuite

COGNOSuite offre uno spettro completo di strumenti di business intelligence ed è composto dall’unione di tre applicazioni: Impromptu, per fare reporting e query, PowerPlay, strumento per le analisi multidimensionali OLAP, e Scenario, per scoprire relazioni e modelli nei dati (data mining). [COG1] Tutti e tre questi tool adottano un approccio ai problemi chiamato Analyze-then-Query: questa metodologia dà la possibilità agli utenti di analizzare i dati partendo prima dallo studio di informazioni riassunte ad alto livello per poi approfondire man mano la ricerca fino ad arrivare al massimo livello di dettaglio. In pratica è lo stesso modo in cui solitamente si affronta la risoluzione di un problema generale. Le tre applicazioni sono integrate per ottimizzare questo approccio. Impromptu gestisce la creazione di query e di report avanzati, PowerPlay permette di compiere analisi per esplorare velocemente i dati aziendali da ogni punto di vista, Scenario può incrementare i risultati dell’analisi cercando di scoprire relazioni e trend nascosti; da entrambi questi ultimi due programmi è possibili fare un drill-through verso Impromptu per vedere nel dettaglio i dati più interessanti. Anche se i tre tool lavorano bene integrati tra loro è comunque possibile usarli separatamente ognuno per la funzione cui è preposto. La struttura object-oriented permette l’utilizzo di questi tool ad un singolo utente come a centinaia di persone, garantendo la massima scalabilità dei prodotti, ed al tempo stesso centralizzando le operazioni di amministrazione in un unico punto per facilitare il lavoro del gestore del sistema.

Impromptu permette di creare dei report a partire da file detti cataloghi, i quali organizzano i dati, provenienti anche da database differenti, secondo una business view che isola l’utente dalla complessità dei DBMS sottostanti: in questo modo l’utilizzatore può concentrare la sua attenzione sulla creazione del report vero e proprio. La generazione delle singole query è facilitata dal Wizard che aiuta l’utente a creare filtri e gruppi, ad ordinare i dati e ad ottimizzarne i tempi di estrazione. Ogni report può essere personalizzato dal punto di vista estetico, aggiungendo totalizzazioni, grafici, immagini ed ogni altro tipo di file utilizzabile come oggetto in Windows per essere visualizzato a schermo, stampato o distribuito in rete in formato HTML, in modo da poter mostrare i risultati di una query a più persone semplicemente utilizzando un comune browser.

PowerPlay, uno dei software di analisi OLAP più utilizzati, organizza i dati estratti dalle diverse fonti in PowerCube, cioè in strutture gerarchiche multidimensionali che riducono il volume dei dati stessi e permettono di avere una visione “manageriale” dell’andamento dell’azienda. I dati possono essere visualizzati sotto forma di tabelle o di grafici, anche tridimensionali, per fornire all’utente la massima flessibilità di utilizzo; l’interfaccia grafica permette funzioni come lo slice-and-dice o il drill-down (semplicemente cliccando sui dati aggregati si possono visualizzare le informazioni che li compongono al livello inferiore).

Tipico strumento di datat mining, Scenario permette invece di scoprire nuove informazioni a partire dai dati a disposizione. La sua schemata grafica permette di scoprire facilmente i fattori che governano il business ed in quale modo, grazie all’utilizzo di tecniche di clustering e di alberi decisionali. I risultati delle analisi vengono presentati sotto forma di grafici, alberi, tabelle ed anche come testi scritti.

Oltre alle applicazione principale in COGNOSuite sono compresi alcuni strumenti utili all’ottimizzazione del lavoro, come Scheduler, che permette di lanciare i lavori e le relative applicazioni ad orari prestabiliti, o Portfolio, che permette di distribuire i risultati delle analisi a altre persone sotto forma di applicazioni visive interattive. Importatnte è l’uso di Scheduler quando si devono estrarre grandi quantità di dati perché è possibile effettuare l’operazione in notturna, quando la rete aziendale è meno intasata e la disponibilità dei PC è totale. Administrator infine permette di definire diversi profili-utente, ognuno dei quali è autorizzato a compiere solo alcune funzioni o accedere solo a certi file creati con i tool di COGNOSuite, in modo da garantire la riservatezza e la sicurezza delle informazioni: per esempio la creazione dei cataloghi di Impromptu da parte degli amministratori di sistema può essere effettuata anche tramite un’interfaccia che sfrutta l’automazione OLE.

Un report è una visione organizzata e formattata dei dati estratti da un database in risposta ad un problema economico-gestionale. Impromptu è il programma di COGNOSuite sviluppato per generare dei report. L’interfaccia grafica Windows-style permette di creare report piuttosto facilmente e permette inoltre di personalizzarne fortemente l’aspetto esteriore: dalla semplice tabella si può arrivare a report con grafici e immagini a colori, a lettere standard, a etichette per buste. Quest’ampia libertà dal punto di vista dell’aspetto esteriore aiuta gli utenti ad evidenziare maggiormente, all’interno di un report, le informazioni più importanti: oggigiorno infatti non si può più pensare di fornire alla direzione amministrativa e gestionale di un’azienda un report composto magari da decine di pagine su tabulato. L’importanza della presentazione è cruciale per far avere il giusto peso alle informazioni: generalmente vengono maggiormente considerati pochi dati ben presentati che tanti dati confusi e “monotoni”.

Nei report creati da Impromptu è possibile [COG2]:

· Filtrare, raggruppare e ordinare i dati;

· Vedere i dati da differenti prospettive (per esempio nella forma compatta delle tabelle a doppia entrata, o crosstab report);

· Fare calcoli matematici sui dati;

· Creare somme parziali e totali dei dati estratti;

· Formattare i report in modo da conferire un aspetto più piacevole e funzionale ai dati;

· Creare dei grafici di varie forme;

· Creare etichette per buste o lettere standard.

Alcune di queste operazioni possono essere fatte sia in fase di creazione del report che dopo l’estrazione dei dati: questa seconda possibilità è comoda nel caso si stia creando un report per la prima volta e non si ha idea del numero di record che verranno estratti ed elencati. La prima volta che si crea un nuovo tipo di report è inoltre consigliabile procedere per tentativi, includendo nell’estrazione iniziale anche i dati che non si è sicuri di utilizzare per poi affinare la ricerca filtrando i dati già estratti (ma senza aggiungerne di nuovi): in questo modo ogni volta che si ricrea il report non è necessario estrarre ancora fisicamente i dati, ma basta “scegliere” gli indici voluti che sono già presenti nel catalogo locale.

Il report “base” creato da Impromptu è il list report: si tratta di un report che presenta i record estratti dal database incolonnati secondo i vari campi: è un tipo di presentazione utile quando si vogliono analizzare nel dettaglio i singoli dati. Il crosstab report invece è una tabella a doppia entrata che presenta i valori in ogni incrocio già sommati: in questo modo si possono visualizzare grandi quantità di dati in modo compatto. È anche possibile creare crosstab nidificate.

Benché siano presenti molte funzioni automatiche che guidano l’utente nella creazione di report standard, è comunque sempre possibile personalizzare facilmente ogni report. In un report è possibile incorporare, oltre alle varie tabelle, anche testi, immagini, grafici ed oggetti OLE.

I cataloghi di Impromptu

Impromptu unisce tutte le procedure di accesso al database ed estrazione dei dati in un unico file detto catalogo (estensione .cat). Un catalogo può essere visto come un ponte che collega Impromptu al database vero e proprio, perché contiene solo i puntatori ai dati (cioè i cosiddetti metadati), e non i dati stessi, che quindi continuano a risiedere nel database d’origine: in questo modo è possibile avere una vista logica dei file e dei campi del database a prescindere da come questo sia fisicamente realizzato. L’utente finale di Impromptu è dunque schermato dalla complessità del database (tabelle, join, indici, sintassi SQL, nomi di file criptici, ecc.) da cui prende i dati grazie al catalogo creato dall’amministratore del sistema e può quindi concentrare la sua attenzione solo sul lavoro manageriale e creativo. Ogni catalogo definisce quindi una singola vista dei dati aziendali; l’amministratore del sistema, in base alle necessità di ogni categoria di utenti, provvede a configurare i cataloghi in modo da definire le diverse viste necessarie e le funzionalità del sistema abilitate per quella categoria.

Prima di definire un catalogo bisogna definire il database che verrà usato da Impromptu. La definizione del database consiste nello scegliere il nome logico da dare al database, il tipo di database, la localizzazione del database e i parametri di sicurezza. Impromptu può accedere a molti tipi di database, come Oracle, Microsoft SQL Server, DB2, ODBC ed altri ancora. Un limite che pone l’uso dei cataloghi è quello di non poter accedere simultaneamente a più database di diverso tipo (per esempio un catalogo non può puntare contemporaneamente un database Oracle ed uno dBASE). Questo limite però può essere aggirato grazie all’uso degli HotFile, cioè a tabelle locali di dati generate a partire dalle colonne dei database da cui prendono i dati stessi; includendo un HotFile in un catalogo è possibile condividerlo tra più utenti (sempre che il catalogo non sia di tipo Personale) senza che questi si accorgano della diversa natura delle tabelle, proprio per la funzione di schermo logico del catalogo. Oltre a questa funzione gli HotFile possono anche essere usati come database locali (per esempio se una query deve essere lanciata spesso è utile che i dati siano già presenti sulla macchina, in modo da non dover continuamente accedere alle risorse di rete) oppure per inserire manualmente dei dati in un report, senza dover creare un database apposito.

Per ridurre il numero di accessi al database Impromptu può utilizzare delle fonti di dati alternative, oltre ai già citati HotFile, quali:

· Snapshot: la funzione snapshot sposta tutti i dati necessari per un report in una cache sul PC per poi salvarli nello stesso file del report (*.imr), in modo che non sia necessario accedere ulteriormente al database (lo snapshot è una sorta di “fotografia” del database). L’uso degli snapshot permette di modificare in un secondo tempo la struttura del report, sempre che non siano però richiesti nuovi dati (nel qual caso è necessario fare un refresh per aggiungerli). L’impiego degli snapshot è utile quando si vuole far utilizzare il report a chi non ha accesso al database o per vedere il report su un computer portatile. Un’altra funzione utile può essere quella di fungere da deposito storico di dati estratti in un determinato momento;

· Thumbanils: la funzione thumbnails permette l’estrazione di un numero limitato di record dal database al PC locale, in modo da limitare il continuo accesso al database stesso durante la fase di creazione di un report, perché è proprio in questa fase che, per metterlo a punto accuratamente, è necessario fare continue prove. A differenza degli snapshot però è possibile richiedere nuovi dati che Impromptu si fa carico di estrarre di volta in volta dal database.

Le query generate da Impromptu si basano sul linguaggio SQL (Structured Query Language), ma non è necessario che l’utente conosca questo linguaggio perché è il programma stesso che traduce in SQL le impostazioni scelte dall’utente nelle finestre di dialogo che lo guidano durante la generazione delle query.

In un catalogo, oltre ai metadati, si trova definita la struttura del database puntato e cioè i nomi delle tabelle e dei campi selezionati, le relazioni tra le varie tabelle (join), le condizioni (per esempio i filtri e i raggruppamenti) ed i nuovi campi calcolati.

L’amministratore del sistema può definire quattro diversi tipi di cataloghi:

· Personale: è un catalogo che non si vuole rendere disponibile ad altri utenti di Impromptu;

· Distribuito: è un catalogo “master”, che viene utilizzato da altri utenti come base per definire poi i propri cataloghi personali. In questo modo l’amministratore può definire diversi livelli di utilizzo e di “privilegi” in base alle categorie di utenti definite nel catalogo master. Inoltre ogni cambiamento del master si riflette automaticamente su tutti i cataloghi creati successivamente;

· Condiviso: è un catalogo che può essere usato contemporaneamente e modificato da più utenti. Anche in questo caso possono essere definite diverse categorie di utenti;

· Protetto: è un catalogo read-only che solo il creatore può modificare. Gli utenti possono solo vedere i report basati su questo tipo di catalogo senza poterli modificare né tantomeno accedere al database sottostante.

I cataloghi distribuiti, condivisi e protetti sono generalmente situati in reti LAN, in modo da essere visibili e utilizzabili da più postazioni di lavoro contemporaneamente.

	Vedere report	Creare o modificare report	Modificare i folder	Copia personale dell'utente	Accesso multiplo
Personale	Si	Si	Si	No	No
Distribuito	Si	Si	Si	Si	Si
Condiviso	Si	Si	No	No	Si
Protetto	Si	No	No	No	Si
Tabella 13 - Tipi di cataloghi

All’interno di un catalogo le tabelle ed i campi sono organizzati in folder e item in modo da dare all’utente una vista chiara dei dati a disposizione e strutturata secondo criteri di business. Chi crea il catalogo può creare, spostare, rinominare e cancellare gli elementi a suo piacimento. Dopo aver inserito le tabelle ed i campi nel catalogo è necessario definirne le relazioni: è possibile definire diversi tipi di join a seconda delle esigenze dell’utilizzatore oppure lasciare creare i join automaticamente ad Impromptu; in questo caso il programma si rifà alle chiavi già definite nel database o collega i campi che hanno lo stesso nome.

Tipo di join	Operatore	Descrizione
Equi join	=	Prende titti i record di due tabelle i cui valori delle colonne collegate sono uguali. È il join più comune.
Non-equi join	<>, <, >, <=, >=	Prende tutti i record di una tabella i cui valori delle colonne collegate soddisfano il criterio definito.
Self join	Qualsiasi dei precedenti	Confronta i dati di una colonna di una tabella con altri dati presenti nella stessa colonna. Può essere usato solo dopo aver definito una alias table.
Outer join	Non applicabile	Prende tutti i record di una tabella anche se non ci sono record corrispondenti in un'altra tabella.
Compound join	Non applicabile	Utile quando due colonne definiscono una sola chiave da collegare ad un'altra tabella. Può essere usato anche in combinazione con un non-equi, self o outer join.
Complex join	Non applicabile	Usa un'espressione creata con Expression Editor per collegare due tabelle.
Tabella 14 - Tipi di join possibili

È comunque possibile creare o modificare i join, aggiungere e togliere tabelle in qualsiasi momento anche dopo la creazione del catalogo. Nel caso in cui la struttura logica dei dati sia abbastanza complessa è possibile farla analizzare al sistema per prevenire possibili loop nei join o tabelle isolate.

Utile nell’uso dei cataloghi è la definizione dello user profile: consiste nello specificare una o più categorie di utenti (user class) che condividono gli stessi privilegi di accesso all’interno di un catalogo; per privilegio si intende la possibilità di limitare l’accesso solo ad alcuni dati (filtrando cioè gli altri), la possibilità di modificare il catalogo o quella di creare nuovi report. L’uso delle user class risulta quindi comodo per poter servire esigenze diverse senza dover cambiare ogni volta la struttura del database. Le categorie d’accesso sono organizzate secondo una gerarchia ad albero (la categoria creator ne è la radice), in modo da ricalcare una generica struttura organizzativa: quindi ciò che non è permesso ad una categoria di utenti è automaticamente vietato anche a tutte le sue categorie figlie. Ogni utente viene riconosciuto dal sistema tramite una password, diversa per ogni categoria.

L’amministratore del sistema, tramite i cataloghi, può porre dei limiti all’uso dello stesso sistema aziendale agli utenti di Impromptu: questa funzionalità è utile quando la rete aziendale non è molto veloce oppure è sovraffollata e si vuole evitare che un utente occupi per troppo tempo le risorse. Si possono limitare il numero delle tabelle utilizzate in un report, il numero dei record estraibili, il tempo massimo di estrazione dei dati, si può bilanciare il carico di lavoro tra la rete ed il PC locale (per default Impromptu usa il bilanciamento flessibile tra server e PC) e si possono anche assegnare dei pesi alle diverse tabelle in modo da velocizzare l’esecuzione delle query SQL.

In un catalogo si possono inoltre definire condizioni, calcoli e prompt: una condizione può essere vista come un’espressione che confronta dei campi o dei valori all’interno di ogni record e può essere usata come un filtro, come un’espressione if-then oppure per cambiare l’aspetto esteriore di alcuni dati (per esempio si può voler scrivere in rosso i valori negativi). Nel catalogo possono poi essere creati dei campi calcolati: per esempio, per convertire la valuta di una cifra che si trova in un campo misto si può unire una condizione ad un calcolo. Un prompt è una finestra che compare al momento del lancio di un report e che permette di scegliere i valori da assegnare ad un parametro, che può anche fungere da filtro (per esempio si possono inserire gli estremi temporali di una ricerca). Condizioni, calcoli e prompt creati in un catalogo vengono automaticamente applicati a tutti i report generati a partire da quel catalogo; le stesse operazioni però possono anche essere applicate a singoli record, anche se nel catalogo non sono state definite.

Con Impromptu è possibile automatizzare il lavoro di creazione dei report, per facilitare il compito degli amministratori di sistema: per esempio si possono creare dei report standard (può essere utile distribuire agli utenti interessati dei report predefiniti non alterabili) o dei template (modelli su cui basarsi nella creazione dei report finali). Inoltre è possibile definire delle macro da lanciare al momento della creazione di un report o in qualsiasi altro momento; le macro di Impromtu si basano sull’automazione OLE per generare degli oggetti quali:

· Application: da una qualsiasi applicazione OLE si può invocare Impromptu;

· Report: si può aprire un report di Impromptu da un’altra applicazione OLE;

· PublishHTML: pubblica un report in linguaggio HTML;

· Expression: permette di inserire un’espressione in un report;

· Store Procedure: immagazzina dei dati in un database a partire da uno script OLE;

· SelectedFrame: rappresenta un singolo frame scelto dall’utente all’interno di un report.

Anche molte operazioni sui cataloghi possono essere automatizzate poiché i cataloghi stessi, i database, le tabelle, le colonne, le user class ed altro ancora sono trattati essi stessi come oggetti OLE.

La creazione di report, la generazione di snapshot o di HotFile, il lancio di macro, ma anche l’apertura di altre utility, sono tutte operazioni che possono anche essere lanciate da Scheduler, il modulo di programmazione temporale di CognoSuite. Questa funzionalità è comoda per esempio nel caso in cui si debbano fare delle estrazioni di dati particolarmente lunghe: queste possono essere effettuate in notturna, in modo da non sovraccaricare la rete durante l’orario lavorativo; oppure può essere utilizzata per le operazioni ripetitive come la creazione di report giornalieri, settimanali e così via.

PowerPlay rende facile ad ogni utente di una azienda esplorare dati OLAP per migliorare le performance gestionali: analizzando dati presentati in forma multidimensionale (“metacubi”), grazie alla visualizzazione grafica avanzata, diviene facile scoprire gli indicatori-chiave delle prestazioni aziendali, i trend, le irregolarità (o le eccezioni) ed in generale tutti quegli aspetti nascosti di un business. Ogni cubo di PowerPlay in sostanza rappresenta un vero e proprio data mart perché può essere popolato con dati provenienti da molti tipi di fonti differenti, quali database (relazionali e non), data warehouse, data mart o anche semplici fogli di calcolo.

Con PowerPlay è facile distribuire i risultati delle proprie ricerche all’interno di una azienda perché i cubi creati possono essere conservati in rete (sia in una rete LAN che in un server Web) ed utilizzati da più utenti contemporaneamente. PowerPlay Enterprise Server (la release dedicata agli amministratori di sistema) può essere utilizzato sia in ambiente UNIX che NT e permette di immagazzinare i cubi OLAP in database relazionali nonché di accedere a cubi creati con altri software come Hyperion Essbase, IBM DB2 OLAP e Microsoft OLAP Services; il controllo e la gestione dei cubi e degli utenti è centralizzato in modo da aumentare la sicurezza del sistema. Altre versioni di PowerPlay, dedicate solo agli utenti finali, sono quelle per Excel, per Windows, Web, che permette di visualizzare le analisi multidimensionali direttamente all’interno di un browser (e quindi richiede pochissimo training agli utenti), ed infine Personal Server, adatto all’uso su PC portatili. Inoltre PowerPlay garantisce l’acceso ai dati solo agli utenti autorizzati perché in ogni cubo possono essere definite più classi di utilizzatori, ognuna con dei privilegi e dei limiti specifici. PowerPlay si configura dunque come un prodotto dotato di grande scalabilità perché può essere usato dal singolo utente di un ufficio come da centinaia di persone in una grande azienda.

Transformer

Transformer è il modulo di PowerPlay che permette di creare, sviluppare e distribuire i report multidimensionali: il suo compito è quello di trasformare i dati aziendali, presenti nei database in forma ancora grezza, in cubi ordinati, in modo che possano essere facilmente gestiti con PowerPlay. Una volta organizzati i dati in dimensioni, livelli, categorie e misure è possibile creare il cubo, o meglio il metacubo, visto che le dimensioni possono essere più di tre, ed analizzarlo tramite PowerPlay. Un cubo può essere salvato come file .mdc (metodo standard) ma anche come file per MS SQL Server, Oracle o Sybase in un database su un server (esistono allo scopo in Trasformer delle utility per creare e configurare le tabelle del database prima del salvataggio del cubo).

Generalmente gli utilizzatori di Transformer sono gli addetti al servizio EDP di una azienda, perché costoro conoscono meglio di altri l’organizzazione dei database e dei data warehouse aziendali, mentre gli utenti di PowerPlay sono i manager che studiano l’andamento dell’azienda. Visto che chi crea i cubi (o al limite chi crea i template su cui poi vengono elaborati i singoli cubi) a volte non ne è l’utilizzatore, può capitare che il creatore non riesca a capire fino in fondo quali siano le finalità del cubo: è quindi necessario che indaghi su chi usa i report multidimensionali (e sul suo grado di conoscenza dello strumento che utilizza) e per quale scopo, in modo da centrare subito l’ottimizzazione della struttura dati.

Il processo di creazione e distribuzione di un cubo può essere sintetizzato in otto fasi:

· Analisi delle informazioni richieste;

· Studio della struttura dei database da cui prendere i dati e del numero di query necessarie;

· Disegno del modello strutturato;

· Determinazione delle diverse categorie di utenti e assegnazione delle priorità d’accesso;

· Decisione su dove immagazzinare il cubo;

· Creazione del cubo;

· Distribuzione del cubo;

· Update dei dati.

È proprio in Transformer che si definisce il livello di dettaglio dei dati che si vuole fornire agli utenti finali, anche se in alcuni casi è comunque possibile andare ancora più in profondità, usando la funzione drill through per vedere il massimo livello di dettaglio nei report-sorgente.

Transformer può leggere i dati da molte fonti, locali (fogli di calcolo come Excel o Lotus 1-2-3 o database come Access, Paradox, dBASE ed altri ancora) o di rete, come data warehouse o database relazionali: questi ultimi non possono però essere letti direttamente da Transformer e dunque in questo caso è necessario usare Impromptu (ma anche un qualsiasi altro programma analogo) per generare una query-definition (di estensione .iqd) che poi Transformer legge, interpreta ed usa per accedere ai dati. L’uso di Impromptu è comodo anche perché, una volta inserita una query sotto forma di file .iqd, Transformer le associa automaticamente il report collegato (*.imr) creando così una prima strategia di drill-down.

Transformer lavora con file detti modelli (di estensione .mdf). Ogni modello può prendere dati contemporaneamente da più fonti diverse, alle quali devono essere associate query differenti. Nella creazione di modelli a query multiple è bene tenere presente che per ottimizzare le prestazioni del cubo ogni dimensione deve essere composta da una singola query. Creare query multiple può anche essere utile nel caso si estragga una gran quantità di dati dalla stessa fonte per velocizzare la creazione del cubo: in questo caso basta suddividere la query in più query complementari tra loro. Per creare i join tra le diverse query, e quindi posizionare i dati nella stessa dimensione e nello stesso livello, basta rinominare con lo stesso nome i campi da collegare. Transformer però non riesce a unire direttamente le colonne appartenenti a query diverse (o meglio, le associa in diverse dimensioni) per cui è necessario usare uno strumento come Impromptu come fonte diretta di dati.

Le query possono essere di due tipi:

· Structure query: contengono le colonne che definiscono la struttura del modello e generalmente sono composte da molti campi ma pochi record (solo quelli necessari a generare tutte le categorie);

· Transaction query: contengono le misure da inserire nel modello e, al contrario, sono caratterizzate da pochi campi e molti record.

Questa è una distinzione solo concettuale utile in generale, ma è sempre possibile usare query che contengono informazioni sia sulla struttura che sulle transazioni.

Quando si leggono dei dati bisogna fare attenzione ad eventuali categorie non univoche (soprattutto nel caso di query multiple), che possono generare errori nella creazione del modello: in questo caso conviene usare dei codici univoci (come contatori) o inserire queste categorie in un contesto di livello superiore (per esempio i nomi di città possono essere associati alle regioni o agli stati in cui si trovano).

Una volta selezionata la fonte dati Transformer genera automaticamente (ma la funzione si può escludere) un primo modello, composto da dimensioni, livelli, categorie e misure. Una dimensione è un ampio raggruppamento di dati omogenei che rappresenta un aspetto preciso del business aziendale (dimensioni tipo sono quella temporale, quella geografica, prodotti, personale, ecc.). Ogni dimensione viene poi suddivisa in livelli, che contengono categorie allo stesso grado di dettaglio o hanno attributi comuni. Le categorie sono dunque i dettagli finali che vengono analizzati e sono presenti ad ogni livello in una dimensione. All’interno di ogni dimensione viene dunque definita una gerarchia, detta drill-down path, che parte dalle categorie di più alto livello per scendere man mano fino a quelle dei livelli più bassi. Le ultime entità che vengono definite in Transformer sono le misure, cioè i dati numerici usati per stabilire le performance aziendali: in ogni modello possono essere definite più misure, in modo da poter analizzare i dati da differenti punti di vista (per esempio per analizzare un prodotto venduto possono essere usate come misure i ricavi, la quantità ed il margine).

Selezionata la propria fonte dati, per default Transformer crea automaticamente un modello basandosi su delle “supposizioni” fatte in base al contenuto e ai nomi delle tabelle lette. Spesso il risultato non è adeguato ai bisogni dell’utente, però in alcuni casi risulta utile, soprattutto quando si ha a che fare con la dimensione temporale dei dati. Si possono quindi cancellare le dimensioni sbagliate o senza senso, aggiungerne di nuove, rinominarle, ecc. in modo da far combaciare il modello con gli interessi dell’utente; la stessa cosa può essere fatta con i livelli e le misure. Le operazioni sono semplificate dall’interfaccia grafica che presenta due finestre: in una c’è l’elenco delle tabelle a disposizione e nell’altra la struttura del modello; il modello può essere modificato semplicemente con un drag-and-drop tra le due finestre. Già a questo punto è possibile vedere in un diagramma ad albero la struttura del modello che si sta creando completa delle categorie o semplicemente vedere il numero di categorie presenti in ogni livello di ogni dimensione: è bene infatti tenere presente che per creare un modello ben strutturato in ogni livello non devono essere presenti troppe categorie (perché ne diminuirebbero la leggibilità in PowerPlay) ma allo stesso tempo è bene non esagerare col numero dei livelli. Inserire nuovi livelli a mano (non considerati cioè in nessuna query) può inoltre essere utile per analizzare le informazioni da nuovi punti di vista.

In ogni livello è comunque possibile nascondere o sommare i dati se non si necessita del massimo livello di dettaglio: per esempio se si estraggono i dati di vendita relativi agli ultimi cinque anni non è necessario avere il particolare di ogni giorno ma basta quello del mese. In questo caso si potrebbe anche cambiare il livello di definizione del dettaglio all’interno della stessa dimensione (cosa possibile in Transformer: basta cancellare dal diagramma ad albero i livelli non necessari di ogni categoria): è così possibile avere il dettaglio mensile dei primi quattro anni e quello giornaliero dell’ultimo.

In una dimensione è anche possibile creare dei drill-down alternativi, cioè avere due suddivisioni diverse e parallele dei medesimi dati che alla fine convergono in un livello comune: ciò è utile per esempio se si sta creando un modello in cui è la dimensione tempo è presente sia come calendario solare che come calendario fiscale.

Per definire la dimensione tempo bisogna innanzitutto considerare se ci si vuole basare sul calendario solare o meno (per esempio gli anni fiscali sono diversi dagli anni solari). Per quanto riguarda l’uso del calendario solare la suddivisione possibile è ovviamente in giorni, settimane, mesi, quadrimestri ed anni. Se però si vuole ridefinire totalmente la dimensione temporale è utile la funzione Date Wizard, che permette facilmente di stabilire il giorno di partenza dell’anno, la suddivisione tra i vari mesi, ecc. Manualmente si possono anche modificare il numero di mesi in un anno (per esempio se ne possono inserire tredici), i giorni in un mese e così via.

Per particolari tipi di analisi è possibile raggruppare categorie appartenenti a diversi livelli in uno solo (Manual Level, diversamente dai Source Level generati dalle colonne delle query), semplicemente copiando la categoria nel nuovo livello: esteriormente l’informazione appare duplicata ma nella struttura dati questa rimane singola; così se muta il suo valore il cambiamento viene riflesso su entrambe le categorie visualizzate. Oppure si possono creare nuove categorie calcolate a partire da quelle estratte; il Date Wizard per esempio ne crea automaticamente alcune tra le più comuni, come il confronto tra lo stesso mese di anni diversi. Le categorie calcolate sfruttano non solo semplici calcoli matematici ma anche istruzioni condizionali if-then-else. Anche le stesse misure possono essere calcolate a partire dalle misure presenti nelle query.

Quando si vuole distribuire il cubo creato a persone che necessitano di informazioni differenti (per esempio hanno bisogno dei dettagli solo della propria area geografica) si possono definire come in Impromptu delle user class dove si specifica quali dati mostrare e quali no a ciascun utente: possono essere nascoste singole categorie o intere dimensioni; per alcuni livelli è anche possibile mostrare solo la somma dei valori ma non i dettagli. Il procedimeto di creazione delle user class è centralizzato nel modulo Authenticator, che salva tutte le informazioni in forma criptata. Questo metodo è utile se le informazioni da mostrare ai diversi utenti sono poco diversificate; se al contrario c’è bisogno di una forte personalizzazione è meglio creare un Gruppo di cubi: nel gruppo sono presenti dei cubi in ognuno dei quali ci sono solo le informazioni necessarie ad una singola categoria di utenti. Lo stesso procedimento si può utilizzare per nascondere alcune misure a certi utenti: per esempio ai manager del reparto vendite si può voler mostrare solo il fatturato e non il margine netto.

Ogni volta che si ricrea uno stesso cubo (magari per aggiornarne il contenuto) tutte le informazioni già presenti vengono riscritte: ciò può essere particolarmente scomodo nel caso si debba estrarre dal database una notevole quantità di dati, la maggior parte dei quali ha solo funzione storica e non cambia tra un’estrazione e l’altra. Per evitare di perdere tempo ogni volta è possibile configurare il cubo in modo che ad ogni nuova creazione, a parte la prima, Trasformer estragga dal database solo i dati che non erano presenti precedentemente (update incrementale). Non è però consigliabile incrementare troppe volte uno stesso cubo perché il procedimento di update riduce le prestazioni del cubo stesso in termini di tempo di utilizzo in PowerPlay; l’ideale sarebbe ricreare il cubo ex-novo dopo un certo numero di update. Ovviamente anche la creazione e l’update dei cubi possono essere effettuati tramite l’utility Scheduler.

Per velocizzare la creazione di grossi cubi si possono consolidare i dati “storici” sommando, per esempio i record uguali tra loro, in modo che Transformer impieghi meno tempo ad estrarre i dati dal database e sia più semplice e snella la visualizzazione in PowerPlay. Oltretutto non è necessario includere tutti i singoli dati atomici nel modello perché con la funzione drill-through è sempre possibile visualizzare per ogni cubo il report che funge da fonte dati (basta selezionare un valore per vederne in dettaglio tutte le componenti). Il drill-through è molto comodo quando i dati in PowerPlay provengono da report di Impromptu, ma si può usare anche un qualsiasi altro programma; il drill-through può anche essere fatto tra un cubo ed un altro cubo oppure tra un cubo ed un qualsiasi file supportato dall’automazione OLE. Se però i tempi di estrazione dovessero rimanere ancora troppo lunghi si può pensare, come ultima soluzione, all’interposizione di un data warehouse o un data mart tra il database e Transformer.

Per quanto riguarda la gestione dei cubi in corso di utilizzo bisogna considerare attentamente dove immagazzinarli: se per le piccole imprese (o per aree limitate di grandi imprese) non nascono problemi nel gestire localmente i cubi su PC o LAN, per grandi imprese (o anche solo per loro dipartimenti) diviene conveniente immagazzinare i cubi in un database e pensare di creare e gestire i cubi con un Transformer client ed uno server, che si preoccupa solo della loro distribuzione.

PowerPlay

Il cuore dell’interfaccia grafica di PowerPlay è la dimension line: è una barra che contiene tutte le dimensioni e le misure del cubo sotto forma di folder. Cliccando su un folder si possono vedere tutte le categorie presenti nel livello visualizzato dal folder in quel momento; una volta selezionata una categoria questa appare anche sulla schermata principale nella tabella o nel grafico visualizzati. Per visualizzare un qualsiasi dato è comunque possibile fare un semplice drag-and-drop tra gli elementi sullo schermo. Per muoversi in giù nella gerarchia di dati basta cliccare sul dato o sull’etichetta (di riga o di colonna) prescelta e automaticamente PowerPlay fa un drill-down nella categoria inferiore.

Oltre la seconda dimensione la visualizzazione sfrutta i layer: ogni layer rappresenta una categoria della dimensione ed in ognuno di essi è presente un contatore che segnala quale categoria è visualizzata al momento. Scorrendo gli indici è possibile vedere tutti i dati relativi.

PowerPlay può creare due tipi di report:

· Explorer: in ogni riga vengono visualizzate le categorie appartenenti ad uno stesso livello della dimensione scelta: quando si fa un drill-down in una categoria, questa viene rimpiazzata da tutte le sue componenti; la visualizzazione di una nuova dimensione causa la sparizione della vecchia. Anche le totalizzazioni cambiano di conseguenza. È possibile visualizzare dati in forma percentuale;

· Reporter: righe e colonne possono visualizzare contemporaneamente categorie appartenenti a diversi livelli ed anche diverse dimensioni. Ogni elemento può essere aggiunto o rimosso a piacimento dell’utente, lasciando la massima libertà nella visualizzazione delle informazioni. In questo caso facendo un drill-down si aggiungono nuove categorie alla vecchie senza che queste scompaiano. La stessa cosa succede quando si inseriscono nuove dimensioni. È possibile inserire categorie calcolate.

La struttura di Explorer è dunque più rigida, ma allo stesso tempo più ordinata di Reporter; in ogni caso è possibile passare da un tipo di visualizzazione all’altra in qualunque momento e quindi, per esempio, si possono aggiungere categorie calcolate a dati percentuali.

PowerPlay può visualizzare i dati sia come tabelle a doppia entrata (crosstab) che sotto forma di grafici di vario tipo, come linee, barre, a torta, ecc.. In entrambi i casi è possibile fare un drill-down semplicemente cliccando sull’elemento voluto. Per i grafici il drill-down può essere fatto anche dalla legenda “attiva”. Per spostare le righe e le colonne di una tabella o per scambiarle tra loro basta “trainarle” col mouse fino al nuovo punto di inserimento; alle tabelle possono poi essere aggiunti header e footer che riassumono i dati visualizzati. Si possono creare “top ten report” semplicemente ordinando i dati: ci pensa PowerPlay ad aggiungere la colonna delle posizioni.

In ogni schermata è possibile visualizzare contemporaneamente più oggetti, siano essi tabelle o grafici, e possono essere aggiunti titoli, immagini e testi. Ogni entità sullo schermo (righe, colonne, grafici, legende o titoli) può essere ridimensionata a piacimento e spostata in qualsiasi parte dello schermo stesso.

In PowerPlay possono anche essere visualizzate più misure contemporaneamente, cosa utile soprattutto se si vuole confrontare dati reali con quelli di budget. È possibile evidenziare le eccezioni, in modo che risultino più visibili (per esempio scrivendo i valori in rosso), secondo regole prestabilite o scelte dall’utente.

Ogni report può essere pubblicato in formato HTML (in caso di più layer si avranno più pagine).

Scenario è uno strumento di Data Mining che permette di identificare velocemente e disporre in ordine di importanza i fattori che hanno un significativo impatto sul business aziendale oltre che permettere di analizzare in profondità gli stessi fattori per poterne capire le relazioni nascoste. L’uso di Scenario rende possibile:

· la classificazione delle performance aziendali, la segmentazione del mercato, la ricerca di trend, lo studio dei profili dei clienti e la ricerca di singoli dati particolarmente interessanti (outlier);

· la classificazione dei fattori che influenzano il comportamento di una azienda e lo studio del loro reciproco rapporto;

· la scelta degli strumenti statistici di analisi dei dati;

· la scelta personalizzata della visualizzazione dei dati;

· il benchmarking tra dati simili;

· l’uso di altri strumenti di reporting ed analisi multidimensionale per rendere più efficaci i risultati delle analisi.

Scenario dunque è un programma adatto ai decision-maker, grazie al quale possono permettersi di analizzare i dati in profondità da soli, senza aver bisogno di essere affiancati da esperti in statistica.

Durante una analisi Scenario determina quali colonne di dati in un report hanno un qualche impatto su una colonna-obiettivo: i record di ogni colonna vengono suddivisi in diversi “segmenti” in modo da permettere all’utente di identificare le caratteristiche dei dati che possono essere associate a dei cambiamenti nell’obiettivo: è questo il punto di partenza da cui il programma permette di individuare le relazioni chiave che guidano il business aziendale.

Scenario richiede un singolo file di dati per le proprie analisi: il file può essere un report di Impromptu, un cubo di PowerPlay, un foglio di calcolo (Excel o Lotus 1-2-3), una tabella dBASE o anche un semplice file di testo. L’analisi di Scenario può anche partire da un template, cioè da un’analisi in bianco preformattata, in cui sono già stati configurati alcuni parametri come l’obiettivo o le colonne da escludere. Dopo aver riconosciuto automaticamente i tipi di dati presenti nelle colonne (testo, numero, data o codice) Scenario richiede di selezionare una colonna obiettivo (è una misura di business, che può anche essere calcolata), che fungerà nell’analisi da variabile dipendente, mentre tutti gli altri dati saranno le variabili indipendenti. Come PowerPlay anche Scenario ha la possibilità di utilizzare sia il calendario solare che quello fiscale (definito dall’utente) per condurre analisi temporali. Inoltre Scenario, quando capisce che in una colonna del file si trovano dei campi di tipo data, genera automaticamente alcune colonne calcolate (le più comunemente usate), come i singoli mesi in un trimestre o in un anno, o come i trimestri in un anno.

In ogni momento si possono comunque sempre aggiungere nuove colonne di dati (anche calcolate) o eliminarne altre, cambiare il loro formato (per esempio si possono definire gli estremi dei segmenti in ogni colonna) o rinominarle, cambiare la strategia di test utilizzata, specificare come trattare i dati mancanti o le eccezioni, cioè tutto ciò che serve a mettere a punto e sviluppare meglio l’analisi nei dettagli. Le colonne non necessarie possono anche non essere rimosse, benché il lasciarle può diminuire la leggibilità dei risultati.

Per assicurare l’accuratezza e l’affidabilità dei risultati dell’analisi Scenario usa una parte dei dati come test di verifica; la definizione dei set di dati usati come controllo dipende dal numero di record presenti nella fonte dati e dalla strategia scelta dall’utente tra:

· Certify: richiede almeno un migliaio di record ed usa un largo test set (la metà dei dati è usata come test) e stringenti criteri statistici (livello di confidenza all’1%). Questa strategia è utile se si vuole avere risultati molto precisi ed affidabili, ma produce meno fattori significativi rispetto alle altre;

· Test: richiede meno record (almeno 300) e ne usa un terzo come test; il livello di confidenza è al 5%. È utile come punto di partenza per analisi più complesse e con più dati;

· Explore: non pone nessun limite minimo ai record da utilizzare e non usa alcun test set; il livello di confidenza è al 10%. Viene utilizzata per esplorare i dati, scartare le colonne meno significative, identificare le anomalie e come base per analisi più approfondite.

Se l’obiettivo dell’analisi è trovare le anomalie è necessario che non sia presente il test set, perché altrimenti un’anomalia potrebbe capitarvi dentro e non essere più visibile.

Nel caso in cui la fonte dati sia molto grande il tempo di analisi può essere elevato. Per ridurre i tempi di analisi può allora essere utile non usare tutti i record ma solo una loro parte, estratta in modo casuale (per non far perdere attendibilità ai risultati) dal database. Se si vuole essere certi dei risultati di una analisi condotta su un campione di dati si può estrarre un nuovo campione (refresh) e rifare la stessa analisi: se i risultati coincidono vuol dire che non sono affetti da errori dovuti al campionamento.

Una volta caricati i dati Scenario li analizza per cercare le colonne che determinano particolari effetti sull’obiettivo: queste colonne, definite fattori, appaiono nel Factor Box in ordine di importanza insieme ad un indicatore numerico (rating) che segnala il livello percentuale di impatto sull’obiettivo. Vengono evidenziati anche gli altri fattori che hanno una qualche correlazione col fattore selezionato. Per ogni fattore Scenario suddivide i record in gruppi, detti segmenti, a seconda dei valori della variabile dipendente che generano: ogni segmento contiene dunque record simili ed è statisticamente diverso dagli altri per dimensione, valore medio, mediana, range, ecc. È possibile anche creare dei nuovi segmenti a mano, raggruppare diversi segmenti (affini per una particolare analisi) in gruppi e cancellare quelli inutili. I valori che vengono visualizzati graficamente per ogni segmento sono:

· Valore del segmento: rappresenta il valore medio dei dati obiettivo relativo al segmento selezionato;

· Dimensione del segmento: è la dimensione percentuale del segmento in base a tutti i record;

· Linea mediana: se non è centrata vicino alla media vuol dire che i dati non sono uniformemente distribuiti nel segmento;

· Variazione dei dati: rappresenta il sottosegmento dei record (50% dei dati) più vicini alla media: in pratica è l’unione del secondo e del terzo quartile. Minore è l’area evidenziata (shaded box) e più simili sono i record all’interno del sottosegmento. È importante confrontare la posizione relativa dei diversi sottosegmenti perché se questi sono ben distanziati vuol dire sono strettamente connessi alle variazioni dei dati obiettivo;

· Eccezioni o anomalie: sono i valori (outlier) che cadono al di fuori del range di dati più comuni.

Uno dei parametri usati da Scenario per stabilire il rating di ogni fattore è proprio il grado di sovrapposizione delle shaded box e la loro dimensione.

In Scenario vi sono quattro diversi modi di visualizzare i risultati di una analisi: Graph, Tree, Data ed Explain. In modalità Graph View i dati di tutti i segmenti vengono visualizzati su un unico grafico e i valori medi vengono uniti da una spezzata, la cui pendenza mostra la relazione tra il fattore selezionato e l’obiettivo: una pendenza positiva (sale da sinistra a destra) indica una proporzionalità diretta tra il fattore e l’obiettivo, una negativa indica una proporzionalità inversa; se la curva non ha una pendenza sempre positiva o sempre negativa è difficile capire l’impatto del fattore sul target. Maggiore è la pendenza e più importanza ha il fattore in esame nello spiegare le variazioni all’interno dell’obiettivo. Se sull’asse orizzontale si pone un indicatore temporale, o comunque una scala continua, la pendenza della spezzata può essere considerata come un trend. La pendenza della curva però non è l’unico modo per valutare l’importanza di un fattore perché bisogna anche tenere presente il valore del suo rating. In modalità Tree View si può esplorare un singolo segmento e vedere quali sono i fattori che lo influenzano maggiormente. Espandendo uno dei fattori si crea una gerarchia ad albero su più livelli: si può così scendere sempre più in dettaglio e scovare nuove relazioni nascoste. In modalità Data View si possono vedere ed analizzare i singoli record. In modalità Explain invece si può avere l’analisi espressa in termini testuali, sia del fattore sotto esame che degli altri fattori a lui direttamente collegati nella gerarchia.

La visualizzazione di dati che rappresentano delle categorie o delle classi è leggermente differente da quella di valori numerici continui: quello che serve sapere in questo caso è quanto volte è presente una certa categoria in ogni segmento (cioè la sua distribuzione) e non un valore medio. Quindi nella Graph View vengono rappresentate delle barre che rappresentano la frequenza; eventualmente è comunque possibile trasformare la visualizzazione a barre in quella numerica per vedere i dati statistici come la media, la mediana, ecc. di ogni segmento.

Per conoscere la rilevanza dei risultati di una analisi c’è un indicatore sempre presente nell’angolo in basso a destra dello schermo che esprime in forma percentuale l’aderenza tra l’analisi condotta e le variazioni dell’obiettivo: se il valore è alto vuol dire che i fattori presi in considerazione spiegano bene l’andamento della variabile dipendente. In generale però non è possibile dire oltre quale valore un’analisi è soddisfacente perché ciò dipende dalla prevedibilità dell’obiettivo (per esempio le variabili meteorologiche sono obiettivi molto poco prevedibili); comunque più si analizza in profondità la gerarchia dei fattori e maggiore è il valore dell’Overall Fit. Questo indicatore può fungere anche da segnale sulla bontà relativa dell’analisi in corso, perché è possibile conoscere il Best Fit (relativo ai dati a disposizione) espandendo tutti i rami della gerarchia.

Per concentrare l’analisi su particolari ambiti è possibile filtrare i segmenti da prendere in considerazione: per esempio si possono scegliere solo i segmenti che hanno il valore medio più alto, \più basso o che cade in un determinato range di valori, oppure solo quelli che contengono un determinato numero di record. Nella visualizzazione ad albero i segmenti non interessanti possono essere ridotti in modo da lasciare in evidenza solo quelli più importanti oppure un segmento interno alla gerarchia può apparire sullo schermo come radice, nascondendo i segmenti a cui appartiene.

Se un segmento presenta pochi record può capitare che la presenza di alcuni outlier (generalmente sono valori anomali o affetti da errori) abbia una certa influenza sui parametri statistici del segmento stesso, come il valore medio: è possibile quindi escludere dall’analisi questi record e ripristinare i valori statistici corretti. La stessa presenza di un segmento composto da pochi record, accanto ad altri più corposi, può essere indice di valori poco attendibili.

Scenario rende possibile anche il benchmarking tra due file, cosa particolarmente utile per confrontare diversi set di file aggiornati periodicamente e scoprire come un obiettivo si è modificato nel tempo. Per facilitare la diffusione delle informzioni tra più persone che seguono la stessa analisi è possibile mettere dei bookmark nei grafici, ossia dei commenti allegati ad uno o più segmenti che possono essere letti in tutte le modalità di visualizzazione.

Scenario può essere usato anche in collaborazione con Impromptu e PowerPlay, sia perché può utilizzare come fonte dati sia i PowerCube (comodi da usare perché presentano grandi quantità di dati in forma già aggregata) che i report di Impromtu sia perché da Scenario è possibile passare i risultati di una analisi ad entrambi gli altri programmi. Inoltre Scenario può essere trattato come un oggetto OLE. È anche possibile esportare i diagrammi, gli alberi ed i testi col semplice taglia e incolla di Windows: in questo caso però le immagini vengono esportate come metafile.

Per completare l’offerta di prodotti riguardanti il data mining Cognos offre 4Thought, che, anche se non fa strettamente parte del pacchetto COGNOSuite, si integra bene con le sue applicazioni. 4Thought è un prodotto che permette di condurre analisi predittive ed è il naturale proseguimento di Scenario nel campo delle analisi avanzate di data mining. Caratteristiche principali di 4Thought sono l’efficacia delle misure degli elementi di business attuali in rapporto ad un ipotetico andamento ottimale, le analisi what-if e la possibilità di fare dei forecasting partendo dai dati storici. Grazie alla possibilità di elaborare analisi what-if è possibile sapere in anticipo l’impatto sul business aziendale di una variazione dei fattori principali che lo compongono: per esempio è possibile conoscere l’evoluzione del fatturato nel caso si aumenti il budget di una certa area oppure anticipare le reazioni della clientela a fronte di un aumento del prezzo di vendita. Dai dati storici è possibili estrarre utili informazioni sull’andamento del mercato, sulla gestione delle scorte, ecc. 4Thought è dunque uno strumento di modellazione piuttosto versatile.

Il procedimento di analisi parte dalla raccolta dei dati, prosegue con la creazione di un modello e termina con l’interpretazione dei risultati grazie ad un’interfaccia business-oriented ed è schematizzabile come:

· Data collection: 4Thought può utilizzare come fonte dati tutti i componenti di CognoSuite, Impromptu, PowerPlay e Scenario, ma anche Excel o altri programmi simili. È anche possibile inserire dati manualmente o crearli ad hoc in modo rapido e semplice;

· Data transformation: 4Thought riesce a identificare automaticamente le anomalie e le tralascia dall’analisi. Si possono inserire nuovi campi calcolati, come rapporti o percentuali;

· Data exploration: i dati possono essere visualizzati come foglio di calcolo o soprattutto come grafici, per facilitarne la comprensibilità;

· Model creation: 4Thought crea i modelli automaticamente ed in modo interattivo, selezionando gli obiettivi di business e i fattori che si suppone li influenzino;

· Interpretation: vi sono delle funzioni statistiche e grafiche che permettono di interpretare facilmente i risultati di una analisi dal punto di vista gestionale.

Il processo di creazione del un modello si compone di quattro fasi:

· scelta della misura di valutazione del business, cioè della variabile dipendente (o output): può essere il ricavo, il margine, i costi, ecc.;

· identificazione dei fattori (le variabili indipendenti) che influenzano l’obiettivo: la scelta sta all’utente che deve basarsi sulla sua esperienza o su analisi condotte in precedenza (per esempio con Scenario);

· costruzione del modello da parte del software;

· applicazione dei risultati del modello.

Per capire la bontà e la qualità di un modello creato si può analizzare il suo comportamento al variare della dimensione del set di dati da analizzare: per in buon modello pochi dati o valori mancanti nei file non devono fermare il processo di modellizzazione, così come grandi quantità di dati devono migliorarne la qualità generale e la sua abilità predittiva.

Se si vuole, per esempio, costruire un modello di forecast della domanda di un certo mercato e si hanno a disposizione dei dati storici periodici la rete neurale di 4Thought riesce a trovare le relazioni tra il volume della domanda e i fattori, quali la stagione, il tempo, l’attività della concorrenza, ecc. Generato il modello è facile trarre delle previsioni sull’andamento futuro. È inoltre possibile isolare l’effetto di ogni singolo fattore estraendo delle cross-section.

4Thought si integra bene con gli altri programmi per la Business Intelligence di Cognos: infatti è possibile effettuare analisi su PowerCube (e quindi su dati già riassunti), su report di Impromptu (usando dati provenienti da database relazionali ed altre fonti) e su analisi di Scenario, su cui ci si può basare per esempio per costruire delle previsioni.

Capitolo 4 Indice