Upload
eugenio-parodi
View
227
Download
1
Embed Size (px)
Citation preview
Business Intelligence Semantic Model
Tomislav Piasevoli
SoftPro Tetral d.o.o.
Sommario
• Cos’è BISM?
• PowerPivot
• SQL Server „Denali”
• Il significato di BISM
• Linee Guida
Pre requisiti
• Interesse per la BI
• Curiosità
Poche domande prima di partire...
• Quanti di voi hanno lavorato con PowerPivot
• Quanti di voi hanno lavorato con PowerPivot su SharePoint?
• Quanti di voi hanno esperienza nella costruzione di cubi?
• Quanti di voi hanno usati i cubi per creare la reportistica?
COS’E’ BISM?1
Sistemi di Analisi
• Trasformare dati in informazioni
• Obiettivi dell’architettura
1. Ottimizzare l’accesso ai dati
2. Preparare i dati per l’analisi
I – Ottimizzare l’accesso ai dati
• Memorizzare i dati in strutture adeguate per l’analisi e query ah-hoc o lasciarli «cosi come sono» sulla fonte dati
• requisiti– Buone prestazioni– flessibilità– scalabilità– ...
• Quale tecnologia utilizzare o scegliere ‘
MOLAP, ROLAP, HOLAP
• row-based databases– MOLAP = Multidimensionale– ROLAP = Relazionale– HOLAP = Ibrido (solo per gruppo di misure = fatti)
• prestazioni basate su aggregazioni• partizionamento• compressione (MOLAP)• Non limitato dalla memoria disponibile
II – Preparare i dati per l’analisi
1. Consentire l’analisi dei dati come se ci fosse un’unica fonte– In realtà ci possono essere diverse fonti sorgente
• databases relazionali• File Excel• File di testo• RSS feeds, ...
– Dove effettuare il collegamento tra queste fonti ?
2. Fornire l’interpretazione (logica business) ai dati– Come renderli comprensibili all’utente finale
Semantic data model
• Un livello di Metadati– Descrive i concetti (entità) e le connessioni
(relazioni) tra di loro– E’ orientato all’utente
• Mostra ciò che le tabelle e le relazioni rappresentano nel mondo reale.
semantica= lo studio del significato
UDM
• Modello semantico esistente per la BI• Fornito con SQL Server 2005• Consente di collegare dati provenienti da fonti
diverse– Aggiungere le relazioni tra le tabelle– Aggiungere calcoli
• Nelle tabelle – colonne calcolate DSV (T-SQL)• Sul modello – MDX script (MDX)
– I calcoli non possono essere combinati (Linguaggi differenti!) o è molto difficile farlo
UDM – Modello dati 1/3
UDM – Modello dati 2/3
UDM – Modello dati 3/3
UDM – Analisi dei Dati
SQL Server 2005 Analysis Services
MDXMDX MDXMDX
MDXMDX
MDXMDX
MDXMDX
SQL Server 2008 Analysis Services
MDXMDX MDXMDX
MDXMDX
MDXMDX
SQL Server 2008 R2 Analysis Services
MDXMDX MDXMDX
MDXMDX
MDXMDX
PowerPivot add-in for Excel 2010
POWERPIVOT2
PowerPivot
• Versione integrata in SQL Server 2008 R2 Analysis Services
• Copre sia la Self Service BI che la BI Corporate
IntegrazioneExcel 2010 SharePoint 2010
• free add-in for Excel 2010 (www.powerpivot.com)
• Versione a 32-bit e 64-bit
• SQL Server 2008 R2 x64• Durante l’installazione
selezionare SQL Server PowerPivot for SharePoint
25
VertiPaq
• Database «in-memory» basato su colonne• Compressione dei dati molto elevata• Scala in maniera lineare con il nome di
processori• Non richiede un processo di progettazione e di
costruzione di aggregazioni.• Previsto per sostenere il partizionamento di
grandi formati dei dati. (anche se non lo fa in PowerPivot)
BISM v1
• Nuovo modello semantico per la BI• Presente in SQL Server 2008 R2 (PowerPivot!)• Consente di collegare dati provenienti da varie
fonti dati– Aggiungere relazioni tra le tabelle– Aggiungere misure calcolate
• In tabella – colonne calcolate (DAX)• Nel modello – misure calcolate(DAX)
– I calcoli possono essere combinati. (Stesso Linguaggio)
BISM v1
• Si fondono insieme la base analitica e la base di reportistica
– reporting, analysis, dashboards e scorecards– Bi personale, di gruppo e aziendale• Lavora in cached (VertiPaq)
BISM v1 – Modello dati
BISM v1 – Analisi dei dati
SQL SERVER „DENALI”3
BISM v2
• Un modello per tutto– reporting, analysis, dashboards, scorecards– personal, team, corporate BI• È stato annunciato che ci sarà un supporto sia
per i valore in cache (VertiPaq) e in tempo reale.*
* Solo con sorgente dati su SQL Server per adesso.
Pass-through
• Nessun database aggiuntivo• I dati rimangono come nei database originali• Ideale per analisi real-time
BI semantic model e i suoi strati
Analysis Services „Denali” - UDM
MDXMDX MDXMDX
MDXMDX
MDXMDX
MDX
Analysis Services „Denali” - BISM
MDXMDX MDXMDX
MDXMDX
MDXMDX DAX
DAX
DAX
PowerPivot „Denali” add-in for Excel 2010
Miglioramenti annunciati di BISM
• Gerarchie, KPIs, Padre-Figlio, drillthrough, Prospective
• Funzioni DAX nuove (RankX, DistinctCount, GroupBy, Lookup, ...)
• Sicurezza (basati sui ruoli con Active Directory.)
Cosa non ci sarà nel BISM in „Denali” ?• Alcune delle caratteristiche UDM
– scripts, azioni, traduzioni– object model– write-back
• Altro– realtime per sorgenti diverso da SQL Server– Supporto query MDX
Miglioramenti UDM in „Denali”
• Per lo più al di fuori di GUI– Non più di 4GB di limite di una stringae limit– Miglior supporto per PowerShell– Miglior monitoraggio (XEvents)– Varie ottimizzazione del motore.
• l'obiettivo è quello di rendere SSAS (istanza UDM) più scalabile
IL SIGNIFICATO DI BISM4
Vantaggi di BISM
• Modelli relativamente semplici (no cubi, dimensioni, misure, ...)
• Risposta veloce indipendetemente dalla granularità della query
• Flessibilità (ogni colonna può essere un attributo o una misura)
• Calcoli in DAX molto simili alle formule Excel• Formato del modello relazione col risultato di
essere più comprensibile per la maggior parte delle persone.
Il modello semantico
Scalabilità
Excel SharePoint „Denali”
Altri vantaggi di BISM
• Sviluppo più rapido che in UDM
• Prototipi realizzare dagli utenti finali
• Facilità di cambiare il modello
• Riduzione dei costi di sviluppo di una soluzione di BI
Nuove possibilità nella modellazione dei dati• Punti salienti da vari blocìg
– Marco Russo – ad-hoc joins, ETL?– Thomas Ivarsson – master-detail design– Alberto Ferrari – point-in-time, SCD-2, rank
LINEE GUIDE5
Posizionamento del BISM
MOLAP
PowerPivot
BISM
Usabilità
2 GB
100 GB
5 TB
source: Thomas Kejser, SQLCAT
50 TB
ColumnStore
Scalabilità= - buon supporto per le query concorrenti - non dipende dalla memoria disponibile - buona manutenibilità
Conclusioni
• BISM non sostituisce di UDM
• DAX non sostituisce MDX
• Ogni modello ha i suoi vantaggi
• Chi realizza le soluzioni di BI decide e consiglia qual è il modello migliore.
Vantaggi e Svantaggi
complex models
m2m
scope
ad-hoc models
leaf level
Sviluppatori BI
• La maggior parte delle soluzioni esistenti rimangono in UDM
• Nuove soluzioni– Usano UDM per sistemi complessi (calcoli
complessi, write-back, forecasting, ...)– Si prova BISM come soluzione potenziale per i
nuovi o semplici progetti.
• UDM eBISM possono essere installati insieme su diverse istanze
Utenti, ecco il kit fai da te
• Provare Office 2010
• Installare il PowerPivot for Excel 2010 add-in
• Caricare e relazionare da varie fonti dati
• Provare e studiare DAX
• Analizzare i propri dati
• Convalidare la completezza del modello
Il modello giusto?
• Self Service BI– Excel 2010 e PowerPivot
• Corporate BI– SharePoint 2010 e SQL Server „Denali“
Modello non ancora ok?
• Miglioramenti– Esperienza degli utenti e degli sviluppatori– Consulenti esterni
• Miglioramenti possibili?– PowerPivot– SQL Server „Denali“ (istanza BISM)
• Altro...– Implementazione di modelli UDM basati su BISM
source: TechNet
Related content
• Presentations– MS BI Roadmap (SQL Server Denali)
• Workshops– Build Your First Microsoft BI Solution with SQL
Server 2008 R2