Sisteme informatice pentru asistarea deciziei

referat, referate , referat romana, referat istorie, referat geografie, referat fizica, referat engleza, referat chimie, referat franceza, referat biologie

Informatica	Educatie Fizica	Mecanica	Spaniola
Arte Plastice	Romana	Religie	Psihologie
Medicina	Matematica	Marketing	Istorie
Astronomie	Germana	Geografie	Franceza
Fizica	Filozofie	Engleza	Economie
Drept	Diverse	Chimie	Biologie

Sisteme informatice pentru asistarea deciziei

Categoria: Referat Informatica

Descriere:

Compararea se face între seturi de date comparabile, iar tehnologiile de
comparatie sunt dotate cu tehnici de observare pentru semnalizarea tiparelor,corelatiilor, asocierilor prin similitudini sau sesizeazÄƒ abateri, exceptii...

Varianta Printabila

Free Download Referat Word
Dimensiune: 142KB

Free Download Referat PDF
Dimensiune: 83.432KB

1 SISTEME INFORMATICE PENTRU ASISTAREA DECIZIEI BAZATE
PE SINTEZA DATELOR.
DEPOZITE DE DATE (DATA WAREHOUSE)

Obiective:
- �nsusirea conceptelor cu privire la sistemele informatice pentru asistarea
deciziei bazate pe analiza si sinteza datelor;
- utilizarea tehnologiilor moderne Data Warehousing si On-Line
Analytical Processing (OLAP) pentru transformarea datelor �n informatii de
sinteză;
- �nsusirea tehnicilor si metodelor de prelucrare multidimensională a datelor.
Concepte cheie: depozite de date (Data Warehouse); prelucrare analitică
on-line (OLAP); cubul OLAP; hipercub; bază de date multidimensională.
Modul �n care datele sunt retransformate �n informatii si apoi �n cunostinte
este de fapt un proces de valorificare a datelor care se realizează prin sintetizarea si analiza lor si �n final prin interpretare. Procesul de sintetizare a datelor presupune centralizarea lor, av�nd �n vedere diverse criterii si este utilizat �n crearea situatiilor de sinteză necesare informării managerilor ca support pentru luarea deciziilor.
         Solutiile oferite de informatică pentru procesul de sintetizare a datelor
sunt: programe specifice si dedicate; interogări care dau posibilitatea grupării
datelor după criterii stabilite si oferă functii pentru domeniile astfel create;
functiile de total si subtotal oferite de generatoarele de rapoarte care permit
indicarea ierarhiilor criteriilor de grupare.
         �n ultimul timp, problema centralizării datelor a rămas aceeasi, �nsă
volumul de date de explorat este imens, ceea ce duce la faptul că metodele
clasice să devină ineficiente. De aceea c�stigă tot mai mult teren tehnologii
moderne ca Data Warehousing (depozitarea datelor) si OLAP (On-Line
Analytical Processing) pe măsură ce suporturile soft devin suport de date pentru
sistemele tranzactionale.
         Tehnologiile de centralizare transformă datele �n informatii de sinteză si
analiza lor.
         Analiza datelor presupune a găsi relatii �ntre datele sintetizate cum ar fi:
asocieri, corelatii structurale, cauzale sau functionale. O formă simplă de analiză
a datelor este compararea datelor cu date similare, comparare care se face păstr�nd toate criteriile identice, doar unul singur av�nd valori diferite.
         Compararea se face �ntre seturi de date comparabile, iar tehnologiile de
comparatie sunt dotate cu tehnici de observare pentru semnalizarea tiparelor,
corelatiilor, asocierilor prin similitudini sau sesizează abateri, exceptii.
Informatica a venit �n �nt�mpinarea acestor cerinte cu tehnicile de prezentare
grafică care transformă informatia cantitativă de informatie calitativă. Au
apărut si tehnici de observare analitică a datelor care au la bază teorii
matematice prin care datele reale sunt comparate cu date teoretice produse de un
model ipotetic.
         Dezvoltarea tehnicilor de observare a dus la aparitia tehnicilor de
observare automată bazate pe data-driven. Rezultatul unor astfel de tehnici se
regăsesc �ntr-un model cu caracter general. Tehnicile de observare analitică a
datelor se regăsesc �ntr-o tehnologie modernă denumită Data Mining (�n
traducere liberă „Mineritul datelor”).
         Rezultatul procesului de observare analitică este obtinerea unor tipare,
corelatii si uneori modele din care se pot deduce tendinte sau se poate
previziona cu o anumită probabilitate cum vor arăta datele pe o perioadă
ulterioară. Modelul permite interpretarea datelor, ce reprezintă un proces
cognitiv cu o apreciere generală a situatiei, si identifică probleme, oportunităti
sau potentiale cauze de esec.
         De remarcat este faptul că interpretarea datelor duce la aparitia de
cunostinte noi care se vor cumula la cele deja existente. Instrumentele soft
clasice pentru asistarea deciziei au avut ca principal scop asigurarea tehnicilor
de analiză, optimizare si simulare, precum si reprezentarea grafică a rezultatelor.
         Dintre aceste instrumente se amintesc procesoarele de tabele Lotus si Excel orientate pe volume mici de date, cele referitoare la sistemele de gestiune
a bazelor de date Access, Visual Foxpro capabile să lucreze cu volume mari de
date cu structură uniformă. Principalul dezavantaj al acestor instrumente
clasice este că operează numai asupra acelor date care au o structură prestabilită
si provin dintr-o sursă unică. Noile sisteme de asistare a deciziei folosesc tehnici
speciale de comasare a datelor stocate �n structuri neuniforme, pentru a utiliza
informatii implicite care nu sunt specificate �n datele existente. Suporturile
software de asistare a deciziei oferă utilizatorilor o serie de facilităti cum ar fi:
interogarea �n limbaj natural, accesul la modele conceptuale, sisteme de gestiune OLAP si servicii de integrare cu alte suporturi soft.

Depozite de date (Data Warehouse)
         Necesitatea depozitelor de date este dată de volumul imens de date
acumulat �n timp de companii. Integrarea acestor date istorice ale companiei
�ntr-o structură care să stea la baza luării deciziilor a devenit principala
preocupare a noilor tehnologii.
         Sistemele de asistare a deciziei care au la bază sinteza si analiza datelor
realizează comasarea, sistematizarea, corelarea si gruparea datelor pentru a
obtine informatii care să reliefeze factorii care influentează pozitiv sau negativ
performanŃele companiei. Ca urmare a obtinerii unor astfel de informatii se
poate adopta o strategie de ameliorare a factorilor cu influentă negativă.
Obtinerea rezultatelor, sub formă de rapoarte care contin informatii utile
factorilor de decizie sunt �ntr-o formă accesibilă si sunt rezultatul tehnicilor
speciale de explorare a masivelor de date. Aceste tehnici duc la evidentierea
unor corelatii �ntre date, pot face estimări si prognoze precum si să atragă atentia
asupra unor disfunctii.
         �n sinteză tehnicile de exploatare a masivelor de date pot sugera solutii si
pot contribui la luarea deciziilor �ntr-o anume situatie
         Datele, mai precis structurile de date care fac obiectul sistemelor informatice de asistare a deciziilor sunt denumite depozite de date (Data Warehouse).
         Caracteristicile acestor structuri este faptul că ele pot �nmagazina volume
mari de date preluate din arhive si/sau din bazele de date ale aplicatiilor
informatice specifice activitătii curente a �ntreprinderii (sunt volume de ordin
1012 terabytes). Exploatarea acestor volume uriase de date este asigurată de
existenta unor motoare speciale care dau posibilitatea ca masivele să poată fi
interogate, precum si existenta unor servicii speciale de analiză on-line a
datelor (OLAP). Suporturile software sustin performantele prin transformarea
datelor, corelarea si completarea lor, precum si prin crearea dictionarului de
date, toate acestea asigur�nd accesul la structurile primare.
         Datele sunt extrase din baze de date eterogene create de sistemele
informatice deja existente �n companie pe diversele platforme hard si soft.
Se poate remarca faptul că datele sunt introduse nu la �nt�mplare, ci sub
controlul unor aplicatii si al SGBD-ului. Acestea asigură prin serviciile de
integritate, stocarea si lucrul �n condiŃii de siguranŃă maximă. Datele care
formează suportul pentru tranzacŃiile primare sunt apoi prelucrate pentru a se
obŃine informatiile de sinteză necesare planificării si luării deciziilor si sunt
tratate de instrumentele SGBD.
         Deoarece exploatarea unui volum enorm de date, pentru a obtine diverse
rapoarte, este asigurată de integritatea si coerenta bazei de date, reuniunea
tuturor acestor date duce la exploatarea unui mare număr de tabele, la crearea
unor multiple legături virtuale si tabele temporare. Acest volum mare de muncă
conduce la principalul inconvenient al depozitelor de date si anume timpul
mare necesar exploatării lor. Un alt inconvenient �l constituie si aglomerarea
motorului bazei de date cu task-uri de centralizare care �ncetineste astfel
tranzactiile curente.
         Astfel a apărut necesitatea stocării datelor care sunt dedicate planificării
si deciziilor strategice �ntr-un sistem diferit de sistemul operational �n asa fel
�nc�t functionarea celor două sisteme să se facă fără inconveniente. �n depozitul
de date se pot stoca at�t arhive de date privind activitatea anterioară, c�t si date
referitoare la tranzactii ulterioare fără ca utilizatorul să poată interveni.
         Datele se pot �nmagazina pe domenii sau activităti specifice departamentelor unei organizatii �n asa numitele magazii de date (Data Marts), separarea lor �n acest fel duc�nd la cresterea performantelor �n exploatare. Aceste depozite de date se construiesc de obicei cu tehnologii relationale. Depozitele de date sunt o concentrare de date care organizează, consolidează si centralizează datele din surse eterogene si care vor constitui baza procesărilor analitice at�t de necesare proceselor de decizie. Depozitul de date se
construieste progresiv adică el permite completări si dezvoltări ulterioare.
Pentru a se asigura o calitate sporită a datelor acestea sunt supuse unui proces
de curătire si transformare, mention�nd si maniera de obtinere a unor date
colectate pe baza celor existente, acest proces duc�nd la micsorarea timpului
cerut pentru obtinerea unor rapoarte finale. �n depozitele de date se face
transformarea codurilor �n date explicite, precum si integrarea datelor din
nomenclatoare �n datele referitoare la tranzactii. Acesta este numit si proces de
denormalizare si este caracterizat de faptul că nu modifică integritatea datelor
si grăbeste procesul de regăsire. �ntr-un depozit de date redundanta datelor este
permisă.
         Diferentele dintre depozitul de date si baza de date sunt următoarele
a. Datele continute de un sistem de prelucrare a tranzactiilor, OLTP
(On-Line Transaction Processing) sunt de tip operational, iar datele continute
de un depozit de date sunt specifice asistării deciziilor, sunt date centralizate
sau derivate din date operationale, nu se modifică �n timp si sunt destinate
utilizatorilor finali.
b. �n cazul sistemelor tranzactionale, performantele se referă la integritate, confidentialitate, sigurantă si timp de răspuns �ntruc�t un număr mare de utilizatori introduc date �n sistem, �n timp ce �n cazul SIAD (deci a depozitelor de date) numărul de utilizatori finali (manageri) este foarte mic.
Astfel si securitatea si siguranta �n exploatare nu sunt supuse unor riscuri
majore, procedurile de salvare si restaurare fiind mai putin utilizate dec�t �n
cazul sistemelor tranzactionale.
c. Datele procesate �n sistemele tranzactionale sunt �n seturi relativ mici,
introduse recent si compact, astfel �nc�t prelucrarea se face destul de rapid. �n
procesele decizionale, datele necesare acestora sunt �n volum mare, stocate
dispersat ceea ce duce la o prelucrare mai lentă.
d. Bazele de date construite pentru sisteme tranzactionale sunt proiectate
si realizate pe baza unor cerinte cunoscute si certe, modificările care intervin
datorită adaptării sistemului la schimbările intervenite reiau anumite faze ale
ciclului de viată. Dar odată implementate ele functionează perioade lungi de
timp fără modificări. �n SIAD cerintele sunt cunoscute doar partial �n momentul
proiectării si realizării lor, ceea ce obligă depozitul de date să se adapteze din
mers cerintelor. De aceea se observă că datele gestionate pentru sisteme
tranzactionale sunt privite ca un �ntreg, pe c�nd cele din depozitele de date sunt
organizate pe sectiuni deoarece ele sunt organizate �n functie de subiectul de
analiză.
e. Sistemele tranzactionale reflectă de obicei fluxul datelor din activităti curente, pe c�nd depozitele de date sunt orientate pe subiecte cum ar fi de exemplu: resurse, produse, clienti, furnizori.
         Ciclul de viată al depozitelor de date Depozitul de date (Data Warehouse) este o colectie de date orientate pe subiecte, integrate, corelate �n timp si non-volatile care sprijină decizia
         Datele care fac obiectul unui depozit sunt integrate �n acesta utiliz�nd conventii pentru măsurători, atribute. Structura de care dispune depozitul de date prevede identificarea punctuală a datelor stocate si, mai ales, un acces rapid la ele.
         Proiectarea structurii depozitului de date se face prin modelare multidimensională, structura implement�ndu-se ca o bază de date care asigură
stocarea unui volum mare de date si un acces rapid la ele, asa numitele baze de
date client/server.
         Popularea depozitelor de date se face prin preluare din sisteme tranzactionale, dar care vor fi supuse unor procese complexe de transformare
care să corespundă structurii depozitului care a fost proiectat. După această
etapă, depozitul va putea intra �n exploatare pentru a obtine analize si rapoarte.
         Etapele enumerate anterior (proiectare, populare, exploatare) sunt asistate de
un soft specializat de la browsere si generatoare de rapoarte p�nă la
instrumente specifice Data Mining.
         �n exploatarea curentă a depozitului frecvent vor apare noi cerinte
informationale care vor duce neapărat la extinderea structurii, la popularea cu
extensii cuprinz�nd date istorice, precum si la integrarea noilor date
�ncorporate �n aplicatii de analiză. Pe parcursul existentei sale, un depozit de
date este incremental si ciclic. Modelarea conceptuală a depozitului de dat �n etapa de conceptie a unui depozit de date se folosesc modele
dimensionale care grupează datele din tabelele relationale �n scheme de tip stea
sau fulg de zăpadă. �n aceste scheme pot fi regăsite date cantitative cum ar fi
cantităti sau valori sau grupate după diverse alte criterii (pe client, pe produs, pe
tipuri de servicii etc.). Datele cantitative din bazele de date dimensionale sunt de
tip medii, număr de tranzactii, centralizări după anumite caracteristici, totaluri
si reprezintă măsuri ale activitătii. Pe de altă parte, criteriile de agregare vor
fi denumite dimensiuni. Măsurile identificate prin dimensiuni vor fi stocate �ntrun
tabel relational care este denumit tabel de fapte, iar codurile utilizate sau
asociate criteriilor de agregare sunt date de tabelele de tip nomeclator asociate
fiind cu tabelele de fapte si �n acest fel schema relatională va fi de tip stea. Dacă
se reunesc mai multe scheme de tip stea care utilizează aceleasi nomenclatoare
formează un model tip constelatie. Dacă nomenclatoarele se pot divide �n
subnomenclatoare atunci există o dependentă �ntre acestea. De remarcat că
pentru acelasi cod pot exista mai multe nomenclatoare alternative. Dacă se
integrează aceste subdimensiuni si dimensiuni alternative, se creează o schemă
sub formă de fulg de zăpadă.
         Schemele de tip stea, fulg de nea sau constelatie sunt modele conceptuale
multidimensionale ale depozitelor de date, av�nd ca rol organizarea datelor pe subiecte necesare procesului de decizie. Schema este deschisă (ea se poate
modifica pe tot parcursul vietii depozitului de date).
Modul de utilizare a depozitului de date
Depozitele de date contin structuri unice, integrate si cumulative
necesare procesului de decizie. Administratorul depozitului de date are ca
principală sarcină stabilirea accesului partajat al categoriilor de manageri prin
asigurarea de parole si drepturi de acces. Datele din depozit sunt accesate
selectiv de manageri �n functie de necesitătile acestora. �n acest fel se creează
colectii specializate pe diverse domenii care se numesc magazii de date (Data
Marts). Magaziile de date se pot utiliza si ca structuri intermediare pentru
colectarea datelor din surse primare si al căror continut este descărcat periodic
�n depozitul de date. Depozitele de date pot lua nastere si printr-o stocare
exhaustivă a datelor din sistemele tranzactionale �n vederea aplicării tehnologiei
Data Mining. Utilizarea tehnologiei Data Mining presupune că procesarea
datelor se face fără interventia utilizatorilor, �n background, iar rezultatele sunt
păstrate pentru a fi consultate ulterior la cerere.

Mediul de depozitare al datelor
         Mediul �n care se construieste si se exploatează un depozit de date contine următoarele elemente: surse de date tranzactionale, instrumente de proiectare dezvoltare, instrument de extractie si transformare a datelor, sistemul de gestiune al bazei de date, instrumente de acces si analiză a datelor si instrumente de administrare
         Toate componentele enumerate sunt integrate pe o platformă Microsoft �n
mediul de lucru Data Warehousing Framework ca si �n cazul SQL Server 7.0.
Acest mediu de lucru oferă asistarea proiectării, implementării si
administrării depozitelor de date pe durata vietii (existentei) acestuia. Se poate
concluziona că Data Warehousing Framework oferă o arhitectură care se poate
integra relativ simplu cu produse ce provin de pe alte platforme, asigură servicii
de import-export cu validare si transformarea datelor, asigură metadate integrate
pentru proiectarea depozitului si gestionează suportul, task-uri si evenimente.
Pentru ca un depozit de date să poată fi procesat este necesară existenta
unui set specializat de instrumente pentru: descrierea fizică si logică a surselor
de date, a depozitelor sau a magaziei de date �n care acestea urmează să fie
�ncorporate; validarea, curătirea si transformarea datelor care urmează a fi
stocate �n depozitul de date; utilizatorii finali, instrumente care permit acestora
accesul la datele stocate �n depozitul respectiv. Astfel de instrumente sunt
specializate pentru medii de dezvoltare a aplicaŃiilor, produse program
specializate pe analiza datelor precum si pentru aplicatii personale (individuale).
Abordarea multidimensională a datelor stocate 絜 depozite. Definirea si
caracterizarea OLAP (On-Line Analytical Processing)
Dacă se analizează tehnologia relatională se observă că cea mai mare
parte a problemelor tratate relational sunt �n realitate multidimensionale. �n
modelul relaŃional problemele sunt tratate �n tabele care au două dimensiuni:
linie si coloană. Problemele reale, care �n cea mai mare parte a lor sunt
multidimensionale,nu impun limite stocării spatiale a datelor. Astfel, un SGBDR
obisnuit nu poate face fată cerintelor de agregări de date, sintetizări, consolidări si proiectii multidimensionale. De aceea, a apărut necesitatea extinderii functionalitătii unui SGBDR prin adăugarea unor componente speciale care să permită modelare si analiză multidimensională (OLAP) si Data Mining.
Noua tehnologie OLAP permite utilizatorilor navigarea rapidă de la o
dimensiune la alta si facilităti sporite de obtinere a celor mai detaliate informatii.
Tehnologia OLAP se bazează pe 11 principii formulate de Ted Codd (1992).
Acestea sunt:
1) abordarea conceptuală multdimensională a datelor;
2) asigurarea unei transparente sporite prin existenta unei arhitecturi
deschise a sistemului;
3) accesibilitatea asigurată utilizatorului prin asistarea implicării
acestuia �n modalitătile tehnice de furnizare a datelor;
4) complexitatea dimensională a analizei oferă performante stabile;
5) utilizarea arhitecturii client-server, unde server-ul are ca scop omogenizarea datelor;
6) posibilitatea de a efectua aceleasi operatii asupra tuturor dimensiunilor
si care poartă numele de prelucrare generică a dimensiunilor;
7) gestionarea dinamică a matricilor �ncrucisate prin facilitatea de a elimina combinariile dimensionale nule, pentru a nu �ncărca memoria calculatorului;
8) posibilitătile de acces simultan a mai multor utilizatori (multi-user) la aceeasi fază (etapă) de analiză;
9) operatii nerestrictive, ceea ce dă posibilitatea executării fără restrictii
a calculelor pentru toate combinările de dimensiuni si niveluri ierarhice;
10) posibilitatea manipulării intuitive a datelor;
11) număr nelimitat de niveluri de agregare si de dimensiuni

1 OLAP este tehnologia de agregare a datelor stocate �n depozite �ntr-o manieră de abordare multidimensională cu facilităti referitoare la accesul la informatii a managerilor �n mod interactiv si flexibil. Legătura dintre OLAP si depozitele de date este aceea că OLAP le completează prin transformarea volumului imens de date stocate si gestionat �n depozite �n informatii utile procesului de decizie. Cele 11 reguli ale lui Codd au fost apoi regrupate �ntr-un test cu 5 reguli denumit FASMI (Fast Analysis Shared Multidimensional Information).
OLAP presupune existenta unor tehnici care permit de la o navigare si selectie simplă a datelor p�nă la analiza detaliată si complexă. Aplicatiile care se
rezolvă pe baza acestei tehnologii au la bază analiza rapidă a informatiei
multidimensională dispersată �n locatii multiple dar accesibile unui mare număr
de utilizatori. Pentru utilizarea acestor facilităti, OLAP dispune de eficacitatea bazelor de date multidimensionale si de posibilitatea de a construi alternative
pentru diverse probleme de decizie. OLAP presupune că analiza datelor (care
pot fi de tip numeric sau statistic) poate fi predefinită de cel care creează aplicatia sau chiar de utilizatorul final.
         OLAP se caracterizează prin: perspectiva multidimensională a datelor,
capacitatea de calcul intensiv si orientare �n timp (time intelligence)
         Aspectul multidimensional al datelor este dat de posibilitatea de a integra
multiplele aspecte care caracterizează activitatea unei �ntreprinderi si care sunt
considerate din perspective multiple ca: timp, bani, produse. Fiecare dimensiune
este definită �n genere prin mai multe niveluri ca de exemplu: timpul este divizat
�n an, trimestre, luni, sezoane; produsul �n: categorii, clasă. Conceptul de
dimensiune este folosit ca �nteles de aspect, dimensiunile fiind independente si
cu unităti de măsură specifice dimensiunii respective.
         Unitătile de măsură pot constitui criterii de agregare a datelor, iar
nivelele unei dimensiuni formează ierarhia care la r�ndul ei poate constitui
criteriu de agregare a datelor. Privite din punct de vedere multidimensional,
datele sunt reprezentate �n hipercuburi de date, prin extinderea cubului
tridimensional la cel n-dimensional.
         Pe acest tip de cub se pot efectua calcule prin aplicarea unor algoritmi complecsi asupra datelor structurate �n acesta. Acestea implică posibilitatea de
adresare multidimensională directă a cuburilor unitare si optimizarea timpului de răspuns.
Caracteristica de orientare �n timp (time intelligence) presupune flexibilitatea exploatării acestei dimensiuni care este necesară pentru comparatii si aprecieri de valoare �n analizele economice. Această dimensiune este luată de
obicei din calendarele tranzactiilor economice asa cum se află �n bazele de date
ale sistemului informatic al companiei. Se pot face astfel grupări pe dimensiuni
ca: trimestre, luni, ani, sezoane. Se pot utiliza si dimensiuni speciale cum sunt:
perioada curentă, perioada precedentă, aceeasi perioadă din anul..., care trebuie
neapărat luate �n considerare la proiectarea hipercubului. Bazele de date multidimensionale folosite de OLAP sunt suprapuse depozitelor de date si
stochează straturi de date agregate pe diferite criterii ierarhice. De asemenea,
aceste baze de date multidimensionale conŃin si date statistice pentru fiecare nivel de agregare.
Modelarea dimensională – cuburi OLAP
Modelarea dimensională presupune conceptualizarea si reprezentarea
aspectelor măsurabile ale activitătii studiate �n interdependentă cu contextul �n
care acesta se desfăsoară, aspect identificat prin parametrii activitătii. Legătura
dintre valorile �nregistrate ale activitătii (valori v�nzări, cheltuieli comune,
costul produselor) si contextul de desfăsurare al acesteia formează baza
numeroaselor rapoarte de sinteză care sunt produse de sistemele tranzacŃionale.
Prin modelare dimensională se oferă un model conceptual comun acestor
rapoarte si agregarea lor �ntr-o structură uniformă si flexibilă. Totodată se
păstrează si legătura cu sursele initiale de date, deci posibilitatea de
descompunere a datelor centralizate pe niveluri din ce �n ce mai mici p�nă se
ajunge la setul de tranzactii initiale (drill-down).
Cubul OLAP se consideră a fi element structural pentru datele din
procesul on-line. Acesta este o structură multidimensională, un hipercub prin
care se modelează complexul de activităti pe o perioadă �ndelungată de timp.
Acest tip de modelare este caracterizat de c�teva concepte de bază:
• Cuantificarea activitătii (aspectul cantitativ) care se face prin utilizarea
unitătilor de măsură clasice ca de exemplu: m, m3, kg, unităti monetare. Măsuri
cantitative sunt: volum v�nzări, volum salarii, cost materiale, cost produs etc.
• Dimensiunile activitătii sunt de fapt parametrii activitătii măsurate ca
de exemplu: zi, lună, trimestru, client sau grupă de clienti. Dimensiunile sunt de
obicei de natură diferită si răspund la �ntrebări de tipul: Unde? C�nd? Cu ce? etc.
• Faptele sunt colectii ale cuantificării activitătii precum si dimensiunile care identifică modul �n care acestea s-au desfăsurat. Sursa de existentă a
faptelor este constituită din �nregistrările stocate �n tabelele de tranzactie ale
aplicatiilor operationale care sustin activitatea respectivă. Se pot folosi si dimensiuni scenarii care pot stoca �n tabelele de fapte si măsuri imaginare
alături de cele reale, pentru ca utilizatorul să poată stoca valori estimate pentru o
măsură.
         �n bazele de date tranzactionale, dimensiunile sunt de fapt c�mpuri care
contin caracteristicile unei tranzactii adică datele de identificare ale tranzacŃiilor
care sunt de obicei chei externe care fac legătura cu nomenclatoarele care le
explicitează.
         Ca atare, se poate afirma că dimensiunile se materializează �n setul de
valori posibile care formează domeniul caracteristicii respective, valori care
poartă numele de membrii dimensiunii.
         O altă caracteristică a dimensiunii este a ceea că poate avea multipli adică sunt grupe de valori ale dimensiunii cu o caracteristică comună. Grupele pot fi identificate prin atribute care se află �n nomenclatoare si pot lua aceeasi valoare pentru mai multe valori ale cheii primare. Multiplii unei dimensiuni nu trebuie să fie neapărat de aceeasi natură cu dimensiunea primară, aceasta put�nd avea mai multe tipuri de multipli �n functie de caracteristicile luate �n considerare. Se poate afirma că dimensiunile �mpreună cu multiplii lor formează structuri arborescente care sunt recunoscute de OLAP ca fiind ierarhii. Ierarhiile pot fi regulate, adică toate ramurile au acelasi număr de ramificatii sau neregulate dacă pe anumite ramuri lipseste un nivel de semnificatie. La rădăcina arborelui se află o caracteristică cu aceeasi valoare pentru toti membrii dimensiunii de bază. Acest tip de caracteristică este una implicită ca, de exemplu, unitatea care are ca activitate cea analizată sau „all”. Frunzele arborelui formează membrii dimensiunii initiale, iar dimensiunile intermediare pot fi pe mai multe nivele. Dacă arborele este neregulat, pentru a uniformiza ierarhia se poate introduce un membru de tip „alte”.
         �n acest fel se constată că centralizările pe nivelul respectiv nu vor fi de
100% din valoarea centralizată pe nivelul cel mai de jos. Atributele care definesc
ierarhia sunt atribute derivate din atributul care defineste dimensiunea acŃiunilor
măsurate, prin referire la nomenclatoare sau prin clasificări ale valorilor pe care
le poate lua atributul respectiv. De exemplu, furnizorii se pot clasifica �n
furnizori stabili dacă compania face tranzactii cu ei de mai mult de 4 ani,
furnizori noi dacă au vechime cuprinsă �ntre 1 si 4 ani si furnizori volatili sau
ocazionali dacă �n c�mpul respectiv din Furnizori nu este completat nimic. Din
acest exemplu se observă că asemenea clasificări conduc la obŃinerea unor
atribute derivate prin calcul din caracteristicile aflate �n nomenclatoare. �n acest
fel se vor obtine seturi de membri calculati ai dimensiunii. Dimensiunile
ierarhizabile se constituie �n ierarhii alternative. Nivelele ierarhiilor sunt văzute
ca nivel de agregare pentru valorile stocate �n tabele de fapte. Membrii
dimensiunilor identifică măsura activitătii stocată �n tabelul de fapte. Dacă unui
fapt �i sunt asociate mai multe dimensiuni, identificarea unică a acestuia va
necesita valori precise pentru fiecare dimensiune. Ca urmare, din tabelele de
fapte sunt selectate mai multe �nregistrări, adică toate valorile posibile asociate
dimensiunilor nespecificate.
Pentru dezvoltarea unui depozit de date, modelarea datelor are un rol important deoarece permite vizualizarea structurii �nainte ca ea să fie construită.
Modelul multidimensional reprezentat prin el va fi prezentat desfăsurat �n
sectiuni sau �n proiectii tridimensionale.
Sectiunea unui hipercub este definită ca o sectiune din cub dată prin
coordonatele sale. Proiectia este definită ca o sectiune care centralizează datele
de pe toate dimensiunile suprimate.
         Vizualizarea on-line se face de fapt tot �n sectiuni sau proiectii tridimensionale. Datele din celule sunt prezentate numai �n sectiuni sau proiectii transversale bidimensionale. Hipercubul ar putea fi imaginat ca un set de tabele pivot grupate pe dimensiunea cerută. Pentru procesul de modelare, hipercubul se poate prezenta �n formă tabelară �n care măsurile sunt evidentiate pe coloane, iar
liniile reprezintă combinatiile de dimensiuni. De asemenea, �n plan fizic,
hipercubul poate fi stocat �ntr-un tabel cu coloane multiple �n care se stochează
măsurile si cu identificatori pe r�nduri. Identificatorii de r�nduri sunt de fapt
chei formate din toate combinatiile posibile de valori ale dimensiunilor.
         Utilizarea indecsilor pentru acces rapid nu are prea mare eficientă �ntruc�t cheia este compusă din mai multe caracteristici, iar c�mpurile de valoare sunt putine si numerice, astfel că tabelul de indecsi este aproape de aceeasi dimensiune cu tabelul initial. De aceea, se utilizează tabelul bitmap pentru un acces direct
rapid. Datele modelate ca hipercuburi formeaza baze de date multidimensionale.

Baze de date multidimensionale
Baza de date multidimensională este formată din două structuri:
structura datelor �n care se stochează măsurile activitătilor preluate din tabela
de fapte a depozitului de date. Datele vor fi prezentate utilizatorului �n celulele
tabelelor pivot; structura metadatelor care este formată din totalitatea
dimensiunilor si membrilor acestora precum si din structurile ierarhice ale
dimensiunilor. Utilizatorul poate vizualiza această structură ca nume de coloane
si linii care reprezintă informatiile de pe axele cuburilor. Numerotarea nivelurilor �ncepe de la rădăcină (nivel 0) către frunze
(unde va apare nivelul maxim). Ierarhiile posedă propriile lor seturi de niveluri, chiar dacă unele ramuri sunt comune. De exemplu: ierarhia Calendar este
formată din nivelele (0-5): Timp, An, Semestru, Trimestru, Lună, Dată calendaristică, ierarhia Anotimp este formată din nivelele (0-4): Timp, An,
Sezon, Lună, Dată calendaristică, iar ierarhia Anotimp este formată din nivelele
(0-3): Timp, Săptăm�nă, Zi, Dată calendaristică. Pe fiecare nivel se stochează
membrii dimensiunilor respective. Rădăcina care se observă că este comună
(Timp) este nivelul de agregare maxim av�nd ca unic membru implicit „all”.
Orice nod �n arbore este un membru al unei subdimensiuni. Nodurile
subordonate unui nod formează un set, iar orice membru al unui set are un
număr de ordine �ncep�nd cu 0. De asemenea, orice membru poate avea
proprietăŃi ca de exemplu unele zile sunt sărbători legale, unii ani sunt bisecti.
Exemplul prezentat presupune o structură strict arborescentă �ntruc�t fiecare
membru al unei dimensiuni are submembri distincti, chiar dacă acestia au
aceleasi valori. De exemplu, fiecare an are setul lui de luni, fiecare săptăm�nă
are setul ei de zile. Ca mod de identificare, membrii vor fi calificati cu numele
membrului de pe nivelul precedent căruia acesta i se subordonează: 2000-feb,
2001-feb. Tipul acesta de dimensiuni care au membri ce se repetă se pot crea si
ulterior prin combinarea a două nivele din ierarhie sau din ierarhii diferite pentru
a crea un nivel nou, virtual.
         Pentru a se putea naviga pe o structură arborescentă, sistemele de gestiune
pun la dispozitie operatori ierarhici. De exemplu, pentru exploatarea datelor,
sistemele de gestiune oferă operatori pe hipercuburi. Fizic, datele sunt stocate
�ntr-un fisier cu acces direct pe baza adresei fizice absolute sau relative a
�nregistrării obtinute prin exploatarea tabelelor bitmap obtinute �n urma creării
structurii de date. Aceste tabele sunt puntea de legătură dintre structura de date
si structura de metadate. Iată cum se face această legătură: se stie că pentru
fiecare membru al fiecărei dimensiuni există o coloană (1 bit) �n tabele bitmap
pentru fiecare �nregistrare există un r�nd �n acelasi tabel �n care se stochează 1 �n
dreptul bitilor asociati membrilor dimensiunii existente �n �nregistrare. Datorită
acestui procedeu, c�mpul respectiv nu trebuie stocat �n �nregistrare, iar structura
datelor este redusă la un minim necesar. Din tabelul de măsuri se vor putea
selecta acele �nregistrări care au un bit 1 �n pozitia corespunzătoare bitilor 1 din
mască. Un inconvenient al tabelelor bitmap este acela că ele sunt greu de
obtinut, iar aparitia unor noi membri sunt greu de inserat �n pozitia corespunzătoare. Procesul de refacere a unui tabel bitmap este mare consumator
de timp av�nd �n vedere că tabelul de fapte din depozit (care se va transforma
�n baza multidimensională) poate avea un număr imens de �nregistrări.
Masca de interogare se obtine prin exploatarea structurii ierarhice a
metadatelor de unde se pot extrage seturi de membri pentru dimensiunile
desemnate prin specificatorii de axe. Adresarea tabelului de măsuri se face �n
mod direct pe baza unui set de adrese de �nregistrări care se suprapun cu tiparul
măstii. Din tabel se preiau �n această manieră valorile care se centralizează
pentru celula cubului cu dimensiunile sale.
         Se poate afirma că structura metadatelor este de tip ierarhic, fiecare
dimensiune fiind stocată �ntr-o structură arborescentă cu o singură rădăcină (all)
si cu o multitudine de ramuri care pot contine frunze comune (ierarhii alternative).
Orice nivel al unei ierarhii poartă un nume si contine un set de membri.
De altfel si ierarhiile alternative poartă un nume pentru a putea fi distinse.
Structura �n care sunt stocate datele este o structură cu acces direct prin tabele
bitmap exploatate prin măsti.

         Operatii OLAP asupra hipercubului
         Un hipercub este proiectat astfel �nc�t el să aibă �n vedere nivelul de
detaliu necesar �n procesul de analiză. Nivelul de detaliu (granularitatea) reprezintă numărul de membri ai unei dimensiuni. Datele pot fi vizualizate
printr-o selectie �n hipercub pe baza unui criteriu ierarhic care ar putea fi de
exemplu structura organizatională pe care o conduce un anumit manager. Dacă
de la pornire, granularitatea este prea mare, datele vor fi mult prea centralizate si
nu se va putea face dec�t o analiză grosieră. Ajustarea nivelului de granularitate este realizată de OLAP prin exploatarea ierarhiilor dimensiunilor prin comasări si descompuneri ale măsurilor prin proceduri care poartă numele de drill-up si drill-down. Prin intermediul acestor proceduri se face o deplasare a proiectiei cubului �n sus sau jos pe nivelele ierarhice ale fiecărei dimensiuni (zoom in; zoom out), execut�nd de fiecare dată centralizări ale măsurilor stocate la cea mai mică granularitate după criterii ierarhice stabilite �n prealabil.
         Este stabilit un nivel de granularitate initial sub care nu se poate cobor�.
Din acest motiv este important ca dimensiunile de bază să fie c�t mai rafinate
sau să se creeze Data Marts, unde hipercuburile sunt proiectate la nivelul de
detaliu stabilit de managementul operational. Pentru managementul superior se
va construi un depozit cu hipercuburi centralizatoare cu granularitate mare. Prin
drill-down se obtin detalii, iar prin drill-up se obtin date sintetice.
         Un alt grup de operatii oferit de OLAP este sectionarea (slicing) si
defalcarea (dicing). Prin sectionare, se creează posibilitatea selectării prin
vizualizare doar pentru un membru al unei dimensiuni, adică un plan din cubul
tridimensional. Sectiunea astfel obtinută va apare ca un tabel pilot cu valorile
dimensiunilor pe laturi si cu specificarea valorii alese pentru dimensiunea suprimată. Defalcarea (dicing) este operatia de proiectare a unei dimensiuni pe
o alta. De obicei o dimensiune din primul plan este combinată cu o altă dimensiune din ad�ncime. Acest proces se mai numeste imbricarea
dimensiunilor.
         Dimensiunile unui cub pot fi private sau pot fi utilizate �n comun si de alte
cuburi (ele provin din depozitele cu schema de tip constelatie). Proiectarea
structurilor depozitelor de date si a cuburilor OLAP este un proces ce se
desfăsoară continuu pe tot parcursul existentei (vietii) aplicatiei, dimensiunile
cuburilor fiind �n str�nsă dependentă cu detaliile activitătii structurate.
Aplicatiile construite cu tehnologia OLAP �si găsesc locul �n multiplele
domenii ale activitătii �ntreprinderilor, de la finante, bănci, marketing p�nă la
productie si v�nzări. De exemplu, activitatea de productie poate fi sustinută de
aplicatii OLAP cum sunt: planificarea operatiilor, controlul calitătii produselor,
analiza rebuturilor, analiza optimizării raportului dintre cost-beneficii.
OLAP, utiliz�nd tehnici inteligente de optimizare, beneficiază de avantajul timpului de răspuns mic.

Crearea aplicatiilor OLAP in Microsoft SQL Server
Pentru realizarea unei aplicatii OLAP sunt necesare următoarele etape:
1. Crearea bazei de date relationale (tranzactionale) care va contine datele curente ale organizatiei rezultate din tranzactii.
2. Crearea bazei de date multidimensionale, a cuburilor si tabelelor de fapte care preiau datele din baza de date relatională. Datele sunt extrase, transformate si �ncărcate �n tabelele de fapte din tabelele relationale.
3. Crearea interfetei aplicatiei �ntr-un mediu de programare visual – Visual Basic.
Crearea bazei de date tranzactionale �n Microsoft SQL Server
Datele stocate �n cadrul organizatiei sunt importate �ntr-o nouă bază de
date tranzactională ce stă la baza construirii cuburilor de date. Datele sunt
organizate �n tabele care corespund dimensiunilor, ierarhiilor si tabelelor de
fapte ale cuburilor multidimensionale.
         Ca exemplu, se va crea o aplicatie destinată analizei rezultatelor financiare ale unei bănci comerciale. Se vor analiza volumul depozitelor si volumul creditelor �n functie de următoarele dimensiuni: agentie, durată, garantie, monedă, sector de activitate, timp, tip depozit, tip client (pers fizică sau juridică). Tabelul de fapte construit va contine două măsuri: volumul depozitelor si volumul creditelor.
Crearea tabelelor �n Microsoft SQL Server se realizează prin utilizarea de scripturi, asa cum se prezintă �n exemplul de mai jos:
• create table agentie (Agentie varchar(20), Zona varchar(10), Tara varchar(10));
• create table voldepozite (Agentie varchar(20), Durata varchar(20), Moneda
varchar(20), Tipjur varchar(30), Timp varchar (20), Tipdepozit varchar(30),
voldep numeric);
• create table volcredite (Agentie varchar(20), Durata varchar(20), Moneda
varchar(20), Tipjur varchar(30), Timp varchar(20), Garantiecredit varchar(20),
Sectoractivitate varchar(20), volcredite numeric).
         Crearea bazei de date multidimensionale �n SQL Server Produsul Microsoft SQL Server oferă suportul si instrumentele necesare dezvoltării sistemelor OLAP prin setul de aplicatii SQL OLAP Services, iar gestiunea bazei de date multidimensionale este realizată de serverul OLAP.
         Se creează o nouă bază de date multidimensională care va contine
cuburile de date prin intermediul meniului New Database. Se creează cuburile
cu ajutorul asistentului Cube Wizard.
         Cuburile OLAP utilizează datele stocate �n tabelele bazei de date tranzactionale. Din acest motiv trebuie configurată conexiunea dintre cubul OLAP si baza de date tranzactională din care vor fi preluate datele. Conexiunea cu serverul de baze de date Microsoft SQL Server se realizează cu ajutorul
Microsoft OLE DB Provider for SQL Server. După stabilirea serverului
tranzactional se selectează si baza de date tranzactională din care se importă datele.
         Aplicatia OLAP contine două cuburi pe care se vor analiza cele două tipuri de operatiuni bancare: operatiunile pasive (constituirea de depozite) si operatiunile active (acordarea de credite). Pentru fiecare cub se defineste o schemă care contine �n centru tabelul de fapte legat de dimensiunile corespunzătoare fiecărei activităti analizate după cum urmează :
1. Cubul Depozite – urmăreste analiza depozitelor si a dob�nzilor pasive
rezultate din activitatea curentă a băncii.
• Dimensiunile identificate �n cadrul acestei scheme sunt: Agentie,
Durata, Moneda, Timp, Tip juridic, TipDepozit.
• Tabelul de fapte al modelului este VolDepozite av�nd ca măsură
volumul depozitelor constituite (voldep).
2. Cubul Credite – urmăreste analiza creditelor si a dob�nzilor active rezultate din activitatea curentă a băncii. �n cadrul acestei scheme se identifică dimensiuni comune cu schema operatiunilor pasive. Acestea sunt:
• Dimensiunile identificate �n cadrul acestei scheme sunt: Agentie,
Durata, Moneda, Timp, Tip juridic, Garantie credit, Sector activitate.
• Tabelul de fapte al modelului este VolCredite ce contine măsura VolCred (volumul creditelor).
         Crearea cuburilor se poate face independent (�n fereastra Cube Editor) sau
�n mod asistat (prin optiunea Cube Wizard).
�n ambele cazuri trebuie parcursi următorii pasi:
1. Alegerea tabelelor din baza de date relatională din care se importă
datele. După configurarea conexiunii dintre serverul OLAP si baza de date
tranzactională se pot vizualiza tabelele acesteia. O parte din aceste tabele contin
date necesare dimensiunilor din cuburi, iar altele furnizează date �n tabelele de
fapte.
2. Stabilirea tabelului de fapte. �n cazul cubului Depozite, tabelul de fapte Vol Depozite importă datele din tabelul voldepozite din baza de date relatională, iar �n cazul cubului Credite tabelul de fapte VolCredite importă datele din tabelul volcredite din baza de date relatională.
3. Crearea si configurarea dimensiunilor. Se aleg tabelele din baza de date relatională din care se vor importa datele �n tabelele dimensiuni.
4. Pentru fiecare dimensiune se stabilesc nivelurile ierarhice. De exemplu, pentru dimensiunea Timp, prezentă �n ambele cuburi nivelele ierarhice sunt: Luna, Semestru, An.
5. Alegerea dimensiunilor care intră �n configuratia cubului. După crearea tuturor dimensiunilor, se aleg numai cele care participă la configuratia cubului.
6. Stabilirea optiunilor de stocare si procesare a datelor din cubul OLAP.

Referat oferit de www.ReferateOk.ro

Home : Despre Noi : Contact : Parteneri

Statistici web

Copyright(c) 2008 - 2012 Referate Ok
referate, referat, referate romana, referate istorie, referate franceza, referat romana, referate engleza, fizica