84
SISTEME INFORMATICE PENTRU ASISTAREA DECIZIEI (SIAD) Titular disciplină: Prof.univ.dr. Zenovic GHERASIM [email protected] Denumirea cursului: Sisteme informatice pentru asistarea deciziei (SIAD) Tip curs: obligatoriu Durata cursului / Nr. credite: un semestru / Perioada de accesare a cursului: Anul universitar 2018-2019 prelegeri si laboratoare 20 febr. 2019- 30 mai 2019 Manuale recomandate: 1. Gherasim, Z., Fusaru, D., Andronie, M. Sisteme informatice pentru asistarea deciziei economice, Editura Fundaţiei România de Mâine, Bucureşti, 2008. 2. Fusaru, D., Cocianu, C.L., Gherasim, Z., Andronie, M. Sisteme expert şi Sisteme informatice pentru asistarea deciziei, Teste grilă, Editura Fundaţiei România de Mâine, Bucureşti, 2006. 3. Zaharie, D., Albescu, F., Bojan, F., Ivancenco, V., Vasilescu, C. Sisteme informatice pentru asistarea deciziei, Editura Dual Tech, Bucureşti, 2001. 4. Filip, Fl.Gh. Decizie asistată de calculator. Decizii, decidenţi. Metode şi instrumente de bază, Editura Tehnică şi Editura Expert, Bucureşti, 2002. 5. Filip, Fl.Gh. Sisteme suport pentru decizii, Editura Tehnică, Bucureşti, 2004. 6. Oancea, M. Sisteme informatice pentru asistarea deciziei bancare, Editura ASE, Bucureşti, 2005.

SISTEME INFORMATICE PENTRU ASISTAREA DECIZIEI (SIAD) · Sistemele informatice pentru asistarea deciziei, SIAD – implică folosirea elementelor aplicative din discipline diverse

  • Upload
    others

  • View
    66

  • Download
    3

Embed Size (px)

Citation preview

Page 1: SISTEME INFORMATICE PENTRU ASISTAREA DECIZIEI (SIAD) · Sistemele informatice pentru asistarea deciziei, SIAD – implică folosirea elementelor aplicative din discipline diverse

SISTEME INFORMATICE PENTRU ASISTAREA DECIZIEI (SIAD)

Titular disciplină: Prof.univ.dr. Zenovic GHERASIM

[email protected]

Denumirea cursului: Sisteme informatice pentru asistarea deciziei (SIAD)

Tip curs: obligatoriu

Durata cursului / Nr. credite: un semestru /

Perioada de accesare a cursului: Anul universitar 2018-2019

prelegeri si laboratoare 20 febr. 2019- 30 mai 2019

Manuale recomandate:

1. Gherasim, Z., Fusaru, D., Andronie, M. – Sisteme informatice pentru asistarea deciziei

economice, Editura Fundaţiei România de Mâine, Bucureşti, 2008.

2. Fusaru, D., Cocianu, C.L., Gherasim, Z., Andronie, M. – Sisteme expert şi Sisteme

informatice pentru asistarea deciziei, Teste grilă, Editura Fundaţiei România de Mâine,

Bucureşti, 2006.

3. Zaharie, D., Albescu, F., Bojan, F., Ivancenco, V., Vasilescu, C. – Sisteme informatice

pentru asistarea deciziei, Editura Dual Tech, Bucureşti, 2001.

4. Filip, Fl.Gh. – Decizie asistată de calculator. Decizii, decidenţi. Metode şi instrumente de

bază, Editura Tehnică şi Editura Expert, Bucureşti, 2002.

5. Filip, Fl.Gh. – Sisteme suport pentru decizii, Editura Tehnică, Bucureşti, 2004.

6. Oancea, M. – Sisteme informatice pentru asistarea deciziei bancare, Editura ASE,

Bucureşti, 2005.

Page 2: SISTEME INFORMATICE PENTRU ASISTAREA DECIZIEI (SIAD) · Sistemele informatice pentru asistarea deciziei, SIAD – implică folosirea elementelor aplicative din discipline diverse

Obiectivele cursului:

Obiectivele cursului de Sisteme informatice pentru asistarea deciziei (SIAD) sunt:

revederea şi fixarea noţiunilor de bază din teoria sistemelor economice integrate şi teoria deciziei

în general, şi a sistemelor informatice integrate, în special; definirea conceptelor fundamentale

specifice SIAD; tratarea celor trei tipuri de SIAD-uri: bazate pe modele, bazate pe analiza şi

sinteza datelor (tehnica OLAP) şi Data Mining; câştigarea unor deprinderi în folosirea

componentelor de asistare a deciziei din produsul informatic Microsoft Excel, din instrumentul

informatic QM şi din Microsoft SQL Server 2005 (Analyses Services, Data Mining).

Modul de stabilire a notei finale: nota este cea care rezultă din evaluarea prin teste

grilă, pe platforma BlackBoard.

Consultaţii pentru studenţi: în fiecare joi de la ora 10 - 12, la sala 2.5, etaj 2, corp B..

Adresa de e-mail responsabilului pentru contactul cu studenţii:

[email protected].

Tematica disciplinei:

1. ASISTAREA DECIZIEI ECONOMICE

1.1 Definirea, rolul şi locul sistemelor informatice pentru asistarea deciziei

1.2. Decizia: loc, rol, clasificare

1.3. Decidenţii

1.4. Consideraţii asupra asistării deciziilor

1.5. Clasificarea sistemelor informatice pentru asistarea deciziei

1.6. Sisteme suport pentru asistarea deciziei

1.6.1. Subsistemul de gestiune a datelor

1.6.3. Subsistemul de gestiune a cunoştinţelor

1.6.4. Interfaţa cu utilizatorul

2. SIAD-URI BAZATE PE MODELE

2.1. Consideraţii referitoare la modele şi metode

2.2 Algoritmi euristici

2.3. Tabele de decizie şi arbori de decizie

2.4. Optimizare cu algoritmi – programare matematică

2.5 Simularea

2.5.1.Conceperea şi proiectarea modelului

2.5.2. Simularea cu instrumente in Excel

2.6.Teoria jocurilor

2.7. Modelele predictive

2.8. Programarea euristică

2.9. Metoda utilităţii globale maxime

2.10. Sistemul de gestiune a modelelor

3. SIAD-URI BAZATE PE ANALIZA ŞI SINTEZA DATELOR

3.1. Problematica generală

3.2. Depozite de date (Data Warehouse)

3.2.1. Definirea conceptului de depozit de date. Caracteristicile depozitelor de date

Page 3: SISTEME INFORMATICE PENTRU ASISTAREA DECIZIEI (SIAD) · Sistemele informatice pentru asistarea deciziei, SIAD – implică folosirea elementelor aplicative din discipline diverse

3.2.2. Rafturile de date

3.2.3. Memorii-tampon de date operaţionale

3.2.4. Depozite de date de tip întreprindere

3.2.5 Diferenţierea depozitului de date de baza de date

3.2.6. Ciclul de viaţă al depozitelor de date

3.3. Modelarea conceptuală a depozitului de date

3.4. Modul de utilizare a depozitului de date

3.5. Mediul de depozitare al datelor

3.6. Abordarea multidimensională a datelor stocate în depozite

3.6.1. Definirea şi caracterizarea OLAP (On-Line Analytical Processing)

3.6.2. Modelarea dimensională – cuburi OLAP

3.6.3. Baze de date multidimensionale

3.6.4. Operaţii OLAP asupra hipercubului

3.7. Aplicaţie privind analiza datelor cu Microsoft OLAP

3.7.1. Analiza problemei de rezolvat

3.7.2. Definirea schemei bazei de date multidimensionale

4. DATA MINING – TEHNOLOGII DEDICATE EXTRAGERII CUNOŞTINŢELOR DIN

DATE

4.1. Problematica generală

4.2. Definirea conceptului Data Mining

4.3. Categorii de date care pot fi “minerite”

4.4. Categorii de modele de date care pot fi “minerite”

4.5. Sistemul Data Mining

4.5.1. Structura sistemului Data Mining

4.5.2. Arhitectura sistemului Data Mining

4.5.3. Clasificarea sistemului Data Mining

4.5.4. Explorarea datelor – conţinut şi etape

4.5.5 Raţionamentul bazat pe cazuri

Cuvinte-cheie: SIAD, DSS, OLAP, modelare, depozite de date, Data Warehouse, Data Mining.

Page 4: SISTEME INFORMATICE PENTRU ASISTAREA DECIZIEI (SIAD) · Sistemele informatice pentru asistarea deciziei, SIAD – implică folosirea elementelor aplicative din discipline diverse

SISTEME INFORMATICE PENTRU ASISTAREA DECIZIEI

(Sinteza cursului)

Prof.univ.dr. Zenovic GHERASIM

Prof.univ.dr. Doina FUSARU

Prof.univ.dr. Maria ANDRONIE

1. ASISTAREA DECIZIEI ECONOMICE

1.1 Definirea, rolul şi locul sistemelor informatice pentru asistarea deciziei

Sistemul este o colecţie de părţi (elemente) organizate şi interconectate pentru

îndeplinirea unui anumit scop. Sistemul, în plan conceptual, este expresia abstractizării unor

fapte, fenomene, procese, obiecte din universul real pe baza unei structuri logice predefinite.

Concepţia sistemică oferă avantajul unei abordări integrale şi integrate a fenomenelor şi

proceselor specifice domeniilor abordate, evidenţiind latura calitativă corespunzătoare

elementelor sistemului. Subsistemul este o parte componentă a unui sistem, în funcţie de un

punct de vedere şi de scopul urmărit. După domeniul de aplicare, sistemele sunt politice,

economice, sociale, tehnice etc.

Sistemele economice sunt sisteme deschise (open systems), puternic ancorate în mediul

socio-economic (piaţa este o parte a acestui mediu) în care acestea funcţionează. Sistemele

economice, ca sisteme deschise, sunt sisteme cibernetice adică prezintă legătura de reacţie

(feedback) ce le permite o funcţionare normală. Sistemele economice prezintă un comportament

dinamic care asigură adaptarea la fluctuaţiile mediului socio-economic. Orice sistem economic

poate fi împărţit în mai multe subsisteme în funcţie de criterii specifice.

Societatea comercială (organizaţia economică) reprezintă un sistem economic care poate

fi divizat a) funcţional sau pe domenii de gestiune (producţie/servicii, comercial, cercetare-

dezvoltare, financiar-contabil, resurse umane) sau b) structural (organizatoric, decizional,

informaţional, tehnologic, relaţional pe resurse umane). Potrivit concepţiei holonice asupra

sistemelor, două sau mai multe sisteme autonome pot fi integrate (cu criterii şi obiective precise)

şi se poate obţine astfel un sistem holonic. În limba greacă, holos semnifică un întreg dedus din

părţi. Sistemul holonic (holonul) economic permite optimizarea atât pe sisteme componente cât

şi pe ansamblul sistemului integrator devenit sistem de referinţă, pe cele două planuri: real şi

conceptual.

Orice sistem economic modern performant este un sistem integrat funcţional şi structural.

Sistemele economice integrate pot fi abordate din perspectiva diferitelor şcoli de gândire

în management (tehnico-raţională, comportamentală, cognitivă). Acestor sisteme economice

integrate le sunt asociate sisteme informaţionale integrate, respectiv sisteme informatice

integrate. Sistemele informatice integrate economice au în compunere, în funcţie de nivelurile de

management ale organizaţiei economice (fig.1.1), sisteme informatice dedicate (integrate pe

orizontală), astfel: 1) nivelul de management strategic: sisteme informatice de sprijin al

executivului, ESS (Executive Support Systems) sau EIS (Executive Information System); 2)

nivelul de management mediu: sisteme informatice pentru management, MIS (Management

Information Systems) sau sisteme informatice pentru rapoarte de management, MRS

(Management Reporting Systems) şi sisteme informatice pentru asistarea deciziei, DSS (Decision

Support Systems); 3) nivelul lucrătorilor cu date, informaţii şi cunoştinţe: sisteme de

automatozare a lucrărilor de birou sau birotică, OAS (Office Automation Systems) şi sisteme de

Page 5: SISTEME INFORMATICE PENTRU ASISTAREA DECIZIEI (SIAD) · Sistemele informatice pentru asistarea deciziei, SIAD – implică folosirea elementelor aplicative din discipline diverse

lucru cu cunoştinţe, KWS (Knowledge Work Systems); 4) nivelul de management operaţional:

sisteme informatice pentru procesarea tranzacţiilor, TPS (Transaction Processing Systems). Cele

mai cunoscute implementări ale unor componente de integrare pe verticală ale sistemelor

informatice integrate economice sunt denumite: planificarea resurselor întreprinderii, ERP

(Enterprise Resource Planning), fabricaţie asistată de calculator, CAM (Computer-Aided

Manufacturing), planificarea resurselor de fabricaţie, MRP (Manufacturing Resource Planning),

sistem informatic de resurse umane, HRIS (Human Resources Information System), sistem

informatic contabil, AIS (Accounting Information System), sistem informatic financiar, FIS

(Financiar Information System), sistem informatic pentru marketing, MKIS (Marketing

Information System), sistem informatic de resurse informatice, IRIS (Information Resources

Information System), sistem informatic pentru managementul relaţiilor cu clienţii, CRM

(Customer Relationship Management), sistem de management al lanţului de distribuţie, SCM

(Supply Chain Management) etc.

Pentru studentul de la specializarea Contabilitate şi informatică de gestiune, elemente ale

OAS au reprezentat obiectul cursului de birotică, elemente ale TPS - al cursului de sisteme de

gestiune a bazelor de date, în timp ce elemente ale KWS au fost lămurite la cursul de sisteme

expert. DSS reprezintă obiectul de studiu al disciplinei Sisteme informatice pentru asistarea

deciziei (SIAD) economice. MIS reprezintă o disciplină de informatică pentru specializarea

Management. Este discutabilă separarea SIAD (DSS) de MIS, indiferent de modul de abordare,

având în vedere că luarea deciziei reprezintă scopul fundamental al oricărui sistem de

management. ESS sunt în curs de clarificare, conceptualizare şi realizare.

Steven Alter consideră că sistemele informatice pentru asistarea deciziei (SIAD) sunt

destinate managerilor şi prezintă ca obiectiv fundamental eficientizarea deciziilor, spre deosebire

de TPS-uri care se ocupă de eficientizarea şi consistenţa datelor. Moore şi Chang arată că un

SIAD este extensibil şi capabil să suporte analize ad-hoc, precum şi modelarea deciziei

manageriale, folosit pe un interval de timp nedeterminat şi neregulat şi cu orientare principală pe

procese şi fenomene viitoare1.

1 Oancea, M. – Sisteme informatice pentru asistarea deciziei financiare, Editura ASE, Bucureşti, 2005.

Page 6: SISTEME INFORMATICE PENTRU ASISTAREA DECIZIEI (SIAD) · Sistemele informatice pentru asistarea deciziei, SIAD – implică folosirea elementelor aplicative din discipline diverse

Fig. 1.1. Sistemele informaţionale/informatice în funcţie de nivelurile de management ale

organizaţiei economice

În lucrarea Decision Support Systems: A Knowledge-Based Approach (1996), Holsapple

şi Whiston evidenţiau caracteristicile unui SIAD astfel2:

1. are în compunere o bază de cunoştinţe referitoare la domeniul abordat de procesul

decisional;

2. permite achiziţia cunoştinţelor descriptive sau de natura procedurilor şi regulilor;

3. asigură posibilităţi de prezentare a unor cunoştinţe ad-hoc sau de realizare a unor rapoarte

periodice;

4. facilitează selectarea unor mulţimi de cunoştinţe pentru informare sau pentru asistarea

procesului decizional;

5. realizează interactivitatea sistem-decident.

Sistemele informatice pentru asistarea deciziei, SIAD – implică folosirea elementelor

aplicative din discipline diverse cum sunt statistica, economia, cercetările operaţionale,

tehnologiile informaţiei şi ale comunicaţiilor – IT&C, inteligenţa artificială, psihologia cognitivă

etc.

Sistemul informaţional economic reprezintă un cumul de resurse umane şi capital investit

într-o organizaţie economică pentru colectarea şi prelucrarea datelor necesare obţinerii

2 Lungu, I., Sabău, Gh., Velicanu, M., Muntean, M., Ionescu, S., Posdarie., E., Sandu, D, - Sisteme informatice.

Analiză, proiectare şi implementare, Editura Economică, Bucureşti, 2003.

Management

operaţional

(de exploatare)

Lucrători cu date,

informaţii şi

cunoştinţe

Management

de nivel

mediu

Management

strategic

ESS, Executive Support Systems sau

EIS, Executive Information Systems

MIS, Management Information Systems

şi

DSS, Decision Support Systems

OAS, Office Automation Systems

(birotică)

KWS, Knowledge Work Systems

TPS, Transaction

Processing Systems

ORGANIZAŢIA

ECONOMICĂ

General Manager

Page 7: SISTEME INFORMATICE PENTRU ASISTAREA DECIZIEI (SIAD) · Sistemele informatice pentru asistarea deciziei, SIAD – implică folosirea elementelor aplicative din discipline diverse

informaţiilor care vor fi utilizate la toate nivelurile de decizie ale conducerii şi controlului

activităţii acelei organizaţii.

Informaţie devine în felul acesta centrul în jurul căruia basculează întreaga activitate a unei

organizaţii economice.

Informaţia este văzută de DeMarco (1982) ca fiind abordabilă din trei perspective specifice

sistemelor informaţionale şi anume:

1) Datele care sunt văzute sub formă de atribute şi care reflectă structura statică a

sistemului informaţional.

2) Funcţiile scot în evidenţă ceea ce face sistemul. Ele pot fi văzute şi ca procese,

deoarece elementele sistemului care stochează datele sunt supuse transformărilor

funcţionale prin intermediul proceselor.

3) Comportamentul reflectă de fapt stările prin care trece sistemul la apariţia diverselor

evenimente care au impact asupra lui şi care îi conferă un statut dinamic.

Reenginering-ul organizaţiei economice semnifică regândirea din temelii şi reproiectarea

radicală a proceselor de afaceri cu scopul de a obţine o îmbunătăţire semnificativă a indicatorilor

critici de performanţă ai acestei organizaţii economice (costuri, calitate, viteză, service etc). În

reingineria proceselor de afaceri, BPR (Business Process Reengineering), IT&C joacă un rol

determinant.

1.2. Decizia: loc, rol, clasificare

Evoluţia tehnologiilor informaţiei şi ale comunicaţiilor, IT&C influenţează evoluţia

procesului managerial prin oferta de mijloace şi instrumente din ce în ce mai performante pentru

rezolvarea sarcinilor managerilor, sintetizate în ESS, MIS, DSS, KWS, OAS. Sistemele

informatice oferă un nivel rapid de obţinere, analiză şi interpretare a unei mari cantităţi de date şi

informaţie, ajutând la o adaptare rapidă a decidenţilor într-un mediu economic în permanenţă

dinamică. Tot ele asigură un înalt nivel de responsabilitate şi putere de decizie spre nivelele

inferioare. În acelaşi timp, procesul managerial are impact asupra modului în care se face

proiectarea şi realizarea sistemelor informatice care deservesc acest proces.

În principal, managerii utilizează sistemele informatice pentru planificarea, organizarea,

coordonarea, controlul şi previziunea activităţilor lor, dar şi pentru comunicarea dintre persoane,

stabilirea reţelelor în interiorul organizaţiei cât şi la rezolvarea problemelor curente. La baza

structurării sistemelor informatice se află sistemele informaţionale. Sistemul informaţional al

unei organizaţii conţine două subsisteme componente: subsistemul de conducere şi subsistemul

condus. În fluxul informaţional descendent se găseşte decizia, ca rezultat al procesului decizional

desfăşurat în cadrul subsistemului de conducere.

Diverşi autori definesc decizia în moduri aproximativ asemănătoare ca de exemplu:

alegerea unei căi sau direcţii de acţiune (Simon, 1960), alegerea unei strategii de acţiune

(Fishburn, 1964), o alocare a resurselor (Spradlin, 1997), hotărârea luată ca urmare a examinării

unei probleme, situaţii etc., soluţia adoptată din mai multe posibile (DEX, 1998) etc. Decizia se

poate defini şi ca fiind rezultatul unor activităţi conştiente de alegere a unei căi de acţiune,

alegere care presupune alocarea unor resurse. Decizia reprezintă rezultatul prelucrării unor

informaţii şi cunoştinţe şi aparţine unei persoane sau grup de persoane (decidentul) care dispun

de autoritatea necesară şi care au responsabilitatea pentru utilizarea eficace a resurselor în

Page 8: SISTEME INFORMATICE PENTRU ASISTAREA DECIZIEI (SIAD) · Sistemele informatice pentru asistarea deciziei, SIAD – implică folosirea elementelor aplicative din discipline diverse

anumite situaţii date3. Decizia este o activitate a omului ce urmăreşte, în mod conştient, anumite

obiective. Pentru rezolvarea unei probleme decizionale se aleg obiectivele relevante pentru

problema respectivă. Aceste obiective relevante pot fi multiple şi, deseori, contradictorii. Ele

sunt funcţie de mai mulţi factori, dintre care se amintesc sistemul de valori (ansamblul

subiectelor de analiză adoptate sau impuse decidentului) şi orizontul decizional de timp (specific

problemei de decizie).

O primă clasificare a deciziilor, legată nemijlocit de decident, este realizată în funcţie de

domeniul de activitate al omului:

- decizii personale, când deciziile se referă la viaţa personală a unui om, iar resursele sunt timpul,

energia, banii, renumele, cunoştinţele profesionale;

- decizii manageriale, când deciziile se referă la organizaţia economică, iar resursele alocate sunt

umane, materiale, financiare şi informaţionale (dintre cele informaţionale, cele mai importante

fiind cunoştinţele tezaurizate în organizaţie).

După gradul de complexitate, deciziile pot fi simple sau complexe. Decizia simplă este

acea decizie care priveşte alegerea unei singure direcţii de acţiune sau acea decizie ce se

dovedeşte suficientă (la o primă analiză) pentru îndeplinirea obiectivelor. Decizia complexă

reprezintă un ansamblu de decizii simple care se adoptă pentru îndeplinirea unui obiectiv sau

grup de obiective.

După numărul de participanţi, deciziile sunt:

• cu decident individual;

• decizii cu mai mulţi participanţi (multiparticipant) sau cu echipe decizionale.

Clasificarea deciziilor în funcţie de nivelul decizional asociat cu orizontul decizional de

timp este:

a) decizii strategice care se referă la obiectivele, resursele şi politicile organizaţiei, pe

termen mediu şi lung (ani de zile); sunt specifice nivelului de managemement strategic (fig.1.1);

la elaborarea şi adoptarea acestor decizii participă un număr redus de decidenţi ce lucrează, de

regulă, într-o manieră creativă şi nerepetitivă; se folosesc date şi informaţii puternic agregate

provenite, în principal, din surse externe organizaţiei economice respective;

b) decizii tactice sau de conducere (control) managerială ce determină cât de eficiente

au fost folosite resursele; sunt specifice nivelului de management mediu şi au ca orizont de timp

lunile anului; interacţiunile personale sunt puternic prezente, adică controlul managerial

presupune o continuă interacţiune între persoanele care îndeplinesc obiectivele organizaţiei

(stabilite de nivelul de management strategic), în mod curent şi pe termen scurt; se folosesc date

şi informaţii mediu agregate provenite atât din surse interne cât şi din surse externe organizaţiei;

c) decizii de conducere (control) operaţională care determină modul în care sunt duse la

îndeplinire sarcinile primite de la nivelele de management superioare; orizontul de timp este de

săptămâni şi zile; se folosesc date şi informaţii provenite, în principal, din surse interne

organizaţiei;

În unele lucrări de specialitate, la acest criteriu de clasificare a deciziilor sunt cuprinse

şi:

3 Acad. Florin Gheorghe FILIP, Decizie asistată de calculator, decizii, decidenţi, metode şi instrumente de bază,

Editura Tehnică şi Editura Expert, Bucureşti, 2002.

Page 9: SISTEME INFORMATICE PENTRU ASISTAREA DECIZIEI (SIAD) · Sistemele informatice pentru asistarea deciziei, SIAD – implică folosirea elementelor aplicative din discipline diverse

d) decizii în ceea ce priveşte cunoştinţele, acestea fiind indisolubil legate de ideile care

se referă la noi produse şi servicii, metode de răspândire a acestor cunoştinţe şi de difuzare a

datelor şi informaţiior în cadrul organizaţiei. Sunt satisfăcute astfel toate nivelurile de

management ale organizaţiei economice prezentate în fig.1.1.

Clasificarea deciziilor în funcţie de gradul de structurare este:

a) decizii structurate sau programabile adică decizii uzuale pentru care există proceduri

realizate. Acest tip de decizii intervin în momentul în care apare un proces cunoscut. Dacă

decizia este supusă procesului de informatizare, ea este descrisă printr-un program a cărui

execuţie este fixă, deci nu pot exista reveniri, iar calea raţionamentelor nu este schimbată nici

prin program şi nici de utilizatori.

b) decizii nestructurate (neprogramabile) sunt cele care se bazează pe flerul şi modul de

judecată al decidentului care analizează problema. Acest tip de decizie se referă la tipuri de

probleme atipice pentru organizaţie, pentru care nu există proceduri prestabilite. O decizie este

considerată nestructurată atunci când elementele sale sunt de tip calitativ, obiectivele şi

finalitatea nu sunt precise şi nu există un algoritm cunoscut pentru rezolvarea lor;

c) decizii semistructurate sunt cunoscute ca decizii care pot fi rezolvate parţial cu

proceduri cunoscute, întrucât acestea au elemente predominant cantitative, scopurile nu sunt

precise, iar procedura de rezolvare nu asigură ansamblul elementelor problemei. Gradul de

structurabilitate a deciziei depinde de experienţa acumulată de decident precum şi de nivelul şi

importanţa ei. Conform terminologiei lui H. Simon, în cazul proceselor semistructurate apare

nevoia unui “asistent”, de fapt de “asistare a deciziei”. Acest termen de “asistare a deciziei”

trebuie definit la modul general ca fiind o serie de operaţii cum sunt sortarea clasificarea,

selectarea, evaluarea ce au ca scop final organizarea informaţiei, reducerea incertitudinii şi

obţinerea de variante de rezolvare. Dacă se consideră evoluţia în timp a acestui termen, atunci se

poate constata că acesta s-a dezvoltat prin folosirea metodelor cercetării operaţionale, dar sunt

greu de aplicat. De aceea a apărut un alt nivel de abordare a asistării deciziei şi anume “asistarea

interactivă”. Pe baza acesteia au apărut sistemele informatice de asistare a deciziei sau Decision

Support Systems (DSS), situate generic pe nivelul de management mediu.

O altă clasificare a deciziilor poate fi făcută în funcţie de cunoştinţele de care dispune

decidentul referitoare la evoluţia problemei pe care o are de rezolvat. În funcţie de acest criteriu,

deciziile sunt:

1. decizii în condiţii de certitudine ce presupun o cunoaştere a evoluţiei fenomenelor

viitoare, ceea ce se petrece mai rar în realitatea economică. O astfel de decizie se bazează pe

criteriul costului minim de funcţionare;

2. decizii în condiţii de incertitudine ce presupun cunoaşterea evoluţiei anterioare a

fenomenului economic. Acest mod de cunoaştere va permite o previziune şi o alegere cât de cât

corectă a variantei de decizie. Acest tip de decizie face parte din clasa generală a deciziilor de

orientare în care alegerea unei variante se face în funcţie de previziunile viitoare ale decidentului

precum şi de criterii obiective care presupun raţionament logic;

3. decizii în condiţii de risc ce presupun că decidentul cunoaşte aproximativ evoluţia

viitoare a fenomenului, posibilul trend al variabilelor necontrolabile şi chiar ce rezultate are

fiecare strategie analizată pe baza criteriului speranţei matematice. În acest caz procesul de

decizie va avea o multitudine de consecinţe, iar fiecăreia i se va asocia o probabilitate. Se obţine

o distribuţie a probabilităţilor din care se va alege varianta cu speranţa matematică cea mai bună.

Dacă există variante de decizie care au aceeaşi speranţă matematică, atunci se va calcula

Page 10: SISTEME INFORMATICE PENTRU ASISTAREA DECIZIEI (SIAD) · Sistemele informatice pentru asistarea deciziei, SIAD – implică folosirea elementelor aplicative din discipline diverse

intervalul de variaţie şi abaterea standard. Ca variantă optimă se va alege aceea care are cea mai

mică abatere standard.

După modul de abordare, deciziile se clasifică astfel4:

1. decizii rezultate ale activităţilor de management desfăşurate la întâmplare;

2. decizii rezultate ale activităţilor de management bazate pe rutină; se folosesc şabloane

ale activităţilor din trecut;

3. decizii rezultate ale activităţilor de management bazate pe instruire (iînvăţare); modelele

de decizii din trecut sunt modificate în funcţie de dobândirea de cunoştinţe, experienţe şi tehnici

noi;

4. decizii rezultate ale activităţilor de management paradigmatice; modelele de decizii de

succes din trecut sunt preluate ca exemple pentru situaţia actuală;

5. decizii bazate pe analiza deciziilor (analiza şi modelarea sistemică şi previzională);

analiza deciziilor, ca abordare prescriptivă, asistă decidentul în înţelegerea problemelor

decizionale şi în pregătirea acestuia pentru a face faţă situaţiilor neaşteptate şi nefavorabile;

analiza deciziilor nu poate influenţa hazardul şi nu poate provoca manifestarea norocului.

Deciziile rezultate ale activităţilor de management bazate pe instruire, precum şi cele

paradigmatice fac obiectul tehnicilor de inteligenţă artificială (sisteme expert, reţele neuronale

artificiale, sisteme bazate pe cazuri etc.).

După gradul de urgenţă, deciziile sunt:

• decizii luate strict în timp real; sunt adoptate pentru managementul situaţiilor de criză (de

exemplu, pentru conducerea unor instalaţii industriale, pentru gestionarea efectelor unor

calamităţi naturale – inundaţii, cutremure, incendii etc.); acest tip de decizii pot fi asistate de

tehnici de inteligenţă artificială;

• decizii luate aproape în timp real; sunt adoptate pentru gestionarea unor situaţii

decizionale importante pentru organizaţie cum sunt, de exemplu, oportunităţile de afaceri,

lansarea unui produs nou, prefalimentul firmei etc;

• decizii care nu sunt urgente; timpul la dispoziţia decidentului este suficient pentru

asiguraarea desfăşurării unei analize detaliate şi obţinerea unei rezolvări optime a problemei

decizionale.

După criteriul de secvenţialitate a deciziilor5, se deosebesc:

a) decizii independente, în situaţia în care decidentul ia o decizie complet

implementabilă;

b) decizii dependent-secvenţiale sau în cascadă (o decizie după alta);

c) decizii interdependente, adică decizii independente (în prima fază) sunt agregate (în

faza a doua).

1.3. Decidenţii

Modelul managementului clasic care descrie ce trebuie să facă un manager a fost

indiscutabil un model de top, aproape 70 de ani, începând cu anii 1920. Henri Fayol şi alţi

specialişti au prezentat, pentru prima dată, cele cinci funcţiuni clasice ale managerilor:

4 G. Boldur-Lăţescu - Logica decizională şi conducerea sistemelor, Editura Academiei Române, Bucureşti, 1992. 5 Acad. Florin Gheorghe FILIP, Sisteme suport pentru decizii, Editura Expert, 2004.

Page 11: SISTEME INFORMATICE PENTRU ASISTAREA DECIZIEI (SIAD) · Sistemele informatice pentru asistarea deciziei, SIAD – implică folosirea elementelor aplicative din discipline diverse

planificarea, organizarea, coordonarea, luarea hotărârilor şi controlul. La o analiză mai atentă,

s-a observat că descrierea funcţiunilor manageriale în aceşti termeni este neconcludentă deoarece

nu corespunde cu ceea ce managerii execută în activitatea de zi cu zi. Prin modele

comportamentale6, s-a definit comportarea managerilor care pare să fie mai puţin sistematizată,

mai informală, mai puţin organizată şi chiar mai neimportantă decât s-ar crede la prima vedere.

S-a constatat că activitatea managerială, în realitate, are cinci caracteristici care diferă

de modelul managementului clasic. Astfel:

a) activitatea managerială este foarte intensă, adică managerii trebuie să desfăşoare foarte

multe activităţi zilnice, într-un ritm destul de ridicat (unele studii indică 600 de activităţi pe zi);

b) activitatea managerială este fragmentată, ceea ce înseamnă că majoritatea activităţilor

durează mai puţin de 9 minute, numai 10% dintre activităţi depăşesc o oră;

c) este preferată comunicarea orală în detrimentul comunicării scrise deoarece oferă mai multă

flexibilitate, necesită mai puţin efort şi aduce un răspuns mai rapid;

d) managerii preferă informaţiile ad-hoc şi speculaţiile (informaţiile scrise uneori sunt vechi

sau aceasta este percepţia managerilor despre documentele scrise);

e) managerii lucrează pe baza unei reţele de contacte care funcţionează ca un sistem

informaţional informal.

Pe baza observaţiilor din lumea reală, Kotter susţine că managerii de fapt sunt implicaţi

în trei activităţi critice:

- petrec mult timp pentru stabilirea agendei personale şi a obiectivelor atât pe termen

scurt cât şi lung;

- consumă foarte mult timp pentru construirea unei reţele interpersonale formată din

angajaţii de la cât mai multe nivele, de la personalul care deserveşte depozitele de mărfuri şi

funcţionarii organizaţiei până la manageri şi managerii generali;

- folosesc întreaga lor pricepere şi desfăşoară activităţi de bază pentru a realiza ceea ce

au stabilit în agenda personală şi pentru a-şi atinge propriile scopuri.

Analizând comportamentul de zi cu zi al managerilor, Mintzberg a constatat că acest

comportament ar putea fi clasificat în funcţie de zece roluri manageriale ce pot fi împărţite în

trei categorii: interpersonale, informaţionale şi decizionale.

Prin rol managerial se înţeleg activităţile şi rezultatele acestora pe are managerii ar trebui

să le realizeze într-o organizaţie.

În cazul rolurilor interpersonale, managerii funcţionează ca reprezentanţi ai organizaţiei

economice în relaţiile cu lumea exterioară şi îndeplinesc sarcini simbolice, cum ar fi, de

exemplu, primirea delegaţiilor străine. Managerii acţionează ca lideri prin motivarea, consilierea

şi sprijinul angajaţilor. De asemenea, aceşti manageri realizează legătura dintre diferitele nivele

ale organizaţiei economice, iar în interiorul fiecărui nivel asigură legătura dintre membrii echipei

de management. Managerii acordă timp şi favoruri pe care se aşteaptă să le primească înapoi.

Pentru eficientizarea acestor roluri interpersonale, managerii utilizează cele mai avansate tehnici

şi tehnologii de comunicare şi de comunicaţii.

Cât priveşte rolurile informaţionale, managerii acţionează în calitate de „servere” de

informaţii pentru organizaţia economică, primind informaţiile actualizate şi redistribuindu-le

celor care au nevoie de ele. Aceste roluri informaţionale sunt de monitor şi acumulator

(centralizarea şi stocarea tuturor datelor şi informaţiilor esenţiale despre organizaţie), de

6 Laudon, K. ; Laudon, J. – Essentials of Management Information Systems, Organization and Technology in the

Networked Enterprise, Fourth Edition, JWS, New York, 2001.

Page 12: SISTEME INFORMATICE PENTRU ASISTAREA DECIZIEI (SIAD) · Sistemele informatice pentru asistarea deciziei, SIAD – implică folosirea elementelor aplicative din discipline diverse

diseminator al datelor şi informaţiilor ce trebuie supuse acestui proces (informaţii în formă brută

sau prelucrată), de generator sau creator de informaţie nouă (având la bază informaţia acumulată

şi interacţiunile ce se produc în decursul desfăşurării activităţilor), precum şi de purtător de

cuvânt sau reprezentant autorizat al organizaţiei. Un rol determinant în susţinerea acestor roluri

informaţionale îl au sistemele informatice dedicate şi sistemul informatic integrat al organizaţiei

economice în ansamblul său.

În situaţia rolurilor decizionale, managerii iau decizii. Ei funcţionează ca antreprenori

prin iniţierea diferitelor tipuri de activităţi, ei descoperă nefuncţionalităţile care apar în

organizaţie, alocă resursele personalului care are nevoie de ele, negociază conflictele şi mediază

neînţelegerile dintre diferite grupuri. În esenţă, rolurile decizionale sunt de întreprinzător sau

planificator (depistarea de oportunităţi de afaceri, focalizarea tuturor activităţilor pentru

îndeplinirea obiectivelor stabilite de managementul strategic, supervizarea proiectelor de

importanţă deosebită pentru organizaţia economică etc.), coordonator sau rezolvitor de probleme

perturbatorii care afectează cursul normal al evoluţiei strategice a organizaţiei economice,

organizator sau distribuitor al resurselor organizaţiei, precum şi de negociator.

Aşa cum s-a arătat mai sus, rolurile managerilor se clasifică în interpersonale,

informaţionale şi de decizie (sau decizionale). Tuturor acestor roluri manageriale li se asociază

sisteme informatice dedicate care întregesc sistemul informatic integrat al organizaţiei

economice.

Luarea deciziilor rămâne una dintre activităţile de bază ale managerilor – o persoană sau

un grup de persoane ce prezintă autoritatea necesară şi care au responsabilitatea folosirii

resurselor la dispoziţie în situaţii date.

La nivelul de exploatare se iau decizii puternic structurate, în timp ce la nivelul

managementului strategic se iau decizii nestructurate. Multe dintre problemele întâlnite de

lucrătorii cu date, informaţii şi cunoştinţe necesită, de asemenea, decizii nestructurate. Se

apreciază că la fiecare nivel de management organizaţional se iau atât decizii structurate cât şi

decizii nestructurate.

1.4. Consideraţii asupra asistării deciziilor

Situaţia decizională reprezintă momentul în care este necesară o decizie. Situaţiile

decizionale pot fi forţate şi neforţate7.

Situaţiile decizionale forţate (obiective sau provocate) sunt situaţiile decizionale

determinate de obţinerea unor informaţii ce conduc la observarea apariţiei unor manifestări

externe sistemului, cum sunt abaterile intolerabile ale stării subsistemului condus faţă de o stare

prestabilită, stările noi ale sistemului, precum şi modificările sistemului economic observate în

mediul socioeconomic extern. De exemplu, contul de profit şi pierdere al unei firme semnalează

celorlalţi actori de pe piaţă starea de profitabilitate sau de faliment pentru acea firmă, iar bilanţul

firmei indică modificări intervenite în anul curent faţă de anul precedent. Achiziţionarea de către

o societate comercială de producţie unui utilaj performant în locul muncii manuale asigură

creşterea productivităţii muncii, determinând astfel o stare nouă a sistemului economic. O

abatere intolerabilă la o bancă comercială este depăşirea limitei de creditare impusă şi

supravegheată de Banca Centrală. Situaţiile decizionale forţate determină decizii corective şi

7 Acad. Florin Gheorghe FILIP, op.cit.ant..

Page 13: SISTEME INFORMATICE PENTRU ASISTAREA DECIZIEI (SIAD) · Sistemele informatice pentru asistarea deciziei, SIAD – implică folosirea elementelor aplicative din discipline diverse

reactive în raport cu abaterile intolerabile, stările noi sau modificările intervenite în sistemul

economic. Un stimulent pentru o situaţie decizională forţată şi o decizie reactivă poate fi

observarea existenţei unei oportunităţi de afaceri pentru firmă.

Situaţiile decizionale neforţate (subiective sau neprovocate) reprezintă situaţiile

decizionale, determinate de voinţa decidentului, care se referă la luarea din timp a unor măsuri

preventive pentru situaţii ca producerea unor accidente de muncă sau boli profesionale la

angajaţii firmei, producerea unui incendiu, pierderea avansului competiţional al societăţii etc.

Situaţiile decizionale neforţate determină decizii proactive ca rezolvări ale problemelor de

explorare şi exploatare a oportunităţilor.

Procesul decizional este ansamblul de activităţi executat de o persoană sau grup de

persoane (decident) care sunt puse în faţa unui fenomen care poate genera mai multe variante de

acţiune şi având drept obiectiv alegerea uneia dintre ele care să răspundă cel mai bine sistemului

de valori ale persoanei, grupului de persoane sau organizaţiei în ansamblul său.

Decidentul uman, ca element fundamental al procesului decizional, prezintă mai multe

limite care determină necesitatea şi oportunitatea asistării informatizate a deciziilor. Astfel, se

deosebesc limite cognitive (se referă la capacitatea limitată a omului de a memora şi prelucra

date, informaţii şi cunoştinţe), limite de timp (multe decizii trebuiesc adoptate de decidentul

uman sub presiunea timpului la dispoziţie extrem de mic; ca urmare, aceste decizii pot fi eronate

în raport cu problema decizională) şi limite economice (sunt determinate de costurile obţinerii,

stocării, prelucrării, transmiterii şi diseminării datelor, informaţiilor şi cunoştinţelor către toţi

membrii echipelor manageriale).

Procesul de adoptare a deciziilor este constituit din următoarele etape sau faze ale

procesului decizional (cu caracter generic):

1. Informarea generală (sau „intelligence”, după H.Simon), etapă în care sunt analizate

evenimentele apărute în organizaţia economică şi depistate cauzele lor de apariţie. Această

etapă conţine subetapele de stabilire a obiectivelor, de identificare a problemei, de

descompunerea a ei, de stabilire a responsabilităţilor şi are ca rezultat descrierea formală a

problemei decizionale, a categoriei din care aceasta face parte şi a tuturor responsabilităţilor

care decurg de aici.

2. Design-ul (proiectarea) sau modul de concepere al procesului de asistare a deciziei –

presupune alegerea sau construcţia unui model pentru asistarea deciziei precum şi subetapele

de testare şi validare. Una din subetapele design-ului este modelarea ce implică modul de

concepere a problemei precum şi abstractizarea ei cantitativă şi/sau calitativă. Experienţa

decidentului îşi pune amprenta pe modul de alegere a modelului dintr-o multitudine

existentă, dezvoltă proceduri mentale care ajută la încadrarea problemei de rezolvat într-o

anume clasă de modele existente.

3. Alegerea (sau „choice”) este etapa de bază pentru adoptarea deciziei deoarece în cadrul ei se

concretizează rezultatele obţinute în celelalte etape. Decidentul alege o singură acţiune din

multitudinea existentă în funcţie de criteriul de selecţie propus şi de modelul decizional pe

care l-a ales (din clasa de modele la dispoziţie). Decidentul alege între posibilităţile în funcţie

de soluţionarea definitivă a modelului, de selectarea celei mai adecvate alternative şi tot el

selectează planul pentru implementare. Pentru alegere sunt evidenţiate mai multe metode de

căutare ca de exemplu: tehnici analitice, metode de căutare exhaustive prin care rezultatele

Page 14: SISTEME INFORMATICE PENTRU ASISTAREA DECIZIEI (SIAD) · Sistemele informatice pentru asistarea deciziei, SIAD – implică folosirea elementelor aplicative din discipline diverse

obţinute de fiecare alternativă sunt comparate, metode euristice care sunt aplicabile în

metodele descriptive.

Metodele analitice sunt utilizate datorită utilizării formulelor matematice pentru a găsi

soluţia optimă. Utilizarea lor este restricţionată de natura problemelor, iar acestea trebuie să fie

structurate. Se pot aplica astfel de metode pentru probleme de gestiune a stocurilor sau de

alocare a resurselor. Algoritmii stau la baza acestor metode şi conduc la obţinerea unor soluţii

viabile pentru modelul ales.

Metodele de căutare exhaustivă sunt utilizate în genere la luarea în considerare a tuturor

căilor de acţiune pentru a ajunge la scopul propus. Aceste metode au la bază un proces neghidat,

proces în urma căruia se alege soluţia optimă. Căutarea de obicei este incompletă întrucât

posibilităţile de căutare sunt limitate de timp, spaţiu de memorie şi el se va opri când se va găsi o

soluţie apropiată de cea optimă (numită suboptim).

Metodele de căutare euristice se bazează pe o riguroasă analiză a problemei sau printr-o

căutare prin încercări succesive a spaţiului soluţiilor. Raţionamentul făcut prin parcurgerea

spaţiului de căutare a soluţiri permite trecerea prin toate stadiile intermediare către o stare finală

care poate fi un rezultat satisfăcător sau o nereuşită (eşec). Se precizează că metoda de căutare

care este implementată de un sistem de asistare a deciziilor este o metodă euristică.

Ca ultimă etapă în adoptarea deciziei este evaluarea rezultatelor soluţiei.

4. Implementarea (sau „review”) este etapa în care se face declanşarea acţiunii alese (propuse)

de decident.

De obicei, această etapă este o mare consumatoare de timp, resurse şi în cursul ei pot apare

diverse probleme de rezolvat, ca de exemplu gradul de suport al nivelurilor superioare

decizionale.

Analiza deciziilor asigură un cadru sistematic de abordare, structurare, descompunere şi

rezolvare a problemelor decizionale, ajutându-l şi stimulându-l pe decident să gândească şi să

preia critic alternativele propuse de echipa managerială sau de către un sistem informatic de

asistare a deciziei. Analiza deciziilor este sprijinită de metode, tehnici şi instrumente informatice

specifice sau preluate din alte discipline (cercetări operaţionale, statistică, probabilităţi, simulare

etc.).

Pentru procesul decizional structurat şi pentru cel semistructurat se pot folosi modelele

cantitative bazate pe metode şi modele ale cercetării operaţionale. Această abordare presupune

automatizarea totală sau parţială a procesului de adoptare a deciziei şi constă în următorii paşi:

a) descrierea şi definirea problemei;

b) găsirea categoriei din care face parte problema;

c) elaborarea unui model matematic care să se plieze cel mai bine pe descrierea problemei;

d) alegerea soluţiei.

Modelele cercetării operaţionale se obţin prin metodele acestei cercetări. Metodele

cercetării operaţionale, utilizate la fundamentarea procesului decizional, sunt programarea

matematică (liniară, neliniară, pătratică), teoria stocurilor, teoria jocurilor, teoria grafurilor, teria

echipamentelor etc. Se obţin astfel soluţii optimale pentru problema decizională de rezolvat.

Procesul decizional care poate fi modelat presupune că situaţia reală se poate configura

pe un model. S-au implementat o serie de metodologii automate care permit obţinerea soluţiilor

pentru un model cunoscut.

Page 15: SISTEME INFORMATICE PENTRU ASISTAREA DECIZIEI (SIAD) · Sistemele informatice pentru asistarea deciziei, SIAD – implică folosirea elementelor aplicative din discipline diverse

Calculatorul electronic poate primi modelul pentru decizii structurate şi tot el poate fi

decidentul. Spre exemplu, el poate decide când să se facă reaprovizionarea stocului cu materii

prime şi materiale al societăţii comerciale şi, în acest caz, libertatea de a alege în afara soluţiei

optime, dispare.

În cazul în care există decizii mai puţin structurate se va utiliza un gen de modelare locală

sau personalizată care presupune utilizarea mai multor modele sau chiar construirea altora

proprii. Modelarea personalizată este un proces interactiv şi a dat şi numele primelor sisteme:

sisteme interactive de asistare a deciziei. Acestea reprezintă, în esenţă, sisteme informatice de

asistare a deciziei orientate pe modele.

Sistemele de asistare a deciziei orientate pe date prelucrează date ce se găsesc în

depozitul de date al organizaţiei. Aceste sisteme funcţionează pe baza analizei şi agregării datelor

şi au ca funcţii accesul imediat la date, dispun de un mecanism pentru analiza imediată a datelor,

creează statistici. Acest tip de sisteme este rezultatul creării unor tehnologii speciale cum sunt:

• depozitarea unor volume enorme de date istorice ale organizaţiei (Data Warehousing);

• exploatarea acestor depozite prin procesare analitică on-line (OLAP, OnLine Analytical

Processing).

Adoptarea deciziilor constituie un proces care pe lângă suportul tehnic are nevoie de un

suport cognitiv care este asigurat de partea umană componentă integrantă a sistemului

decizional. Suportul cognitiv înglobează cunoştinţele şi experienţa decidentului precum şi

capacitatea acestuia de raţionament. Suportul cognitiv este sprijinit şi marcat în ultimele decenii

de apariţia sistemelor informatice de lucru cu cunoştinţe, KWS (Knowledge Work System) care

se ocupă de probleme de stocare, clasificare, menţinere şi calitate a cunoştinţelor.

Dacă în sistemele informatice de asistare a deciziei se includ şi bazele de cunoştinţe, se

definesc astfel sisteme informatice de asistare a deciziei orientate pe cunoştinţe sau aşa numitele

sisteme informatice de asistare inteligentă a deciziei.

După clasificarea lui Schneider (1994), există patru categorii de probleme decizionale:

a) decizia de tip alegere (se porneşte de la o mulţime de alternative din care se alege o

singură alternativă);

b) decizia simplă (se porneşte cu problema bine formulată şi cu o mulţime de activităţi

de rezolvare a problemei şi se finalizează cu soluţionarea problemei prin realizarea unui plan de

acţiune);

c) decizia complexă (problema de rezolvat se descompune în mai multe probleme simple

sau subprobleme care se soluţionează cu decizii simple);

d) decizia de tip proces (este o decizie de tip secvenţial).

Procesul decizional este puternic influenţat de caracteristicile mediului socio-economic

în care-şi desfăşoară activitatea organizaţia economică, cum sunt:

1. existenţa competiţiei pe piaţă, din ce în ce mai acerbă şi mai evoluată; produsele şi

serviciile oferite pieţii sunt apreciate în conformitate cu un ansamblu de criterii (preţ, calitate,

nivel tehnologic încorporat, termen de livrare, durata de viaţă sau existenţă pe piaţă);

2. ritmul schimbărilor tehnologice (se reaminteşte aici, deja celebra lege a lui Moll,

conform căreia, în domeniul tehnologiilor informaţiei şi ale comunicaţiilor, IT&C, fiecare

generaţie tehnologică asociată, de regulă, cu microprocesorul structurii de calcul, se modifică la

Page 16: SISTEME INFORMATICE PENTRU ASISTAREA DECIZIEI (SIAD) · Sistemele informatice pentru asistarea deciziei, SIAD – implică folosirea elementelor aplicative din discipline diverse

fiecare 18 luni) şi de alte tipuri (politice, legislative, sociale) care determină creşterea numărului

de alternative ce constituie input-uri ale procesului decizional;

3. modificarea modului de organizare şi de funcţionare a organizaţiei economice (ca, de

exemplu, apariţia şi dezvoltarea organizaţiei virtuale) ce determină mărirea ponderii decidenţilor

de tip multiparticipant asociaţi în echipe virtuale; prin reingineria proceselor de afaceri, BPR

(Business Process Reengineering) sunt gestionate toate aceste modificări organizaţionale;

4. creşterea continuă şi diversificarea surselor externe de date, informaţii şi cunoştinţe;

5. creşterea continuă a pretenţiilor acţionarilor faţă de performanţele organizaţiei

economice, dar şi a aspiraţiilor personale ale angajaţilor acesteia şi ale candidaţilor la angajare

proveniţi din mediul socioeconomic.

1.5. Clasificarea sistemelor informatice pentru asistarea deciziei

Semantic, un sistem informatic de asistare a deciziei este o arhitectură abordată unitar,

care presupune un dialog permanent cu utilizatorul, dar decizia finală este adoptată de utilizator

şi nu de sistem. Toate posibilele definiţii date SIAD-ului au ca punct de pornire obiectivele şi

modul lor de îndeplinire sau pornesc de la compararea specificităţii acestora cu alte sisteme

informatice. De regulă, se face comparaţia între sistemele informatice de asistare a deciziei

(SIAD-uri) sau sistemele suport pentru decizii manageriale, DSS (Decision Support Systems) şi

celelelte sisteme informatice din imediata lor vecinătate (fig.1.1), cum sunt: sistemele

informatice pentru management (MIS), sistemele informatice pentru sprijinul conducerii

executive (ESS) sau sistemele de lucru cu cunoştinţe (KWS). MIS, de obicei, pun la dispoziţia

utilizatorului rapoarte de sinteză sau probleme de excepţie în funcţie de criterii predefinite,

referindu-se cu prioritate la un anumit domeniu (contabilitate, marketing etc.). Diferenţa dintre

MIS şi SIAD (DSS) constă în aceea că MIS pleacă de la date şi relaţiile dintre acestea pe când

SIAD-ul porneşte de la decident şi de la decizie. ESS (EIS) sunt sisteme destinate asistării

deciziilor pe cel mai înalt nivel al managementului organizaţional, ajută la identificarea şi

rezolvarea problemelor prin sesizarea de noi oportunităţi. De asemenea, acest tip de sisteme au

posibilitatea de a oferi decidentului tendinţe, analize pentru activitatea concurenţială.

Caracteristicile principale ale SIAD (DSS) sunt: rezolvarea acelor probleme care nu se

pot rezolva cu sisteme destinate cuantificării cantitative; rol de asistare a decidenţilor

(managerilor) la nivel individual sau de grup în toate etapele procesului decizional; soluţiile sunt

obţinute prin manipulări de date, căutări de informaţii, modele, calcule; timpul de răspuns pentru

obţinerea unei soluţii acceptabile este limitat.

Clasificarea SIAD-urilor se face după mai multe criterii, cel mai des utilizat fiind

componenta tehnologică dominantă (în unele lucrări, gradul de analiză a datelor pe care se

bazează soluţia):

1. SIAD-uri orientate pe modele. Modelul cantitativ este sprijinit de o interfaţă care

facilitează utilizarea. Aceste SIAD-uri realizează analize de tipul „what...if” . Activităţile

implicate sunt de tipul modelare-simulare, previziune, optimizare.

2. SIAD-uri orientate pe date care se referă la un volum apreciabil de date (date istorice)

stocate în sistemul informatic al organizaţiei şi oferă posibilitatea de a extrage informaţii utile

Page 17: SISTEME INFORMATICE PENTRU ASISTAREA DECIZIEI (SIAD) · Sistemele informatice pentru asistarea deciziei, SIAD – implică folosirea elementelor aplicative din discipline diverse

din multitudinea de date de care dispune. Aceste tipuri de SIAD-uri au la bază depozitele de

date (Data Warehouse), iar prelucrarea este asigurată de tehnologiile informaţionale OLAP

(procesarea analitică online) şi Data Mining (explorarea şi căutarea datelor).

3. SIAD-uri bazate pe cunoştinţe care utilizează tehnologiile inteligenţei artificiale şi de

aceea se mai numesc şi SIIAD (sisteme informatice inteligente de asistare a deciziei).

4. SIAD-uri orientate pe comunicaţii la care componenta tehnologică dominantă este

reprezentată de comunicaţiile bazate pe calculatoare şi reţele de calculatoare;

5. SIAD-uri orientate pe documente (sau sisteme de management al documentelor, DMS,

Document Management Systems) care asigură stocarea şi regăsirea documentelor (inclusiv a

paginilor Web) şi informaţiilor prin tehnici (motoare) speciale de căutare (Search).

Primele trei categorii de SIAD-uri fac obiectul abordării detaliate în capitolele următoare

ale lucrării de faţă.

O a doua clasificare, oferită de Holsapple şi Whinston, grupează sistemele SIAD în cinci

tipuri:1

1. SIAD bazate pe analiza textelor; toate informaţiile de care are nevoie decidentul le

găseşte sub formă de text care trebuie analizat; documentele sunt create, revizuite şi

vizualizate automat; de asemenea, documentele sunt grupate, fuzionate şi expediate sub

diferite formate şi cu diferite tehnologii (de exemplu, hypertext şi agenţi inteligenţi); sunt

identificate locaţiile corespunzătoare colecţiilor mari de date;

2. SIAD baze de date au drept componentă principală baza de date a organizaţiei; sistemul

de gestiune al bazelor de date (SGBD) asigură structurile de date, modurile de acces la date,

specificarea volumului corespunzător colecţiilor de date, asistarea interogărilor asupra bazelor

de date.

3. SIAD procesoare de tabele au ca principală componentă procesoarele de tabele care ajută

utilizatorul să descrie modele pentru analiză. Cel mai utilizat procesor de tabele este Excel

care include modele statistice, financiare, de previziune, de simulare. Modelul folosit se

generează prin selectarea obiectelor (conceptelor) şi a relaţiilor (ecuaţiilor) dintre obiecte.

4. SIAD bazate pe funcţii; funcţia care de fapt este o procedură sau un algoritm scris într-un

limbaj de programare şi destinată a fi utilizată pentru rezolvarea unui anumit tip de probleme;

5. SIAD bazate pe reguli; regulile sunt prevăzute în KWS, specifice inteligenţei artificiale.

Dacă se consideră drept criteriu de clasificare – frecvenţa folosirii SIAD-urilor, acestea se

împart în:

a) SIAD-uri organizaţionale, adică acele SIAD-uri integrate în sistemul informatic total

(integrat) al organizaţiei economice care prezintă obiective precise pentru asistarea deciziilor ce

posedă caracter de repetabilitate; sunt puse la punct şi utilizate pe perioade mari de timp;

b) SIAD-uri ad-hoc, adică acele SIAD-uri care rezolvă probleme unicat de asistare a

deciziei; prezintă costuri ridicate de dezvoltare.

În ultimii ani au apărut SIAD de grup (Groupware) ca tip de suport al deciziilor pentru

un grup de decidenţi ale căror decizii au o pondere însemnată în luarea deciziilor într-o

organizaţie. Scopul utilizării unor astfel SIAD-uri este creşterea calităţii procesului decizional

datorită lucrului în echipă precum şi creşterea gradului de creativitate al grupului.

1 Zaharie D, Albescu F, colectiv – Sisteme informatice pentru asistarea deciziei, Editura Dual Tech, Bucureşti,

2001.

Page 18: SISTEME INFORMATICE PENTRU ASISTAREA DECIZIEI (SIAD) · Sistemele informatice pentru asistarea deciziei, SIAD – implică folosirea elementelor aplicative din discipline diverse

La realizarea SIAD-urilor (şi nu numai), este avut în vedere un ansamblu de

caracteristici. Dintre aceste caracteristici, cele mai importante sunt:

- să fie flexibile şi să furnizeze mai multe opţiuni pentru gestionarea datelor şi

evaluarea lor intermediară şi finală;

- să fie capabile să suporte o mare varietate de stiluri, calificări şi clasificări;

- să se bazeze pe mai multe modele analitice şi intuitive pentru evaluarea datelor şi să

dispună de capacitatea de a urmări mai multe alternative şi consecinţe;

- să reflecte înţelegerea grupurilor şi proceselor organizaţionale de luare a deciziilor;

- să fie sensibile la birocraţia şi cerinţele politicilor organizaţionale;

- să reflecte şi să conştientizeze limitele sistemelor informatice.

Aşa cum s-a arătat deja, SIAD-urile sunt încorporate în cadrul sistemelor informatice

integrate (la nivelul organizaţiei economice), asimilate după unele lucrări, cu sistemele de

planificare a resurselor întreprinderii, ERP (Enterprise Resource Planning).

1.6. Sisteme suport pentru asistarea deciziei

Ca şi alte tipuri de sisteme informatice, SIAD-urile au ca bază un suport soft care le oferă

un mediu de întreţinere, dezvoltare şi funcţionalitate, ele funcţionând într-un mediu creat de

sisteme suport de asistare a deciziei (SSAD).

Funcţiile unui SIAD sunt: gestiunea datelor, gestiunea modelelor, gestiunea cunoştinţelor

şi gestiunea comunicării între utilizator şi sistem şi între date şi modele, cunoştinţe.

Un sistem suport pentru SIAD (SSAD) prezintă în arhitectura sa următoarele subsisteme:

subsistemul de gestiune a datelor; subsistemul de gestiune a modelelor; subsistemul de gestiune

a cunoştinţelor; subsistemul de gestiune a dialogului (sau interfaţa cu utilizatorul).

1.6.1. Subsistemul de gestiune a datelor

Subsistemul de gestiune a datelor are următoarele componente:

a) baza de date ce poate fi proprie SIAD sau se poate crea prin extragere de date din alte

baze de date sau dintr-un depozit de date. Ea poate fi utilizată de unul sau mai mulţi decidenţi

pentru diverse aplicaţii. Datele pot proveni din mai multe surse interne organizaţiei sau chiar din

afara ei, ele putând fi incluse în baza de date proprie sau pot fi accesate direct doar în momentul

în care se utilizează sistemul.

b) sistemul de gestiune a bazelor de date, SGBD, ce este de obicei încorporat în SIAD şi

de cele mai multe ori el este de tip relaţional.

c) dicţionarul de date (Data Dictionary) ce conţine un catalog al datelor bazei de date

împreună cu definiţia lor şi care este utilizat în prima fază a procesului decizional - faza de

identificare a problemelor.

d) facilităţile de integrare a datelor ce se referă la existenţa limbajelor declarative de

interogare.

Page 19: SISTEME INFORMATICE PENTRU ASISTAREA DECIZIEI (SIAD) · Sistemele informatice pentru asistarea deciziei, SIAD – implică folosirea elementelor aplicative din discipline diverse

Factorii de diferenţiere a datelor, pe diferitele niveluri de management organizaţional,

sunt structurile de date, existenţa posibilităţii de agregare a datelor, dimensiunea datelor

(unidimensionalitatea sau multidimensionalitatea), orizontul de timp, metadatele.

Metadatele sunt date despre date. Este realizat, în acest scop, un dicţionar al metadatelor

ce poate conţine inclusiv metadate partajate. Dacă se prevede un server comun de metadate,

atunci orice aplicaţie se poate folosi de aceste metadate.

1.6.2. Subsistemul de gestiune a modelelor

Subsistemul de gestiune a modelelor prezintă următoarele componente:

a) modelele – sunt reprezentate de modelele financiare, statistice, de previziune şi stau la

baza analizei obţinerii soluţiilor pentru sistemul decizional;

b) sistemul de gestiune al modelelor (similar SGBD), destinat pentru crearea de noi

modele cu ajutorul limbajelor de programare, subrutine, sau de actualizare a modelelor deja

existente;

c) dicţionarul (catalogul) de modele;

d) procesul de execuţie şi integrare a modelelor, ce este utilizat pentru a interpreta

instrucţiuni create de utilizator pentru un anumit model utilizator şi pentru transmiterea acestora

către sistemul de gestiune a modelelor.

1.6.3. Subsistemul de gestiune a cunoştinţelor

Subsistemul de gestiune a cunoştinţelor înglobează sisteme expert ce oferă pentru SIAD

soluţii pentru aspectele calitative nestructurate. Sistemele expert utilizate în acest context se vor

axa pe analiza problemei şi selecţia modelelor care pot oferi soluţii pentru problema respectivă şi

realizarea modelelor.

1.6.4. Interfaţa cu utilizatorul

Subsistemul de dialog cu utilizatorul sau interfaţa este o componentă care asigură

interactivitatea SIAD. SSAD este gestionat de un produs soft denumit sistemul de gestiune al

interfeţei cu utilizatorul (SGIU), format din programe speciale cum sunt: interfaţă grafică

(Graphic User Interface, GUI), prezentarea datelor sub diverse forme (grafice, figuri, tabele),

dialog cu utilizatorul în diverse moduri şi altele. Datorită rolului pe care îl are în SIAD

utilizatorul este considerat o parte componentă a acestuia. Pentru SIAD, utilizatorul devine

manager sau decident.

Page 20: SISTEME INFORMATICE PENTRU ASISTAREA DECIZIEI (SIAD) · Sistemele informatice pentru asistarea deciziei, SIAD – implică folosirea elementelor aplicative din discipline diverse

2. SIAD-URI BAZATE PE MODELE

2.1. Consideraţii referitoare la modele şi metode

Un sistem informatic de asistare a deciziei (SIAD) foloseşte un set de modele ca

instrumente de analiză. Modelarea este considerată esenţială pentru sistemele informatice de

asistare a deciziei şi implică partea de concepere a problemei şi partea de abstractizare în

expresii cantitative sau calitative. Funcţionarea SIAD pe bază de modele se axează pe utilizarea

modelelor pentru rezolvarea unor probleme cu care sunt confruntaţi managerii, dacă aceste

probleme pot fi parţial modelate. Principala caracteristică a acestor sisteme este modelarea

euristică utilizată ca metodă de rezolvare a acelor probleme care nu se pot rezolva prin metode

analitice.

Modelul oferă un mod simplificat sau abstractizat de abordare a realităţii. Simplificarea

rezidă din faptul că problemele din lumea reală sunt mult prea complicate, iar unele aspecte ale

acestei realităţi nu sunt întotdeauna relevante. Gradul de abstractizare al unui model este dat de

mai multe criterii, după care se va face şi clasificarea lor:

a) modele iconice cu un grad mic de abstractizare, cu reflectarea fidelă a realităţii la o altă

scară;

b) modele analitice care au acelaşi comportament cu sistemul real, dar sunt diferite întrucât

ele sunt reprezentări simbolice. Astfel de modele pot fi diagramele, graficele bidimensionale;

c) modele cantitative (matematice) ce au un înalt grad de abstractizare şi care sunt cele mai

des folosite în SIAD.1

Ca structură, modelul are trei componente principale:

1. variabilele de decizie care descriu opţiuni alternative şi ele sunt date de decident;

2. parametrii ce influenţează rezultatul, dar nu pot fi controlaţi de decident, ei devenind de

fapt restricţii ale problemei, limitând soluţiile acesteia;

3. variabilele rezultat care sunt variabile dependente de adoptarea unor acţiuni şi de

parametrii modelului.

De obicei, modelele pot fi de optimizare cu ajutorul unui algoritm, cu ajutorul unei formule,

obţinându-se modele de simulare, euristice şi chiar predictive, adică acele care pot da trend-ul

referitor la un scenariu utilizat. De remarcat este că fiecare metodă de rezolvare se poate aplica

unui model static sau dinamic construit în ipoteza de certitudine, incertitudine sau risc.

Conceptul de model a fost preluat din tehnică, matematică şi de la analiştii de sistem.

Modelul se poate defini ca o reprezentare abstractă şi simplificată a unui proces

economic. Metoda modelării este astfel un instrument al cunoaşterii ştiinţifice şi are drept obiect

construirea unor reprezentări care să permită o cunoaştere pertinentă a diverselor domenii. În

esenţă metoda modelării constă în substituirea procesului real studiat cu un model care este mai

accesibil studiului.

Rezultatele obţinute prin modelare se pot extrapola către procesul modelat, cu condiţia ca

modelul să reprezinte proprietăţile, structura şi particularităţile acestuia. De aceea trebuie ţinut

cont de faptul că indiferent de modelul economico-matematic ales, el va reprezenta fidel un

anume fenomen, numai în măsura în care acesta are la bază teoria economică, teorie care descrie

1 Zaharie D, Albescu F, colectiv – Operă citată

Page 21: SISTEME INFORMATICE PENTRU ASISTAREA DECIZIEI (SIAD) · Sistemele informatice pentru asistarea deciziei, SIAD – implică folosirea elementelor aplicative din discipline diverse

categoriile, conceptele şi legile obiective ale realităţii economice. Modelele se pot grupa pe

categorii în funcţie de anumite criterii.

1. După sfera de cuprindere a problematicii economice sunt:

- modele macroeconomice care sunt definite ca modele de ansamblu ale economiei;

- modele mezoeconomice care au ca domeniu de reflectare nivelel regional, teritorial;

- modele microeconomice care au un domeniu mai restrâns şi se referă la nivelul firmelor.

2. După domeniul de provenienţă şi concepţie :

- modele cibernetico-economice, care se bazează pe relaţii I/O cu evidenţierea fenomenelor

de reglare;

- modele econometrice în care elementele numerice sunt determinate statistic şi identifică

tendinţe sau periodicităţi;

- modele ale cercetării operaţionale care permit obţinerea soluţiei optime sau apropiate de

optim pentru un anume fenomen supus studiului;

- modele din teoria deciziei;

- modele de simulare prin care se poate stabili modul de funcţionare al unui sistem micro sau

macroeconomic prin combinaţii aleatoare de valori pentru variabilele independente

- modele specifice de marketing.

3. După caraterul variabilelor modelele sunt:

- modele deterministe cu mărimi cunoscute;

- modele stochastice sau probabiliste în care intervin mărimi a căror valoare este permanent

însoţită de o probabilitate.

4. După factorul timp modelele sunt statice şi dinamice.

5. După orizontul de timp considerat sunt modele discrete sau secvenţiale şi modele

continue.

6. După structura proceselor modelate sunt:

- modele cu profil tehnologic;

- modele informaţional-decizionale;

- modele ale relaţiilor umane;

- modele informatice.

În cadrul celor şase grupe, modelele mai pot fi caracterizate ca fiind:

- descriptive pentru că realizează o cunoaştere directă a procesului studiat;

- normative deoarece permit realizarea unui comportament viitor cerut de factorii de

decizie.

Metodele folosie pentru rezolvare constau dintr-o succesiune de operaţii logice şi

aritmetice care sunt denumite algoritmi.

Se poate afirma că algoritmii pot fi exacţi (riguroşi), aproximativi şi euristici.

Pentru ca un algorim să răspundă cerinţelor opentru care a fost construit, el va trebui să

satisfacă următoarele cerinţe:

- universalitatea, adică să asigure prelucrarea unui număr mare de date de intrare;

- finitudinea, adică timpul de obţinere a rezultatelor să fie de ordinul ore, iar necesarul de

memorie să fie minim;

- determinismul.

Adaptările modelării matematice la fenomene economice au la bază şi concepţia asupra

mărimilor care intervin în procesul de fundamentare corectă a deciziilor. De menţionat este

faptul că aceste mărimi care intervin implică observări, anchete, raportări care permit o măsurare

Page 22: SISTEME INFORMATICE PENTRU ASISTAREA DECIZIEI (SIAD) · Sistemele informatice pentru asistarea deciziei, SIAD – implică folosirea elementelor aplicative din discipline diverse

a lor cu diferite grade de precizie. Conform cu gradul de precizie mărimile care caracterizează

procesele economice se pot clasifica în:

- mărimi deterministe care sunt bine definite şi au o valoare unică;

- mărimi stochastice sau aleatoare ce deţin o multitudine de valori cărora li se asociază o

probabilitate;

- mărimi fuzzy care nu au valoare unică, ci dispun de o mulţime de valori cărora li se asociază

un grad de apartenenţă la o anume proprietate.

Conform cu clasificarea mărimilor ce caracterizează procesele economice se ajunge la o

similară clasificare a metodelor de prelucrare pentru adoptarea deciziilor.

Astfel se poate afirma că sunt metode deterministe, metode stochastice şi metode fuzzy.

Se poate face o clasificare care are la bază criteriul exactităţii şi astfel metodele pot fi: exacte,

aproximative şi euristice.

Metodele exacte permit ca pentru o problemă de decizie economică să se obţină o soluţie

S care îndeplineşte fără nici un dubiu restricţiile impuse şi/sau condiţiile de optim, condiţii cerute

de criteriile de eficienţă. Dacă se face notaţia S1 pentru vectorul soluţiilor adevărate şi notaţia S

vectorul soluţiei efectiv adoptate, atunci: S-S1=0.

Metode aproximative permit obţinerea unei soluţii S diferită de soluţia adevărată S1

printr-un vector dominat de un alt vector dinainte stabilit astfel că vom avea:

S-S1= (1)

Metode euristice sunt utilizate în cazul unor probleme complexe pentru că într-un timp

relativ scurt, comparativ cu alte metode, se obţine o soluţie acceptabilă din punct de vedere

practic, S care nu prezintă garanţii asupra rigurozităţii rezolvării.

Este dat vectorul erorii admisibile , dar metodele euristice nu pot totdeauna să ducă la o

soluţie S care să îndeplinească proprietatea (1). Sunt însă cazuri când metodele euristice reuşesc

să asigure respectarea relaţiei (1), cu o anumită probabilitate. Acest tip de metode sunt

considerate a fi o succesiune de încercări sau tatonări a căror alegere este de fiecare dată legată

de natura problemei care se rezolvă şi de analistul de sistem.

Etapele procesului de modelare.

Modelele pentru a fi utile practicianului trebuie să fie simple, suple, accesibile şi

adaptabile.

Modelarea are ca etape;

1. cunoaşterea detaliată a realităţii sistemului de modelat;

2. construirea modelului economico-matematic;

3. experimentarea acestui model;

4. implementarea modelului şi actualizarea soluţiei.

Construirea modelului presupune alegerea instrumentelor de modelare, fie ele clasice

sau nu. Pentru elaborarea unor modele noi, analistul poate decide în a alege o combinaţie de

modele clasice sau modele noi. Experimentarea modelului se face in vivo prin aplicarea

modelului descriptiv sau normativ în practica firmei şi prin determinarea eficienţei sale. Modul

acesta de experimentare se realizează numai pe eşantioane reduse, pentru că implică riscuri.

Page 23: SISTEME INFORMATICE PENTRU ASISTAREA DECIZIEI (SIAD) · Sistemele informatice pentru asistarea deciziei, SIAD – implică folosirea elementelor aplicative din discipline diverse

2.2 Algoritmi euristici

Modelarea procedurală.

Metodele de optimizare bazate pe metode normative se pot uneori îndepărta de realitatea

economică şi de aceea aceste inconveniente pot fi îndepărtate prin utilizarea modelării

procedurale. Pentru a cunoaşte legile care definesc un fenomen economic se parcurg următorii

paşi:

• observarea sub aspect descriptiv-calitativ a fenomenului luat în studiu;

• formularea unor legi de tip descriptiv-calitativ;

• observarea fenomenelor sub aspect cantitativ şi formulareaunor legi cantitative;

• adoptarea unor decizii;

• stabilirea efectelor deciziilor adoptate şi cum se va perfecţiona modul de luare a deciziilor

în viitor.

Etapele se pot sintetiza şi folosi într-un model economico-matematic, iar construirea acestuia

este independentă de informaţiile obţinute. Pentru rezolvarea modelului se utilizează diferiţi

algoritmi care sunt consideraţi de prim rang în modelarea procedurală.

Modelarea procedurală se poate realiza în două strategii:

- modelare generală când se urmăreşte acoperirea tuturor cazurilor posibile;

- modelarea pe tipuri de probleme sau clase, atunci când se aleg probleme frecvente din practică.

Există în economie o stânsă legătură dintre metodele utilizate şi natura mărimilor care

caracterizează procesul analizat. Dacă mărimile pot fi măsurate exact atunci se poate afirma că

sunt utilizaţi cu maximă eficienţă algoritmii exacţi.

Dacă însă, problema este complexă sau de mari dimensiuni sau datele de intrare sunt

inexacte se vor folosi algoritmi euristici.

Schema de concepere a algoritmilor euristici.

Euristica se defineşte ca fiind o clasă de metode şi reguli care dirijează subiectul spre o

soluţie simplă şi economică, sau este un drum care duce la descoperirea soluţiilor problemelor

complexe fără a le supune simplificării.

Metodele euristice sunt tatonări şi nu şabloane, iar alegerea lor este legată de natura

problemei de rezolvat şi de experienţa celui care modelează. Euristica are legături cu

raţionamentele analogice şi cu psihologia simulării. Această relaţie se poate evidenţia prin

performanţă, comportament si prin srtuctură. Modelarea euristică porneşte de la construirea unui

sistem analog cu cel investigat. De obicei, problema este de a descoperi regulile de bază ale

euristicii specialistului, pentru ca apoi ele să poată fi perfecţionate şi sistematizate într-un

algoritm. În utilizarea algoritmilor euristici trebuie respectate restricţii şi în fiecare etapă de

calcul să se obţină eficienţă maximă pentru funcţia obiectiv. Dintre două sau mai multe

posibilităţi se va alege acea cale (posibilitate) care duce la creşterea sau descreşterea valorii

funcţiei obiectiv de maxim respectiv minim.

Paşii algoritmului general de rezolvare sunt următorii:

• se construieşte o soluţie iniţială;

• se testează condiţiile de administrare a soluţiei;

• dacă pasul anterior a fost îndeplinit se trece la următorul pas care constă în căutarea unei

strategii de reducere a abaterilor є. În acest scop se poate stabili una sau mai multe

strategii care se presupune a reduce abaterile є. După testarea strategiilor se va alege

aceea strategie care permite un număr cât mai mic de iteraţii şi reduce la maxim abaterile

Page 24: SISTEME INFORMATICE PENTRU ASISTAREA DECIZIEI (SIAD) · Sistemele informatice pentru asistarea deciziei, SIAD – implică folosirea elementelor aplicative din discipline diverse

є. După un număr relativ mare de iteraţii, dacă nu s-au anulat aceste abateri, problema

este considerată fără soluţie din punct de vedere al algoritmului euristic utilizat;

• se calculează funcţia de performanţă f(x0) a soluţiei iniţiale admisibile;

• se calculează funcţia de performanţă f(x1) a noii soluţii;

• se compară performanţele celor două soluţii f(x0 şi f(x1). Dacă performanţa f(x1) este

superioară performanţei f(x0) atunci se evaluează diferenţa f(x1)- f(x0;

• dacă diferenţa este semnificativă, soluţia x1 devine soluţie iniţială şi algoritmul se

continuă de la pasul în care se calculează funcţia de performanţă.

Din cele expuse mai sus rezultă că modelele procedurale utilizează simularea şi în urma

obţinrerii rezultatelor decidentul poate adopta decizii bazate şi pe cunoştinţele dobândite

asupra fenomenului condus, cât şi prin acumularea unei anumite experienţe.

2.3. Tabele de decizie şi arbori de decizie

Actul de decizie care presupune un număr relativ finit şi rezonabil de alternative se poate

modela prin analiza decizională. Aceasta presupune ataşarea unor valori estimate (cu

probabilităţile aferente) pentru fiecare alternativă şi care se vor înscrie într-un tabel sau un graf.

Modul de alegere a deciziei se face prin a vedea care dintre alternative este cea mai bună.

Această metodă utilizează tabelele de decizie care caracterizează acţiunea decizională şi conţine:

stări generale care sunt date de totalitatea condiţiilor în care se desfăşoară evenimentul de

analizat; alternative decizionale ce determină modul de realizare a unei acţiuni independente de

voinţa decidentului; consecinţe decizionale ce sunt rezultatul acţiunii conjugate a stării generale,

criteriilor decizionale şi alternativelor. Condiţia este ca numărul de consecinţe să fie mai mare

sau egal cu numărul de criterii.

În cazul problemelor de decizie multicriterială în condiţii de risc, în care se cunosc

probabilităţile de realizare a fiecărei stări, soluţia optimă este dată de (p – probabilitatea, u –

utilitatea):

( )==

n

j

jij xupiSopt1

*max

Dacă problema de decizie multicriterială este descrisă în condiţii de incertitudine soluţia

optimă va fi dată urmând una dintre reguli:

• Criteriul WARD (al prudenţei) ce presupune că nu se admite sub nici o formă riscul. Se

determină soluţia cea mai slabă pentru fiecare variantă şi se alege aceea care duce la cel mai

bun rezultat (ales dintre rezultatele slabe);

• Criteriul SAVAGE sau regula regretului care foloseşte conceptul de “regret economic”*

ce rezultă din faptul că nu s-a ales varianta bună. Se compară apoi fiecare ipoteză cu o singură

alternativă şi se alcătuieşte o matrice a regretelor, obţinută din scăderea fiecărei stări din

variabila maximă. Apoi se rezolvă problema de minim-maxim;

• Criteriul Laplace în care toate stările se consideră a fi echiprobabile şi se alege acea

variantă pentru care speranţa matematică a efectului economic este maximă;

Page 25: SISTEME INFORMATICE PENTRU ASISTAREA DECIZIEI (SIAD) · Sistemele informatice pentru asistarea deciziei, SIAD – implică folosirea elementelor aplicative din discipline diverse

• Criteriul Hurwicz ce presupune calculul unui indicator decizional ca medie ponderată a

rezultatelor extreme. Se notează cu α coeficientul de optimizare considerat de decident, iar

acesta poate avea valori cuprinse între 0 şi 1:

▪ ( ) iii mMd *1* −+=

Cu ajutorul arborilor de decizie se pot reprezenta tabelele de decizie prin evidenţierea

grafică a relaţiilor dintre variabilele problemei.

2.4. Optimizare cu algoritmi – programare matematică

Problemele manageriale în care decidentul poate aloca doar o cantitate limitată de resurse

mai multor activităţi se pot rezolva cu setul de instrumente şi metode puse la dispoziţie de

programarea matematică, din care cea mai utilizată este programarea liniară. Aceasta din urmă

impune anumite reguli pe care decidentul trebuie să le respecte: existenţa unui set de variabile

măsurabile pentru care se caută valoarea optimă; construirea unui set de restricţii cu aceste

variabile care, în cazul decizional, sunt variabile de decizie, care sunt de fapt relaţii de egalitate

sau inegalitate faţă de anumite valori; o funcţie obiectiv care reprezintă o relaţie matemetică

liniară între variabilele de decizie şi rezultatul scontat a cărei valoare trebuie minimizată sau

maximizată; crearea legăturilor între elemente realizată cu ajutorul relaţiilor matematice numite

ecuaţii, în care apar şi coeficienţi.

Modelul unei probleme de programare liniară devine astfel: determinarea unui min sau

max pentru funcţia obiectiv care depinde de una sau mai multe variabile care satisfac restricţiile

modelului (condiţii implicite) sau care se referă la valorile ce pot fi luate de variabile (condiţii

explicite); problemele de programare liniară au restricţii de tip inegalităţi şi condiţii explicite

puse unora dintre variabile.

Modelul de programare liniară are forma:

( ) ( )

+++

+++

+++

+++=

mnmnmm

nn

nn

nnn

bxaxaxa

bxaxaxa

bxaxaxa

xcxcxcxxxf

*...**

..................................................

*...**

*...**

*...**,...,,minmax

2211

22222121

11212111

221121

În forma standard toate restricţiile sunt ecuaţii, iar variabilele sunt >=0:

( ) ( )

=

=

0

minmax

x

BAx

cxxf

Page 26: SISTEME INFORMATICE PENTRU ASISTAREA DECIZIEI (SIAD) · Sistemele informatice pentru asistarea deciziei, SIAD – implică folosirea elementelor aplicative din discipline diverse

În forma canonică toate restricţiile sunt concordante şi toate variabilele sunt>=0:

( )

=

0

max

x

BAx

cxxf

( )

=

0

min

x

BAx

cxxf

Aceste probleme se rezolvă cu algoritmul SIMPLEX (Dantzing, 1951) care este de fapt

iterativ, la fiecare pas se obţine o îmbunătăţire a soluţiei, oferind:

- soluţia admisibilă ce satisface doar condiţiile explicite sau

- soluţia optimă.

Programul Excel prin componenta sa Solver rezolvă problema de programare liniară. În

ultimul timp majoritatea problemelor sunt de programare liniară multidimensională, ca de

exemplu: metoda utilităţii globale în care problema de programare liniară este luată drept o

problemă de decizie multidimensională. În acest caz, funcţia obiectiv este înlocuită cu funcţia de

utilitate; metoda P.O.P. – algoritmul care descrie această metodă presupune o ordonare a

soluţiilor în funcţie de criterii de preferinţă definite de decident; metoda STEM ce constă în

definirea unei funcţii obiectiv de sinteză cu coeficienţi care vor fi ataşaţi fiecărui criteriu.

2.5 Simularea

Simularea constă în a crea variante care se apropie de ceea ce se întâmplă în realitate, ea

fiind de fapt o metodă experimentală. De obicei SIAD reflectă realitatea complexă a fenomenelor

şi proceselor economice, şi de aceea este greu de crezut că un model matematic, cât ar fi el de

bun, poate să reflecte aceste procese. Simularea, a nu se confunda, nu este un model în strictul

înţeles al cuvântului, ci prin diverse instrumente folosite imită ceea ce se întâmplă în realitate.

Gradul de simplificare oferit de simulare este mult mai mic decât în cazul modelelor

tradiţionale. Ea reprezintă o metodă descriptivă, deci nu există o procedură prin care să se obţină

o soluţie optimă.

Procesul de trecere de la sistemul real la modelul de simulare.

Structurarea unor informaţii despre sistemul real, înainte ca el să fie realizat concret, este

posibilă cu ajutorul tehnicii simulării. Dacă este să definim simularea, aceasta este tehnica de

„realizare a experimentelor cu calculatorul numeric, care implică construirea unor modele

matematice şi logice care descriu comportarea unui sistem real (sau a unor componente ale sale)

de-a lungul unei perioade mari de timp”1 .

Ca proces, simularea va genera intrările, iar prin algoritmi corespunzători va determina

ieşirile şi va descrie evoluţia în timp a stărilor interne ale sistemului.

Obiectivele finale ale simulării necesită adoptarea celor mai bune mijloace şi metode de

conducere pentru activităţile tehnologice cât şi pentru cele economice. Pentru modelarea prin

Page 27: SISTEME INFORMATICE PENTRU ASISTAREA DECIZIEI (SIAD) · Sistemele informatice pentru asistarea deciziei, SIAD – implică folosirea elementelor aplicative din discipline diverse

simulare a proceselor tehnologice se utilizează atât echipamente de automatizare cât şi

calculatoare electronice conectate la procesul de producţie.

În condiţiile în care se simulează un proces economic se includ calculatoare electronice

cu capacitate mare de calcul şi posibilităţi de stocare pentru mari volume de date.

Se poate afirma că în cazul sistemelor de conducere a activităţilor economice,

calculatoarele sunt destinate pentru luarea unor decizii corespunzătoare, iar în cazul sistemelor

de conducere a proceselor tehnologice acestea elaborează automat decizii sub forma unor

comenzi care sunt transmise către procesul condus. Dacă se face referire la cercetările pe plan

mondial, acestea se referă la realizarea unor sisteme de conducere ierarhizate, multinivel care

funcţionează în timp real şi sunt distribuite în toate compartimentele firmelor.

Sistemele ierarhizate se bazează pe o structură ierarhizată pe niveluri de conducere, ceea

ce implică coducerea tuturor compartimentelor componente prin decizii adoptate în timp real.

Obiectivul major al sistemului este obţinerea unei producţii optime cantitativ şi calitativ în

condiţiile în care există resticţii temporale de scurtă sau lungă durată şi a unor perturbaţii

permanente din partea mediului.

Dacă se fac referiri la etapele procesului de simulare se poate afirma că ele se concretizează

în:

• Analiza şi sinteza sistemelor şi proceselor;

• Programarea modelului de simulare;

• Validarea modelului de simulare;

• Simularea propriu-zisă;

• Analiza şi implementarea rezultatelor.

Analiza şi sinteza sistemelor şi proceselor economice constă în descompunerea în părţi

componente pentru fiecare activitate de analiză, iar proiectarea sistemelor este procesul prin care

sunt selectate componentele şi elementele dar şi etapele şi procedurile care conduc către

realizarea unui sistem viabil pentru obiectivul luat în studiu.

De obicei un model de simulare se proiectează pentru a observa comportamentul unui

sistem existent sau pentru proiectarea unui sistem nou. Ca prim pas în procesul de simulare se

evidenţiază identificarea şi formularea problemei sau scopului studiului, în care trebuie să se

specifice obiectivele experimentului.

Pentru aceasta se vor lua în considerare elemente cum sunt:

1. Stabilirea variabilelor de decizie şi a variabilelor de stare, în care variabilele de decizie

sunt cele asupra cărora analistul are un control complet şi care stau la baza deciziei luate

de acesta la un moment dat. Variabilele de stare sunt dependente de cele de decizie şi

descriu starea unei componente în orice moment;

2. Identificarea unui model optimal de evoluţie implică analiza şi sinteza, care se

concretizează în stabilirea unui model conceptual care să fie apropiat de cel real;

3. Măsurarea performanţelor sistemului se obţine prin construirea unei funcţii obiectiv. Sunt

însă şi cazuri când această identificare a performanţelor sistemului se realizează prin

punerea în evidenţă a deciziilor şi valorilor variabilelor de stare în diverse variante ale

mărimilor de intrare.

2.5.1.Conceperea şi proiectarea modelului

Această etapă constă în stabilirea în mod detaliat a tuturor aspectelor legate de problema

pusă în studiu, chiar dacă uneori tinde către o rezolvare analitică. În această etapă se precizează:

Page 28: SISTEME INFORMATICE PENTRU ASISTAREA DECIZIEI (SIAD) · Sistemele informatice pentru asistarea deciziei, SIAD – implică folosirea elementelor aplicative din discipline diverse

• ipotezele care se vot testa;

• efectele probabile care urmează să apară;

• schimbările caracteristicilor operative asupra variabilelor şi parametrilor de ieşire;

• studiul efectelor asupra variabilelor şi parametrilor de intrare;

• intervalul admisibil pentru variabilele şi parametrii de stare,

• strategiile luate în calcul la eventuale apariţii a evenimentelor perturbatoare şi a

costurilor corespunzătoare fiecărei strategii;

• strategiile de urmat pentru modificarea parametrilor de stare în cazul în care au fost

depăşite limitele admisibile ale altor parametri de stare;

• vectorul iniţial al probabilităţilor de prevenire a apariţiei evenimentelor perturbatoare sau

de modificare a mărimii parametrilor de stare;

• tehnici de reducere a datelor şi de analză a rezultatelor;

• forma ecuaţiilor matematice;

• ecuaţiile suprafeţei de răspuns etc.

Un loc important îl are colectarea şi prelucrarea primară a datelor, fază în care se

stabilesc datele necesare, cum se obţin ele şi mai ales cum sunt introduse în model.

Datele se vor organiza în fişiere, tabele, rapoarte şi se prelucrează pentru a intra în

prelucrare numai cele care sunt necesare. Un alt obieciv îl reprezintă stabilirea modelului

potenţial, pentru care se va lua în considerare fenomenul aşa cum se produce el în realitate.

Pentru această etapă este necesar a se stabili :

1. ce funcţii trebuie să realzeze sistemul;

2. care sunt funcţiile care se vor modela;

3. care sunt funcţiile deterministe;

4. care sunt factorii de mediu care influenţează performanţele sistemului;

5. cum se face aproximarea efectelor factorilor de mediu asupra sistemului;

6. ce interacţiuni intervin între om, sistem şi mediu şi cum se evaluează.

Având răspunsurile la aceste întrebări se poate obţine o primă formă a modelului, se pot

defini parametrii şi variabilele. De remarcat este faptul că parametrii modelului sunt: de sistem

sau auxiliari. Parametrii sistemului sunt direct legaţi de sistemul care va fi simulat, iar parametrii

auxiliari nu sunt asociaţi direct cu sistemul, însă au efect asupra performanţelor acestuia. Există

parametri cinematici care sunt asociaţi cu mişcarea în sistem sau în mediu, iar cei dinamici deţin

valori care sunt influenţate de alţi parametri sau variabile. Există şi o categorie de parametri care

sunt denumiţi statici şi care prin valorile lor influenţează stochasic procesele şi schimbă

elementele în sistem. Parametrii de mediu sunt asociaţi mediului din care face parte sistemul şi-i

pot influenţa performanţele.

În model există şi variabile aleatoare, adică valorile lor sunt necunoscute, dar pot apare

în condiţii datorate întâmplării cu probabilităţi determinate. O altă categorie de variabile sunt

cele controlabile ale căror valori sunt măsurabile printr-o anumită procedură şi sunt şi variabile

necontrolabile.

O altă clasificare a variabilelor este aceea că acestea pot fi de intrare (mărime exogenă

controlabilă), perturbatoare (mărime exogenă necontrolabilă), intermediare (variabile de stare a

unei componente a sistemului), de ieşire (variabile exogene).

Variabilele de intrare sunt deterministe sau stochastice. Variabilele deterministe sunt

date pe suporţi de informaţii ori determinate de reguli precise. Variabilele stochastice sunt

generate prin algoritmi corespunzători pe calculator. Dacă cel puţin una dintre variabile de

intrare este stochastică, rezultă că cel puţin una dintre variabilele de ieşire este stochastică, iar

Page 29: SISTEME INFORMATICE PENTRU ASISTAREA DECIZIEI (SIAD) · Sistemele informatice pentru asistarea deciziei, SIAD – implică folosirea elementelor aplicative din discipline diverse

parametrii ei devin parametrii de ieşire. În model fiecare parametru şi variabilă a modelului se

specifică prin: simbol, definiţie, descriere, unitate de măsură, ordin de mărime pentru valori,

caracteristici, locul în model, sursa.

De remarcat este faptul că variabilele se modifică într-un ciclu de simulare cât şi de la o

variantă de evoluţie simulată la alta. Dacă variabila nu se modifică de la o variantă la alta atunci

putem afirma că ea devine parametru. Caracteristica parametrilor este aceea că ei rămân

constanţi în cadrul aceleiaşi variante, dar se pot schimba de la o variantă la alta. O clasificare a

parametrilor dă posibilitatea grupării lor în:

• parametrii cei mai importanţi şi pentru care se iau în considerare toate valorile provenite

din măsurători ;

• parametri de importanţă medie, pentru care se iau în considerare numai trei valori

caracteristice : maximă, medie şi minimă ;

• parametri de mică importanţă pentru care se ia în considerare doar o singură valoare

caracterisică care poate fi valoarea medie sau valoarea cea mai probabilă.

Simularea unui sistem economic porneşte de la definirea evenimentelor care survin în

derularea procesului economic supus analizei şi de la specificarea legăturilor existente între

evenimente. Evenimentele care intervin în procesul de simulare se clasifică în funcţie de

anumite criterii şi anume :

1. După natura evenimentelor acestea pot fi:

• Evenimente sistem;

• Evenimente program, care sunt asociate programului de prelucrare a datelor.

2. După natura condiţionărilor dintre evenimente:

• evenimente noncontingente în care apariţia unor evenimente nu depinde de

apariţia sau existenţa altor evenimente în sistem :

• evenimente contingente la care apariţia este influenţată sau condiţionată de

apariţia altor evenimente.

3. După modul de prelucrare care este asociat evenimentului:

• evenimente care nu apar în urma unor decizii :

• evenimente cu decizii.

Conform caracterului deciziei, evenimentele au la bază decizii deterministe, adică decizia

se adoptă după reguli de natură algoritmică sau euristică ; sau au la bază decizii probabiliste,

unde decizia este adoptată cu o anumită probabilitate.

4. După probabilităţile de prevedere evenimentele se clasifică în:

• previzibile, adică apariţia lor este planificată;

• perturbatoare, adică apariţia lor nu se poate stabili anticipat şi sunt cele care

influenţează defavorabil evoluţia sistemului.

5. După acţiunea asupra parametrilor de stare:

• cu acţiune imediată, ele modifică parametrii de stare ai unor componente

chiar din momentul în care apar;

• cu acţiune întârziată, ele modificând componentele sistemului după o

anumită perioadă de timp.

La elaborarea modelului se are în vedere relaţiile funcţionale dintre variabile, care dacă

nu au date suficiente, ele se pot obţine recurgâd la metoda analogiilor. Când se simulează un

model complex este eficientă formularea unor submodele specializate în rezolvarea unor funcţii

Page 30: SISTEME INFORMATICE PENTRU ASISTAREA DECIZIEI (SIAD) · Sistemele informatice pentru asistarea deciziei, SIAD – implică folosirea elementelor aplicative din discipline diverse

precise şi mai apoi acestea vor fi agregate într-un model general pe baza relaţiilor logice dintre

ele.

O astfel de operaţie este denumită integrare şi are la bază construcţia modulară a

modelului. Modulele sunt de două tipuri : de sistem şi auxiliare.

Modulele de sistem simulează o funcţie sau o operaţie logică în sistem, iar cele auxiliare

constituie o parte a modelului dar nu sunt o funcţie directă a sistemului. De exemplu, generatorul

de numere aleatoare este utilizat în orice tip de model fără a avea legătură cu problema de

rezolvat.

Se cunoaşte că în model există variabile şi parametri care vor trebui explicitaţi prin

limite accesibile minime şi maxime. Aceste limite nu pot fi depăşite în cazul modelelor

deterministe, iar pentru celelalte tipuri de modele se vor stabili aşa numitele penalizări dacă

limitele se vor depăşi. Simularea presupune evoluţia în timp a sistemului simulat, ceea ce

provoacă apariţia succesivă a unor evenimente care dau de fapt schimbările din sistem. Apare

astfel pericolul ca diverse variabile să parcurgă intervale de timp diferite. Pentru menţinerea

ordinii evenimentelor care ori schimbă ori menţin starea sistemului, se introduce în algoritmul

simulării o variabilă care va măsura scurgerea timpului real în care se execută simularea.

Această variabilă poartă numele de ceasul simulării şi are posibilitatea de a preciza după

fiecare pas al simulării, care este intervalul de timp care a trecut de la un pas la altul al simulării

şi când aceasta se poate opri. Iniţial variabila ceas este zero, ca mai apoi să se modifice într-un

număr finit de paşi, pas care poate fi constant sau variabil.

Ceasul cu incrementare finită generează pe parcursul procesului de simulare o creştere

constantă T0.

Programul de simulare permite determinarea tuturor evenimentelor posibile care se

produc în intervalul T, precum şi efectele asupra stării sistemului şi deciziile ce se vor adopta.

Ceasul cu creştere variabilă are la bază tehnica sau regula evenimentului următor, deoarece

mărimea cu care este incrementat ceasul este egală cu intervalul de timp de trecere de la o stare

notată Si la starea determinată de apariţia celui mai apropiat eveniment notată cu Si+1. Se poate

afirma că un model de simulare se construieşte prin discretizarea timpului cu creştere constantă

sau variabilă.

Timpul simulat se scurge perioadă cu perioadă, iar calculatorul va executa toate

tranzacţiile care au loc pas cu pas până la expirarea orizontului de simulare. Sunt cazuri în care

perioadele vor fi relativ scurte pentru că pot apare prea multe evenimente în cazul perioadelor

lungi şi aceasta face ca programul să fie greu de executat. Există şi situaţia în care perioadele

sunt prea scurte şi atunci apare riscul să nu apară nici o tranzacţie.

Remedierea acestei deficienţe se face prin mărirea perioadei sau prin utilizarea ceasului

cu increment variabil.

Fiecărui tip de sistem simulat îi corespunde un anumit tip de funcţie obiectiv.

După această etapă se verifică validitatea modelului prin utilizarea testelor statistice care

vor arăta dacă parametrii de intrare au fost corect estimaţi. Se verifică apoi şi dacă modelul

conţine toate variabilele esenţiale iar relaţiile dintre variabile şi parametri sunt cele corecte. După

ce modelul a fost scris într-un limbaj natural el va fi transformat într-un model scris în limbaj de

simulare.

Ca exemplificare se vor da câteva detalii despre cea mai cunoscută metodă de simulare a

proceselor economice şi anume metoda Monte Carlo.

Page 31: SISTEME INFORMATICE PENTRU ASISTAREA DECIZIEI (SIAD) · Sistemele informatice pentru asistarea deciziei, SIAD – implică folosirea elementelor aplicative din discipline diverse

Metoda Monte Carlo stă la baza procedeelor de generare a proceselor stochastice sau de

căutare a unor puncte în domeniu. Rezultatele obţinute prin utilizarea acestei metode se referă la

evaluări şi ierarhizări care fundamentează o decizie economică.

Domeniile în care se aplică această metodă sunt:

• Procese de stocare complexe, unde ritmul de aprovizionare este aleator sau sezonier,

suprafaţa de depozitare este limitată, sunt penalizări pentru lipsa de stoc sau în condiţiile

în care nu este posibilă o modelare clasică prin teoria stocurilor;

• Procese de aşteptare în care evenimentele se intercondiţioneează, iar rezolvarea lor prin

modele de aşteptare este practic imposibilă;

• Procese de repartiţie care se analizează în legătură cu activitatea de producţie şi cu cea

de investiţii.

Dacă se dispune de structura graficului reţea şi de repartiţia duratelor, simularea va consta

în aplicarea algoritmului de calcul al drumului critic pentru un număr suficient de mare de

generări ale duratelor activităţilor în concordanţă cu repartiţia stabilită.

Simularea are ca rezultat estimarea parametrilor repartiţiei duratei totale şi poate da şi

determinarea frecvenţei caracterului critic pentru orice activitate în parte.

• Procese de muncă complexe care se referă la deciziile legate de programarea operativă a

producţiei (ca de exemplu încărcarea utilajelor, lansarea în fabricaţie, urmărirea realizării

producţiei), de la locul de muncă la atelier sau secţie.

Prezentarea metodei Monte Carlo

Simularea prin metoda Monte Carlo presupune că unei probleme deterministe i se

asociază un model aleator, numit şi probabilist, iar prin generarea unor variabile aleatoare legate

de soluţie se realizează experienţa pe model. În esenţă metoda constă în realizarea experimentală

a unui eveniment a cărui probabilitate va fi exprimată de numărul , dar şi estimarea

aproximativă a acestei probabilităţi. Această metodă este de fapt sinonimă cu metoda

estimărilor statistice, mai putând fi definită şi ca metoda modelării variabilelor aleatoare pentru

calculul caracteristicilor repartiţiei lor.

Metoda propune să se plece în calculul variabilei aleatoare de la o altă variabilă aleatoare,

dar care are o repartiţie uniformă pe intervalul [0,1]. Această variabilă este din câmpul de

probabilitate constructiv, câmp a cărei aplicaţie are forma : =f(x), x0,1 cu următoarea

prorietate:

0

)( dxxf =1.

Metoda presupune estimarea parametrilor repartiţiei unei variabile aleatoare pe baza

relizărilor acesteia. Problema principală rezolvată prin metoda Monte Carlo constă în estimarea

valorii medii a unei variabile aleatoare în funcţie de o eroare admisibilă şi o probabilitate dată.

Se construieşte prin experiment statistic imaginea unor procese şi astfel se impune ca

variabilele aleatoare care intervin să fie estimate cu o abatere cât mai mică în probabilitate în

raport cu variabilele considerate a fi reale. De aceea este nevoie de construcţia unor estimatoare

satisfăcătoare. De exemplu pentru variabile aleatoare cu distribuţie normală media m se

consideră a fi estimator de maximă verosimilitate.

Calitatea eşantionului se poate aprecia prin teste de concordanţă care măsoară apropierea

repartiţiei empirice de repartiţia teoretică. Testele de concordanţă se pot baza pe unul dintre

criteriile Kolmogorov, Smirnov sau Pearson. Prin utilizarea acestor criterii se compară valorile

corespunzătoare din tabelele repartiţiei teoretice cu cele de acceptare pentru funcţia de

Page 32: SISTEME INFORMATICE PENTRU ASISTAREA DECIZIEI (SIAD) · Sistemele informatice pentru asistarea deciziei, SIAD – implică folosirea elementelor aplicative din discipline diverse

verosimilitate. Dacă diferenţa dintre valorile celor două repartiţii este mai mare decât un prag

admis, funcţia de verosimilitate se respinge.

Procesul de simulare indiferent de ce metodă utilizează are la bază, pentru a reproduce în

mod fidel anumite elemente ale sistemului simulat, de rezolvarea unor probleme numerice în

care apar numere alese întâmlător sau aleatoare.

Se afirmă că un număr este întâmplător sau aleator numai dacă se află într-un context

statistic. De aici apare necesitatea elaborării unor metode care să asigure generarea de numere

aleatoare care să respecte legea empirică a sistemului economic, necesitând un timp minim de

rulare. Se utilizează generarea unor numere aleatoare uniform repartizate. În mod normal nu se

pot genera numere aleatoare care să satisfacă cerinţele cunoscute în teoria probabilităţilor, ci sunt

numere pseudoaleatoare, care satisfac următoarele condiţii:

1. Sunt repartizate uniform într-un interval dat, iar pentru intervalul [0,1], funcţia de

repartiţie uniformă se defineşte:

0 dacă x ≤ 0

F(x)= { x dacă x є(0,1)}

1 dacă x ≥ 1

2. Sunt statistic independente, adică nu sunt autocorelate.

3. Sunt reproductibile pentru testarea programelor sau pentru a efectua comparaţii

4. Funcţia de repartiţie este stabilă, adică nu se schimbă în cursul rulării programului

de simulare.

5. Şirul generat are o perioadă de repartiţie mare care poate fi predeterminată.

De remarcat este faptul că şirurile de numere pseudoaleatoare aproximează şirurile de numere

aleatoare. Dacă condiţiile sunt riguros respectate atunci aproximaţia este cu atât mai corectă.

Validarea modelului de simulare.

Această etapă are rolul de a elucida unele aspecte cum sunt:

• Modelul reprezintă sau nu procesul studiat;

• Dacă sunt cuprinse toate etapele modelului complex;

• Cum se vor folosi rezultatele obţinute din simulare şi dacă acestea au un caracter empiric.

Modelul de simulare este considerat bun, dacă se comportă similar cu fenomenul simulat.

Dacă fenomenul este înţeles teoretic şi dacă se cunoaşte comportamentul sistemelor economice,

sociale, de afaceri, atunci se poate construi un model valid.

Validarea modelului se face prin verificarea corectitudinii interne a acestuia în sens logic

şi dacă reprezintă fenomenul de modelat. După adoptarea şi validarea modelului de simulare,

acesta se execută în concordanţă cu schema sau cu scopul experimentului. Descrierea

experimentelor de simulare are aceleaşi etape ca şi descrierea evenimentelor, prin verificarea

unor concepte ca: structura, mărimea eşantionului, cost, calitate. Sunt utilizate şi instrumente

statistice pentru analiza rezultatelor.

Mărimea rulării este direct legată de costul experimentului. Pentru a determina mărimea

optimă a rulării se folosesc regulile de oprire (determinate prin utilizarea teoriei statistice). Prin

intermediul calculatorului se pot face rulări mari întrucât timpul şi costul de rulare sunt

minimale.

Reducerea variantelor presupune că descriera simulării se poate face în aşa fel încât să se

obţină precizie maximă pentru eşantionul luat în calcul. Există tehnici pentru micşorarea

variantelor de distribuţie a măsurii performanţelorca de exemplu eşantionul stratificat unde

datele sunt divzate proporţional sau în straturi, iar fiecare strat este modelat individual (separat).

Page 33: SISTEME INFORMATICE PENTRU ASISTAREA DECIZIEI (SIAD) · Sistemele informatice pentru asistarea deciziei, SIAD – implică folosirea elementelor aplicative din discipline diverse

După obţinerea rezultatelor se fac eventuale modificări numai dacă este necesar acest lucru. În

această etapă, utilizatorii au rol important pentru a se obţine rezultate practice satisfăcătoare.

Analiza şi interpretarea rezultatelor

Etapa de analiză şi interpretare a rezultatelor constă în colectarea datelor simulate şi

prelucrarea lor, calcularea statisticilor pentru testele de semnificaţie, obţinerea de tabele, grafice

şi interpretarea rezultatelor. Se analizează valorile variabilelor de ieşire pentru diverse valori ale

varibilelor de intrare reale, analizându-se curba de evoluţie a fiecărei variabile de ieşire.

Dacă această curbă nu diferă semnificativ de cea reală atunci se poate afirma că valorile

obţinute sunt cele corecte. În interpretarea rezultatelor un loc important îl are şi analiza

caracteristicilor numerice asociate variabilelor de ieşire cum sunt media, dispersia, mediana. În

concluzie4, se poate afirma că simularea este o tehnică de realizare a experimentelor cu

calculatorul, ea implicând utilizarea unor modele matematice şi logice care descriu comportarea

unui sistem real de-a lungul unei perioade mari de timp.

Un experiment de simulare trebuie să parcurgă următarele etape:

▪ Formularea problemei este etapa în care se stabilesc ipotezele de lucru împreună cu

criteriile de acceptare sau respingere precum şi precizarea estimaţiilor obţinute prin

simulare;

▪ Culegerea şi prelucrarea preliminară a datelor reale;

▪ Formularea modelului de simulare, etapă prin care se aleg variabilele, parametrii,

relaţiile funcţionale şi algoritmul prin care se determină elementele de ieşire în funcţie de

cele de intrare;

▪ Estimarea parametrilor prin metode statistico-economice pe baza datelor reale;

▪ Evaluarea performanţelor modelului şi a parametrilor prin teste de concordanţă;

▪ Elaborarea algoritmului simulării prin schemă logică detaliată sau schemă bloc în

funcţie de complexitatea modelului;

▪ Validarea sistemului de simulare prin testarea programului pe o soluţie particulară

cunoscută sau prin compararea valorilor variabilelor de ieşire cu observaţiile situaţiei

reale simulate;

▪ Programarea experimentelor de simulare prin considerarea succesivă a valorilor

parametrilor de intrare şi a variabilelor de intrare ale modelului;

▪ Analiza datelor simulate care va consta în interpretarea rezultatelor obţinute.

Prin simulare se poate afirma că se poate determina forma funcţională de exprimare a

legăturilor dintre fenomenele supuse studiului şi estimarea valorilor parametrilor modelului,

testarea diferitelor variante de acţiune care nu se pot explicita în model, o mai bună structurare a

problemei supusă simulării precum şi validarea soluţiilor obţinute.

Avantajul simulării este dat de utilizarea sistemului cibernetic de reglare, care este baza

deciziei concrete din activitatea practică.

Page 34: SISTEME INFORMATICE PENTRU ASISTAREA DECIZIEI (SIAD) · Sistemele informatice pentru asistarea deciziei, SIAD – implică folosirea elementelor aplicative din discipline diverse

2.5.2. Simularea cu instrumente din Excel

Simularea cu ajutorul diagramelor

În Excel, diagramele pot fi utilizate pentru simulare prin exploatarea proprietăţii de

biunivocitate care există între schimbarea locaţiei punctelor pe diagramă prin tehnica „drug-and-

drop” efectuată cu mouse-ul şi modificarea valorii datelor corespunzătoare din tabelul cu date.

Tabelul de simulare

Tabelul de simulare din Excel este un instrument informatic dedicat din categoria

analizei datelor şi rezolvării problemelor complexe de asistare a deciziei economico-financiare.

Tabelul de simulare din Excel reprezintă o zonă de celule ce indică rezultate obţinute ca urmare a

substituirii unor valori din formule definite în prealabil de utilizator. Se pot obţine:

• Tabele de simulare cu o singură variabilă de intrare;

• Tabele de simulare cu două variabile de intrare.

În cazul tabelelor de simulare cu o singură variabilă de intrare, dacă se introduce un

set de valori pentru variabila de intrare, se poate astfel pune în evidenţă influenţa pe care o are

această modificare de valori într-una sau mai multe formule.

În cazul tabelelor de simulare cu două variabile de intrare, se aplică seturi de valori

pentru cele două variabile şi se pune în evidenţă efectul modificărilor asupra unei singure

formule.

Scenariul

Scenariul serveşte pentru realizarea previziunilor asupra unui proces economic prin

compararea seturilor de valori care conduc la rezultate diferite. Practic, în instrumentul

Microsoft Excel, scenariul (Scenario) reprezintă o mulţime de valori pe care acesta le poate

substitui automat într-o foaie de calcul. Cu ajutorul scenariului se obţin simulări ale mai multor

variante ale unui proiect, variante care au valori diferite ale parametrilor şi rezultate diferite.

2.6.Teoria jocurilor

La baza luării deciziilor de obicei intervin condiţiile care influenţează asupra diverselor

alternative. Condiţiile sunt legate de acţiunea omului sau pot reprezenta complexul factorilor

naturali în care se desfăşoară evenimentele.

Modelarea matematică a procesului de decizie se face cu ajutorul conceptului de joc

strategic. Jocul se poate defini ca fiind acel proces competitiv care se desfăşoară între mai mulţi

participanţi , care se numesc jucători, dintre care unul este inteligent şi prudent, adică poate

analiza situaţia creată şi poate lua decizii asupra acţiunilor ce vor urma. Ca noţiune apare partida

care este dată de un set de reguli după care jucătorii îşi desfăşoară acţiunile. Partida se

caracterizează printr-o stare denumită iniţială şi o stare finală, aceasta din urmă fiind determinată

de regulile jocului.

Strategia este definită în contextul jocului ca fiind o succesiune de acţiuni ale unui

jucător, fiecare succesiune este astfel pregătită în aşa fel încât să facă faţă strategiei adversarului

de joc, pentru atingerea scopului propus. În acest fel se atinge acea stare finală în care regulilor

Page 35: SISTEME INFORMATICE PENTRU ASISTAREA DECIZIEI (SIAD) · Sistemele informatice pentru asistarea deciziei, SIAD – implică folosirea elementelor aplicative din discipline diverse

jocului li se asociază maximum de câştig posibil de realizat. Un joc în care intervin doar doi

parteneri se poate reprezenta matriceal astfel:

J/N N1 N2 ........ Nn

J1 c11 c12 .... c1n

J2 c21 c22 ...... c2n

.............. .... .... .... ....

Jm cm1 cm2 .... cmn

unde s-a notat cu:

J– jucătorul;

N – adversarul din cadrul jocului;

Ji = {J1,J2,…..,Jm}este mulţimea strategiilor lui J;

Nj = {N1,N2 ,…,Nn}mulţimea strategiilor lui N;

Ci,j{i=1,m; j=1,n}este consecinţa adoptării strategiei Ji de către J şi a strategiei Nj de către

N;

Când se pune problema alegerii uneia sau alteia dintre strategii, în procesul de adoptare a

deciziei, se iau în considerare utilităţile fiecărei consecinţe.

Jocurile sunt cu punct şa şi fără punct şa. Jocurile cu punct şa presupun că cei doi jucători

se supun unui raţionament corect care conduce la alegerea strategiei optime (fiecare dintre

jucători îşi va alege propria strategie optimă). Astfel cele două strategii optime alese de fiecare

jucător va constitui soluţia jocului.

Cazul general al problemei generate de jocul cu punct şa are ca principiu de bază principiul

maxim. Fie un joc de ordinul m*n are asociată următoarea matrice:

mnm

n

aa

aa

...

.........

....

1

111

Principiul maximului presupune că primul jucător alege acea strategie care are câştigul

minim.

V1= max(min aij); 1≤ i ≤m, 1≤ j ≤n

i j

Pentru determinarea valorii V1 se vor determina toate valorile minime pe linii (minj ai,j), iar

dintre acestea se va lua valoarea maximă (maxi ai,j). Jucătorul doi va proceda în mod similar:

V2= min (max aij); 1≤ i ≤m, 1≤ j ≤n

j i

Valoarea V2 precum şi strategia care îi corespunde se vor afla prin alegerea tuturor

maximelor pe coloană (maxi aij) şi luând pe cel mai mic dintre ele (minj maxi).

V=V1=V2=maxi(minj aij)=min j(max i aij); V1= max(min ai,j); 1≤ i ≤m, 1≤ j ≤n

Page 36: SISTEME INFORMATICE PENTRU ASISTAREA DECIZIEI (SIAD) · Sistemele informatice pentru asistarea deciziei, SIAD – implică folosirea elementelor aplicative din discipline diverse

Jocurile fără punct şa au ca fundament un raţionament, care oricât de riguros ar fi, nu îl

va conduce pe jucător la alegerea unei perechi de strategii, aşa cum se întâmplă în cazul jocurilor

cu punct şa. Soluţia unei astfel de probleme este dată de determinarea strategiilor mixte optime

ale celor doi parteneri, prin metode algebrice, geometrice sau iterative. Jocurile cu doi parteneri

se modelează în situaţii conflictuale între două sau mai multe părţi care se reduc tot la jocuri cu

doi participanţi, prin formarea de coaliţii. Fiecare dintre părţi urmăreşte alegerea unei strategii

care să asigure un rezultat avantajos în detrimentul adversarului sau adversarilor.

Modele asemănătoare sunt utilizate în probleme de decizie în care este doar un singur

participant care trebuie să aleagă strategia optimă, care în acest caz se numesc stări ale naturii.

Astfel se poate afirma că natura nu acţionează ca un adversar inteligent care urmăreşte un

beneficiu cât mai mare din partea adversarului şi în consecinţă nu se pot stabili reguli de

comportare a ei. Se pot însă culege informaţii statistice şi se pot face previziuni probabilistice.

Deciziile în cazul jocurilor contra naturii se clasifică în:

• decizii în condiţii de certitudine, adică există informaţii certe despre evoluţia

viitoare;

• decizii în condiţiide risc, în care se cunosc doar probabilităţile de realizare a

stărilor naturii;

• decizii în condiţii de incertitudine, nu există informaţii privind probabilităţile de

realizare a stărilor naturii.

Referitor la deciziile în condiţii de risc se poate afirma că în procesul managerial,

decidenţii sunt puşi în faţa unor situaţii deosebite deoarece trebuie să aleagă dintr-o multitudine

de strategii.

Elementele unui model de decizie sunt:

• decidentul;

• stabilirea şi formularea problemei;

• totalitatea variantelor sau alternativelor posibile care definesc o situaţie

decizională;

• mulţimea tuturor consecinţelor anticipate pentru fiecare variantă;

• totalitatea criteriilor de decizie ale decidentului;

• obiectivele propuse de decident;

• stările naturii, factori independenţi de decidenţi şi care sunt de tip conjunctural.

Din multitudinea de variante posibile, decidentul urmează să aleagă drept soluţie

convenabilă, doar una. În acest proces apare necesitatea de a se compara variantele decizionale

între ele prin efectul consecinţelor şi astfel apare conceptul de utilitate. Utilitatea este de fapt

unitatea comună de măsură a consecinţelor multitudinii de alternative decizionale.

Teooria jocurilor este utilizată pentru simularea diverselor procese economice.

Jocurile de întreprindere (Business Games) facilitează simularea dinamică a unor

decizii secvenţiale. Utilizarea jocurilor de întreprindere are ca scop formarea deprinderilor de a

rezolva diverse situaţii limită la factorii de conducere, precum şi dezvoltarea de aptitudini de

abordare complexă şi sistemică a procesului simulat. Cu ajutorul unor astfel de jocuri, specialiştii

pot testa ipoteze referitoare la natura deciziilor pe care urmează să le adopte cu identificarea

efectelor probabile ale diverselor decizii. De aceea se poate afirma că jocul oferă posibilitatea

acumulării de experienţă în problemă, înainte ca procesul economic să se fi petrecut şi permite

anticiparea acelor consecinţe referitoare la resurse.

Jocurile se pot clasifica după anumite criterii şi anume:

• după sfera de acţiune sunt:

Page 37: SISTEME INFORMATICE PENTRU ASISTAREA DECIZIEI (SIAD) · Sistemele informatice pentru asistarea deciziei, SIAD – implică folosirea elementelor aplicative din discipline diverse

a. jocuri pentru întreaga întreprindere prin care se simulează funcţiile principale ale

întreprinderii în aşa fel încât participanţii la joc să înţeleagă legităţile unităţii economice în

ansamblu, în condiţiile influenţei reciproce dintre subsistemele interne sau dintre acestea şi un

sistem exterior.

b. jocul funcţional, se referă doar la o funcţie specifică a întreprinderii analizate, participanţii la

joc exprimâmnd decizii în cadrul compartimentului care îndeplineşte funcţia simulată şi pot

estima eventuale consecinţe pentru alte compartimente cu care acesta acţionează în legătură

strânsă.

c. jocuri complexe. Acestea au ca scop analiza mai multor funcţii ale întreprinderii şi relaţiile

principale cu alte compartimente sau cu exteriorul. În acest tip de joc, particupanţii trebuie să

estimeze implicaţiile unei decizii adoptate într-un compartiment asupra altor compartimente ale

aceleiaşi întreprinderi. Se evaluează în acest caz efectele unor perturbaţii asupra

compartimentului luat în studiu chiar dacă aceste perturbaţii au apărut în compartimente din

afară dar legate de cel studiat.

d. jocuri pentru alte zone de specialitate.

• După elementul competiv, jocurile sunt:

a. jocuri concurenţiale în care fiecare participant adoptă decizii în aşa fel încât să-şi depăşească

adversarul. Acestea pot fi jocuri independente şi jocuri interdependente.

- jocurile interdependente au drept caracteristică faptul că succesul unui participant este

dependent de propriile decizii cât şi de deciziile concurenţiale.

- jocurile independente se caracterizează prin aceea că fiecare jucător realizează îmbunătăţirea

propriilor performanţe economice, fără a acţiona asupra celorlalţi jucători. În cadrul coaliţiilor de

jucători se consideră că un joc este independent, atunci când jucătorii din coaliţie se ajută

reciproc.

b. jocurile cooperative presupun existenţa a doi parteneri care convin că în privinţa anumitor

clase de decizii şi acţiuni, acestea să nu fie îndreptate împotriva intereselor celuilalt partener. În

economia de piaţă pentru anumite tipuri de produse, aceştia îşi împart piaţa.

c. jocurile contra naturii au nevoie de un decident real sau o coaliţie de decidenţi care se

coalizează împotriva unui prtener fictiv, care este de fapt mediul ambiant.

• După criteriul prelucrarea rezultatelor, jocurile sunt pe calculator sau manuale.

• După scopul urmărit sunt jocurii de instruire, jocuri de întreprindere sau pentru

fundamentarea deciziilor operative.

Jocurile de instruire permit celor care participă la ele să poată să adopte decizii optime în

condiţiile unor situaţii ipotetice, dar posibile în practica economică.

Jocuri de întreprindere sau pentru fundamentarea deciziilor operative permit

specialiştilor să adopte decizii pertinente în condiţiile reale existente în întreprinderele pe care le

conduc sau le organizează. Astfel de jocuri necesită utilizarea calculatorului electronic, întrucât

deciziile se adoptă pe baza unui algoritm complex, care analizează efectele economice ale mai

multor soluţii. În acest caz decidentul poate cunoaşte consecinţele asupra performanţelor

economice atât ale soluţiilor optime cât şi ale soluţiilor ineficiente.

Principalele etape de desfăşurare a unui joc de întreprindere sunt următoarele:

• Etapa de instruire a participanţilor;

• Adoptare deciziilor de către participanţi. În această etapă există un arbitru care

adoptă deciziile considerate cele mai bune pentru participanţi. Arbitrul nu pune la dispoziţia

jucătorilor nici un algoritm pentru ca aceştia să găsească soluţia cea mai bună. Astfel, jucătorii

trebuie să adopte decizia fie pe baza competenţei, fie pe baza unui algoritm euristic elaborat în

Page 38: SISTEME INFORMATICE PENTRU ASISTAREA DECIZIEI (SIAD) · Sistemele informatice pentru asistarea deciziei, SIAD – implică folosirea elementelor aplicative din discipline diverse

timpul participării la joc, sau alegând la întâmplare valori numerice ale parametrilor economici.

Se poate modifica algoritmul ales la următoarea iteraţie. Dacă jucătorul adoptă decizii la

întâmplare, el le poate perfecţiona pe parcursul jocului, ajungând fie la un algoritm, fie la o

procedură de căutare aleatoare, dar accelerată. Fiecare etapă de adoptare a deciziilor constituie o

iteraţie a jocului, care corespunde unei perioade de timp de obicei următoare. N, numărul maxim

de iteraţii pentru un joc este stabilit în prima etapă de arbitru. În timpul jocului , consilierii de

joc, precizează arbitrului perturbaţiile care au avut loc în timpul în care jucătorii au adoptat

decizii.

• Arbitrul efectuează calculele prin evaluare consecinţelor apărute după primirea de la

participanţi a deciziilor adoptate şi a perturbaţiilor de la consilieri, de obicei cu ajutorul unui

program pe calculator.

• Arbitrul publică o informare asupra rezultatelor obţinute, în urma cărora jucătorii fac

la rândul lor o analiză rezultatelor. Se remarcă faptul că în situaţia în care numărul de iteraţii nu

este suficient de mare, există riscul ca unii jucători să obţină rezultate bune din pură întâmplare.

După dezbaterea rezultatelor care s-au obţinut şi după analiza regulilor aplicate, arbitrul crează

condiţii jucătorilor pentru pregătire accelerată în adoptarea deciziilor.

• Efectuarea unui test de continuare sau de încetare a jocului de către arbitru. Testul

constă în compararea iteraţiei I la care se află jocul cu numărul maxim N de iteraţii. Dacă I < N,

atunci jocul trece la iteraţia următoatre I+1, iar dacă I=N, atunci se trece la etapa următoare.

• Se anunţă sfârşitul jocului şi a rezultatelor finale. Arbitrul decide încetarea jocului,

iar după parcurgerea celor N iteraţii se evaluează rezultatele jocului. Pentru aceasta arbitrul

calculează funcţii de performanţă care permit acordarea unui calificativ global fiecărui

participant la joc. În acest fel se face ordonarea participanţilor la joc din punct de vedere al

aptitudinilor de conducători şi organizatori.

Un model de simulare poate descrie doar caracteristicile şi comportamentul sistemului în

diferitele etape ale funcţionării sale. Din variantele obţinute se va alege cea mai bună alternativă,

adică aceea care prin experimentele aplicate efectului combinat al mai multor acţiuni sau factori

se apropie cel mai mult de evoluţia sistemului studiat.

Simularea înlocuieşte în bună măsură metodele de optimizare pentru rezolvarea

problemelor complexe. Simularea prezintă avantaje deoarece modelul este obţinut de obicei din

perspectiva decidentului; este unica metodă din cadrul SIAD care se poate utiliza pentru

problemele nestructurate, surprinde complexitatea reală a problemei şi se poate aplica unor mari

diversităţi de probleme manageriale.

Pentru simulare există un soft relativ uşor de utilizat, soft care implementează metoda

Monte Carlo (ca de exemplu, Excel). Acest proces de simulare prezintă şi dezavantaje precum

lipsa de garantare a obţinerii soluţiei optime ci a unei soluţii îmbunătăţite; modelul de simulare

este aplicat doar pentru o singură problemă, neputând fi generalizat.

Page 39: SISTEME INFORMATICE PENTRU ASISTAREA DECIZIEI (SIAD) · Sistemele informatice pentru asistarea deciziei, SIAD – implică folosirea elementelor aplicative din discipline diverse

2.7. Modelele predictive

Modelele predictive au ca scop anticiparea evoluţiei viitoare a sistemului considerat în

funcţie de evoluţiile sale anterioare. Acest tip de modele se rezolvă de obicei prin metode

statistice şi evoluţiile acestora.

Legătura dintre variabile este denumită corelaţie, iar stabilirea tipului de legătură dintre

variabilele dependente de una sau mai multe variabile independente, în statistică, se numeşte

analiză de regresie.

Se cunoaşte că dependenţa dintre variabile poate fi liniară, exponenţială sau pătratică, iar

pentru fiecare tip de dependenţă există instrumente puse la dispoziţie de statistică pentru a

determina elementele modelului de regresie aferent.

Pentru a alcătui un model de regresie se va ţine cont de următoarele etape: analiza pentru

identificarea dependenţelor şi a tipurilor de legături pe care le exprimă; specificarea prin care se

caută cea mai optimă formă de exprimare a variabilelor; estimarea parametrilor modelului;

testarea semnificaţiei parametrilor estimaţi; validarea (verificarea) modelului; utilizarea

modelului în operaţii de simulare şi predicţie.

Pentru regresia liniară simplă există o singură variabilă pentru care se face previziunea,

dependentă de o singură altă variabilă. Modelul este Y=f(x) şi se observă că relaţia dintre cele

două variabile este liniară.

Pentru previzionarea variabilei Y se pot folosi una din următoarele metode: metoda

glisajului exponenţial ce presupune previziunea evoluţiilor viitoare pe baza celor trecute şi a

estimărilor din trecut; metoda filtrajului adaptiv ce face o previziune pentru valorile variabilei

dependente în funcţie de sumele ponderate a valorilor anterioare; metoda regresiei liniare simple

prin care se obţine un model cauzal care pune în evidenţă dependenţa variabilei dependente de

variabila independentă.

Acest model este sintetizat în următoarea manieră: Y=mX+b+V unde m şi b sunt

parametrii de regresie ce se vor determina prin metode statistice, iar V este factorul de

cuantificare al influenţelor cauzelor nespecifice şi se mai numeşte variabilă de perturbaţie.

Valoarea medie a lui V trebuie să fie 0, aceasta însemnând că influenţa factorilor perturbatori se

compensează reciproc.

Având în vedere valorile variabilei independente X şi a parametrilor de regresie, se vor

putea estima valorile viitoare ale variabilelor dependente Z; metoda regresiei liniare multiple

care presupune existenţa dependenţei de mai multe variabile. Această metodă este mai apropiată

sistemelor decizionale, întrucât de cele mai multe ori variabila depinde de efectul mai multor

factori consideraţi laolaltă. Acest model are următoarea formă:

nnjj XmXmbY +++= ...

Pentru a stabili care este semnificaţia influenţelor variabilelor independente asupra lui Y

(variabilă dependentă) se fac o serie de teste statistice, cum ar fi calculul coeficientului de

determinaţii R2, testarea determinaţiei globale a ecuaţiei de regresie (testul F), testarea

determinaţiei fiecărei variabile (testul t) care la un loc se prezintă ca o analiză dispersională.

Astfel, în concluzie, se poate afirma că rezultatele obţinute se vor accepta numai în cazul în care

Page 40: SISTEME INFORMATICE PENTRU ASISTAREA DECIZIEI (SIAD) · Sistemele informatice pentru asistarea deciziei, SIAD – implică folosirea elementelor aplicative din discipline diverse

legătura liniară presupusă între variabilele dependente şi celelalte variabile este reală. Softul

aferent unei astfel de metode este des utilizat precum SPSS.

Acesta este un sistem automat de analiză a datelor de marketing (Statistical Package for

Social Sciences). De asemenea, procesorul de tabele Excel conţine funcţii statistice care permit

efectuarea previziunilor bazate pe tipuri de regresie şi se poate astfel realiza şi analiza statistică a

datelor.

Pentru a lucra cu metode de previziune este bine de ştiut că trebuie parcurse o serie de

etape: formularea şi înţelegerea conţinutului problemei ce presupune ca managerul sau

decidentul să definească în termeni cât mai apropiaţi de realitate problema, aceasta incluzând

variabilele care trebuie explicitate şi a căror valori vor face obiectul previziunii.

În această etapă se descrie situaţia decizională, se identifică variabila sau variabilele care

vor constitui obiectul predicţiei ca şi variabilele dependente de acestea; selectarea indicatorilor

economici care presupune a se găsi alături de variabilele independente şi acei factori suplimentari

care influenţează variabila dependentă, factori ce vor trebui incluşi în ecuaţia de regresie; analiza

matricei de corelaţie simplă care se face pentru a alege variabilele care trebuie incluse în ecuaţia

de regresie.

Specific domeniului economic este fenomenul de multicoliniaritate adică nivelul înalt de

interdependenţă între variabile diverse. La încheierea acestei etape se vor reţine doar trei sau

patru ecuaţii de regresie care vor fi ulterior analizate; alegerea unei ecuaţii de regresie dintre

cele reţinute anterior.

De obicei calculatorul va determina coeficienţii de regresie şi elementele care permit

testarea semnificaţiei acestora. Se vor reţine ecuaţiile semnificative şi se va încerca ridicarea

progresivă a valorii coeficientului de corelaţie R2 prin introducerea unor noi variabile

independente.

După fiecare iteraţie de mărire progresivă a acestui coeficient se vor verifica testele de

semnificaţie. verificarea corectitudinii condiţiilor de regresie; pregătirea previziunii care

presupune stabilirea unui interval de încredere pentru previziunile individuale şi ce precizie are

fiecare variabilă independentă.

Predicţia are un caracter limitat faţă de previziune (prognoză) care înseamnă depăşirea

cadrului statistic permis de modelele de regresie.

Dezavantajul principal al acestor metode statistice îl constituie volumul mare de date

necesar şi costul ridicat al colectării acestora. Acest dezavantaj este remediat de apariţia noilor

tehnologii de analiză şi agregare a datelor (OLAP).

2.8. Programarea euristică

Această metodă conduce la generarea unei soluţii aproximate pentru probleme complexe

de obicei nestructurate. Pentru astfel de probleme nu se poate descrie un algoritm care nu poate

oferi soluţii optime într-un număr finit de paşi.

Page 41: SISTEME INFORMATICE PENTRU ASISTAREA DECIZIEI (SIAD) · Sistemele informatice pentru asistarea deciziei, SIAD – implică folosirea elementelor aplicative din discipline diverse

Programarea euristică se poate utiliza şi pentru probleme complexe structurale întrucât

poate conduce la opţiunea mai rapidă a soluţiilor faţă de un algoritm de optimizare (de exemplu

sunt problemele combinatoriale cu extrem de multe soluţii posibile).

De remarcat este faptul că procesul decizional se caracterizează printr-o formalizare a

spaţiului stărilor şi presupune o explorare atentă şi pertinentă a acestuia. În cazul acestei

programări euristice, spaţiul de rezolvare a problemelor implică: spaţiul stărilor, spaţiul

operatorilor, starea iniţială, starea sau stările finale precum şi informaţia asociată fiecărei stări.

Soluţia finală obţinută prin programarea eurstică poate fi un eşec sau un succes.

În utilizarea programării euristice se are în vedere evaluarea rezultatelor care va ţine cont

de calea raţionamentului, de paşii de parcurs ulterior precum şi de experienţa acumulată în

probleme similare şi nu în ultimul rând şi de model.

Evaluarea rezultatelor se realizează cu ajutorul funcţiei de evaluare care depinde de stare

şi de informaţiile referitoare la acea stare. Starea va fi acceptată dacă funcţia de evaluare va

depăşi un anumit prag prestabilit sau dacă este mai bună decât valorile stărilor în aşteptare.

Euristicile se pot grupa în: cantitative dacă sunt în baza de modele a unui sistem

informatic de asistare a deciziei; calitative dacă furnizează cunoştinţe pentru un sistem expert.

Programarea euristică se aplică în cazul în care datele de care se dispune pentru o

problemă complexă sunt insuficiente sau are un grad mare de inexactitate.

Gradul de complexitate al problemei nu permite utilizarea modelelor de optimizare, nu

există soluţie algoritmică iar modelul de simulare simplifică inadmisibil de mult problema şi

trebuie obţinută o soluţie rapidă.

Acest tip de programare are o serie de avantaje dintre care se enumeră: sunt metode uşor

de aplicat şi implementat, produc mai multe soluţii acceptabile, se poate face o măsurare

empirică sau teoretică a calităţii soluţiei obţinute.

Totuşi prezintă şi dezavantaje referitoare la garanţia obţinerii unei soluţii optime, iar în

cazul în care se fac alegeri secvenţiale într-o decizie, există riscul de a nu anticipa corect

consecinţele alegerilor făcute. Toate aceste riscuri sunt de fapt asumate de decident în momentul

în care a ales ca rezolvare programare euristică.

2.9. Metoda utilităţii globale maxime

Problemele de asistare a deciziei din realitatea socio-economică sunt probleme

multicriteriale. Reducerea rezolvării unei probleme de asistare a deciziei la un singur criteriu se

face, de cele mai multe ori, cu scop simplificator, de lămurire a unor aspecte unilaterale. În

universul socio-economic de modelat, problemele de asistare a deciziei economice sunt generate

de procesele de decizie multicriteriale. Pentru măsurarea consecinţelor diferitelor alternative

luate în considerare în momentul luării deciziei, s-a introdus o unitate de măsură comună

denumită utilitate. Prin intermediul funcţiei de utilitate, se asociază fiecărei alternative de decizie

o valoare numerică reală.

Page 42: SISTEME INFORMATICE PENTRU ASISTAREA DECIZIEI (SIAD) · Sistemele informatice pentru asistarea deciziei, SIAD – implică folosirea elementelor aplicative din discipline diverse

Este evident că o calitate ridicată a deciziei economice, fundamentată pe baza acestei

metode, se va realiza dacă utilităţile asociate vor fi cât mai obiective cu putinţă (aici intervine

rolul important al experţilor domeniului).

Problemele de optimizare multicriterială scot în evidenţă relaţii de tip local-global, în

sensul că după rezolvarea separată a fiecărei probleme unicriteriale (cu un singur criteriu), se

rezolvă problema multicriterială prin luarea în consideraţie a întregului ansamblu de criterii.

Soluţiile obţinute la rezolvarea problemelor decizionale multicriteriale sunt soluţii

suboptimale în raport cu variantele monocriteriale. De cele mai multe ori, în practica economică,

aceste soluţii suboptimale se dovedesc satisfăcătoare.

În optimizarea multicriterială, există două categorii de probleme: optimizare multiatribut

şi optimizare multiobiectiv.

O problemă de optimizare multiatribut prezintă o mulţime finită a soluţiilor posibile, cu

variante ce au asociate atribute multiple (de natură numerică sau nenumerică).

O problemă de optimizare multiobiectiv prezintă o mulţime infinită a soluţiilor admisibile

şi foloseşte funcţia-obiectiv drept criteriu de optimizare (care se maximizează sau minimizează).

Utilitatea globală a unui proiect se defineşte ca suma produselor între elementele

matricei utilităţilor (reprezentate de coloana corespunzătoare proiectului) şi coeficienţii de

utilitate consideraţi pentru fiecare indicator. Proiectul care se selectează este asociat cu utilitatea

globală maximă. În metoda utilităţii globale maxime, se construieşte, mai întâi, matricea

utilităţilor cu elementele (aij), U=(aij), i≤n, j≤m. În cazul rezolvării problemei cu criteriul de

maxim, se foloseşte relaţia:

,minmax

min

ii

iiij

aa

aaa

−=

unde semnificaţia notaţiilor este următoarea:

ai=valoarea indicatorului i asociată proiectului j; ai max=valoarea maximă a indicatorului i;

ai min=valoarea minimă a indicatorului i.

În cazul rezolvării problemei cu criteriul de minim, relaţia similară este:

.minmax

max

ii

ii

ijaa

aaa

−=

2.10. Sistemul de gestiune a modelelor

Sistemul de gestiune a modelelor (SGM) are de fapt facilităţi asemănătoare cu cele ale

unui sistem de gestiune a bazelor de date (SGBD).

Facilităţile oferite de un SGM se pot grupa în câteva categorii: stocarea modelelor;

utilizarea modelelor deja existente; facilităţi de acces şi de regăsire a modelelor; facilităţi de

mentabilitate a modelelor existente cu posibilităţi de păstrare a soluţiilor; construirea unor

modele noi pe baza celor existente; flexibilitate, care constă în trecerea rapidă de la o abordare la

alta; consistenţa care dă posibilitatea ca acelaşi model şi aceleaşi date să fie accesate de mai

mulţi utilizatori.

Aceste facilităţi definesc şi o serie de cerinţe pentru gestionarul de modele cum ar fi:

asigurarea comunicării şi schimbul de date dintre modele în momentul în care sunt utilizate într-

un anume context, asigurarea analizei şi interpretării rezultatelor obţinute în urma utilizării unui

model standard.

Page 43: SISTEME INFORMATICE PENTRU ASISTAREA DECIZIEI (SIAD) · Sistemele informatice pentru asistarea deciziei, SIAD – implică folosirea elementelor aplicative din discipline diverse

Din punct de vedere al limbajelor de modelare, care asistă utilizatorul în gestionarea

modelelor, acestea sunt destinate pentru programare matematică: Lingo, GAMS, AMPL.

În procesul de modelare este utilizat şi procesoarul de tabele, Excel. Excel are încorporate

pachete de programe pentru structurarea şi rezolvarea unor tipuri de modele pentru domeniul

economic, matematic. Procesorul de tabele are încorporate o serie de categorii de funcţii

(matematice, statistice, financiare, de previziune) care pot rezolva probleme de optimizare

(programare liniară) de simulare sau de căutare euristică a unor soluţii. El poate oferi la un nivel

scăzut şi gestionarea unei baze de date sau importul de date.

3. SIAD-URI BAZATE PE ANALIZA ŞI SINTEZA DATELOR

3.1. Problematica generală

Modul în care datele sunt retransformate în informaţii şi apoi în cunoştinţe este de fapt un

proces de valorificare a datelor care se realizează prin sintetizarea şi analiza lor şi, în final, prin

interpretare. Procesul de sintetizare a datelor presupune centralizarea lor, având în vedere

diverse criterii şi este utilizat în crearea situaţiilor de sinteză necesare informării managerilor ca

suport pentru luarea deciziilor. Soluţiile oferite de informatică pentru procesul de sintetizare a

datelor sunt: programe specifice şi dedicate; interogări care dau posibilitatea grupării datelor

după criterii stabilite şi oferă funcţii pentru domeniile astfel create; funcţiile de total şi subtotal

oferite de generatoarele de rapoarte care permit indicarea ierarhiilor criteriilor de grupare.

În ultimul timp, problema centralizării datelor a rămas aceeaşi, însă volumul de date de

explorat este imens, ceea ce duce la faptul ca metodele clasice să devină ineficiente. De aceea

câştigă tot mai mult teren tehnologii moderne ca Data Warehousing (depozitarea datelor) şi

OLAP (On-Line Analytical Processing) pe măsură ce suporturile soft devin suport de date pentru

sistemele tranzacţionale.

Depozitele de date (Data Warehouse) ajută la:

- îmbunătăţirea valorii performanţelor organizaţiei economice cu management centrat pe

client, printr-o mai bună înţelegere a nevoilor clientului;

- analiza percepţiilor clienţilor asupra valorii produselor şi serviciilor care sunt oferite sau

care ar putea fi oferite în viitor;

- integrarea marketingului cu tehnologiile informaţiei şi ale comunicaţiilor (IT&C), cu

sursele de date operaţionale, obţinându-se depozitul de date de tip întreprindere, EDW

(Enterprise Data Warehouse);

- contribuie la creşterea valorii strategice a organizaţiei economice.

Într-un cadru mai larg, se aplică noul concept de cercetare (inteligentă) a afacerilor, BI

(Business Intellgence) ce devine o componentă critică a ansamblului de operaţiuni zilnice ale

organizaţiei economice, astfel încât se dezvoltă depozite de date în timp real ce asigură

utlizatorilor finali actualizări rapide şi emiterea unor semnale de alarmă (alerte) generate din

cadrul sistemelor tranzacţionale (TPS). Depozitele de date în timp real, RTDW (Real-Time Data

Warehouse), şi BI sprijină îndeplinirea planului de afaceri al organizaţiei economice. Aplicaţiile

RTDW ale organizaţiei economice cuprind:

Page 44: SISTEME INFORMATICE PENTRU ASISTAREA DECIZIEI (SIAD) · Sistemele informatice pentru asistarea deciziei, SIAD – implică folosirea elementelor aplicative din discipline diverse

- managementul şi contabilitatea veniturilor şi cheltuielilor;

- managementul relaţiilor cu clienţii, CRM (Customer Relationship Management);

- operaţiuni şi bilanţuri la nivel de echipă;

- managementul securităţii informatice;

- managementul activităţilor specifice îndeplinirii obiectivelor organizaţiei economice.

Pentru administrarea eficientă a afacerilor sunt necesare RTDW, SIAD (DSS) şi

instrumente BI.

OLAP reprezintă o categorie de tehnologie software care permite analiştilor, managerilor

şi persoanelor de execuţie din organizaţia economică să beneficieze de un acces rapid, consistent

şi interactiv la depozitul de date; acest lucru se obţine printr-o varietate de vizualizări posibile

ale informaţiilor ce au fost transformate din datele operaţionale şi reflectă dimensionalitatea reală

a organizaţiei din punctul de vedere al utilizatorului. Ca urmare, prin tehnologiile de centralizare

se transformă datele în informaţii de sinteză şi se asigură analiza lor. Analiza datelor presupune a

găsi relaţii între datele sintetizate cum ar fi: asocieri, corelaţii structurale, cauzale sau

funcţionale. Funcţionalitatea OLAP este caracterizată de o analiză dinamică multidimensională

dinamică a datelor consolidate ale organizaţiei economice ce sprijină activităţile analitice şi de

căutare şi regăsire a informaţiilor (prin navigare sau browsing) desfăşurate de utlizatorul final:

• calcule şi modele aplicate dimensiunilor transversale prin intermediul ierarhiilor sau

membrilor;

• analize asupra tendinţelor din perioade de timp secvenţiale;

• submulţimi obţinute prin secţionare (slicing) pentru vizualizările prezentate pe ecranul

monitorului calculatorului;

• efectuarea unor operaţiuni de drill-down pentru adâncirea nivelurilor de consolidare a

datelor;

• efectuarea operaţiunii de rotaţie (rotation) pentru obţinerea unor noi comparaţii

dimensionale în zona de vizualizare a datelor.

O formă simplă de analiză a datelor este compararea datelor cu date similare, comparare

care se face păstrând toate criteriile identice, doar unul singur având valori diferite. Comparare se

face între seturi de date comparabile, iar tehnologiile de comparaţie sunt dotate cu tehnici de

observare pentru semnalizarea tiparelor, corelaţiilor, asocierilor prin similitudini sau sesizează

abateri, excepţii. Informatica a venit în întâmpinarea acestor cerinţe cu tehnicile de prezentare

grafică care transformă informaţia cantitativă în informaţie calitativă. Au apărut şi tehnici de

observare analitică a datelor care au la bază teorii matematice prin care datele reale sunt

comparate cu date teoretice produse de un model ipotetic.

Dezvoltarea tehnicilor de observare a dus la apariţia tehnicilor de observare automată

bazate pe data-driven. Rezultatul unor astfel de tehnici se regăsesc într-un model cu caracter

general. Tehnicile de observare analitică a datelor se regăsesc într-o tehnologie modernă

denumită Data Mining (în traducere liberă “Mineritul datelor”).

Rezultatul procesului de observare analitică este obţinerea unor tipare, corelaţii şi uneori

modele din care se pot deduce tendinţe sau se poate previziona cu o anumită probabilitate cum

vor arăta datele pe o perioadă ulterioară. Modelul permite interpretarea datelor, ce reprezintă un

proces cognitiv cu o apreciere generală a situaţiei, şi identifică probleme, oportunităţi sau

potenţiale cauze de eşec.

Page 45: SISTEME INFORMATICE PENTRU ASISTAREA DECIZIEI (SIAD) · Sistemele informatice pentru asistarea deciziei, SIAD – implică folosirea elementelor aplicative din discipline diverse

De remarcat este faptul că interpretarea datelor duce la apariţia de cunoştinţe noi care se

vor cumula la cele deja existente. Instrumentele soft clasice pentru asistarea deciziei au avut ca

principal scop asigurarea tehnicilor de analiză, optimizare şi simulare precum şi reprezentarea

grafică a rezultatelor. Dintre aceste instrumente se amintesc procesoarele de tabele Lotus şi Excel

orientate pe volume mici de date, cele referitoare la sistemele de gestiune a bazelor de date

Access, Visual Foxpro, capabile să lucreze cu volume mari de date cu structură uniformă.

Principalul dezavantaj al acestor instrumente clasice este că operează numai asupra acelor date

care au o structură prestabilită şi provin dintr-o sursă unică. Noile sisteme de asistare a deciziei

folosesc tehnici speciale de comasare a datelor stocate în structuri neuniforme, pentru a utiliza

informaţii implicite care nu sunt specificate în datele existente. Suporturile software de asistare a

deciziei oferă utilizatorilor o serie de facilităţi cum ar fi: interogarea în limbaj natural, accesul la

modele conceptuale, sisteme de gestiune OLAP şi servicii de integrare cu alte suporturi soft.

3.2. Depozite de date (Data Warehouse)

3.2.1. Definirea conceptului de depozit de date. Caracteristicile depozitelor de date

Depozitul de date (Data Warehouse) este un ansamblu de date special produse pentru a

sprijini luarea deciziei manageriale. Depozitul de date conţine date istorice şi curente de interes

potenţial pentru manageri în cadrul organizaţiei economice. În mod obişnuit, datele sunt

structurate pentru a putea fi oricând disponibile pentru activităţi de prelucrare analitică online

(OLAP), Data Mining, interogări, rapoarte, alte aplicaţii pentru asistarea luării deciziei8.

Trebuie precizat că noţiunea de depozit de date (Data Warehouse) se referă la rezultatul

final – date memorate pe suport informaţional, date ce prezintă caracteristici distincte faţă de

bazele de date tranzacţionale, în timp ce noţiunea de depozitarea datelor (Data Warehousing)

priveşte întregul proces de creare, menţinere şi exploatare a unui depozit de date.

Depozitele de date (Data Warehouse) reprezintă din perspectiva metodologică, pur didactică,

o ramură a informaticii aplicate în domeniul sistemelor informatice pentru asistarea deciziei,

SIAD sau DSS, prin intermediul căreia se asigură:

1) administrarea complexă a afacerilor;

2) accesarea din exterior, oportună şi eficace, a informaţiilor şi cunoştinţelor necesare

afacerilor (business information and business knowledge).

Procesul de depozitare a datelor (Data Warehousing) conţine următoarele componente majore

(fig.3.1):

1) Sursele de date;

2) Extragerea, transformarea şi încărcarea datelor din bazele de date operaţionale, ETL

(Extraction, Transformation and Load);

3) Depozitul de date de tip întreprindere, EDW (Enterprise Data Warehouse);

8 Turban E., Aronson, J.E., Liang, T.P., Sharda, R. - Decision Support and Business Intelligence Systems, Pearson

Prentice Hall, New Jersey, 2007.

Page 46: SISTEME INFORMATICE PENTRU ASISTAREA DECIZIEI (SIAD) · Sistemele informatice pentru asistarea deciziei, SIAD – implică folosirea elementelor aplicative din discipline diverse

4) Metadatele (programe soft pentru date şi reguli pentru organizarea rezumatelor de date.

Sunt uşor de indexat şi regăsit, inclusiv prin instrumente Web);

5) Instrumente de tip middleware, ce asigură accesul la depozitul de date (OLAP, Data

Mining, instrumente soft de întocmire a rapoartelor şi de vizualizare a datelor).

Necesitatea depozitelor de date este dată de volumul imens de date acumulat în timp de

organizaţiile economice. Integrarea acestor date istorice ale organizaţiei într-o structură care să

stea la baza luării deciziilor a devenit principala preocupare a noilor tehnologii informatice.

Depozitele de date integrează diferitele tipuri de baze de date din organizaţie, asigurând date

oportune şi relevante (în timp real sau aproape de răspuns în timp real) pentru sistemele

informatice pentru asistarea deciziei manageriale, SIAD. Implementarea depozitelor de date

conferă valoare strategică organizaţiei economice. De asemenea, depozitele de date contribuie la

reducerea costurilor. De exemplu, în primul an de operare a depozitelor de date, această reducere

a costurilor este similară cu investiţiile în sistem pe timp de şase ani9.

Fig.3.1. Conceptul de depozit de date (Data Warehouse)

9 Turban E., op.cit.

EDW

Rafturi

de date

SURSE DE DATE

(OLTP, externe, moştenite

de la sistemele informatice vechi)

Interfeţe de

aplicaţii

middleware

APLICAŢII:

OLAP

Web

Data Mining

Instrumente de

interogare

relaţionale

Instrumente de

raportare

ETL

Vizualizare

rezultate

Page 47: SISTEME INFORMATICE PENTRU ASISTAREA DECIZIEI (SIAD) · Sistemele informatice pentru asistarea deciziei, SIAD – implică folosirea elementelor aplicative din discipline diverse

Sistemele de asistare a deciziei care au la bază analiza şi sinteza datelor realizează

comasarea, sistematizarea, corelarea şi gruparea datelor pentru a obţine informaţii care să

reliefeze factorii care influenţează pozitiv sau negativ performanţele companiei. Ca urmare a

obţinerii unor astfel de informaţii se poate adopta o strategie de ameliorare a factorilor cu

influenţă negativă asupra performanţelor organizaţiei economice.

Obţinerea rezultatelor, sub formă de rapoarte care conţin informaţii utile factorilor de

decizie sunt într-o formă accesibilă şi sunt rezultatul tehnicilor speciale de explorare a masivelor

de date. Aceste tehnici conduc la evidenţierea unor corelaţii între date, pot face estimări şi

prognoze precum şi atenţionări ale managerilor asupra unor disfuncţii.

Caracteristicile fundamentale ale depozitelor de date (Inmon – 2005, Tuban – 2007) sunt

următoarele:

a) orientarea pe subiecte (de exemplu, produse, clienţi, vânzări etc.) conţinând numai informaţia

relevantă pentru procesul de decizie managerială; prin aceasta, managerii, în calitate de

utilizatori finali, calculează sau evaluează performanţele obţinute în afaceri, formulând şi

explicaţiile justificative pentru aceste performanţe.

b) integrarea, nemijlocit legată de caracteristica orientarea pe subiecte; datele provenite din

surse diverse sunt dispuse într-un format consistent, eliminându-se astfel conflictele şi

discrepanţele ce pot apare datorită unităţilor de măsură diferite. Un depozit de date se presupune

că este total integrat.

c) nonvolatilitatea: odată ce datele au fost introduse („scrise”) într-un depozit de date,

utilizatorii nu mai pot modifica sau actualiza datele. Un depozit de date este proiectat din

perspectiva utilizatorului, în mod exclusiv, numai pentru acces la date.

d) variabilitatea în timp (serii de timp). Un depozit de date menţine datele istorice ale

organizaţiei economice. Datele nu trebuie să asigure, în mod necesar, starea curentă (excepţie

fac doar sistemele în timp real). Pe baza depozitelor de date sunt detectate trenduri, deviaţii,

relaţii pe termen lung pentru comparaţii şi prognoze ce conduc la luarea deciziei. Pentru fiecare

depozit de date există o calitate temporală. Timpul reprezintă una din dimensiunile importante pe

care trebuie să le posede toate depozitele de date. Datele pentru analize ce provin din surse

multiple conţin referinţe de timp multiple (de exemplu, vizualizări zilnice, săptămânale, lunare

etc.).

e) includerea aplicaţiilor bazate pe Web.

f) utilizarea arhitecturii client/server.

g) utilizarea structurilor de baze de date relaţionale sau de baze de date multidimensionale.

h) folosirea metadatelor (date despre date).

Caracteristicile depozitelor de date rezultă din faptul că ele pot înmagazina volume mari

de date preluate din arhive şi/sau din bazele de date ale aplicaţiilor informatice specifice

activităţii curente a întreprinderii (sunt volume de ordin 1012 terabytes), precum şi din surse

externe organizaţiei economice. Exploatarea acestor volume uriaşe de date, provenind de la surse

de date diverse, este asigurată de existenţa unor motoare speciale care dau posibilitatea ca

masivele să poată fi interogate, precum şi existenţa unor servicii speciale de analiză on-line a

datelor (OLAP). Suporturile software susţin performanţele acestor servicii prin transformarea

datelor, corelarea şi completarea lor precum şi prin crearea dicţionarului de date, toate acestea

Page 48: SISTEME INFORMATICE PENTRU ASISTAREA DECIZIEI (SIAD) · Sistemele informatice pentru asistarea deciziei, SIAD – implică folosirea elementelor aplicative din discipline diverse

asigurând accesul la structurile primare. Datele sunt extrase din baze de date heterogene create

de sistemele informatice deja existente în organizaţie pe diversele platforme hard şi soft.

Se poate remarca faptul că datele sunt introduse nu la întâmplare ci sub controlul unor

aplicaţii şi al SGBD-ului. Acestea asigură prin serviciile de integritate, stocarea şi lucrul în

condiţii de siguranţă maximă. Datele care formează suportul pentru tranzacţiile primare sunt

apoi prelucrate pentru a se obţine informaţiile de sinteză necesare planificării şi luării deciziilor

şi sunt tratate de instrumentele SGBD.

Deoarece exploatarea unui volum enorm de date, pentru a obţine diverse rapoarte, este

asigurată de integritatea şi coerenţa bazei de date, reuniunea tuturor acestor date duce la

exploatarea unui mare număr de tabele, la crearea unor multiple legături virtuale şi tabele

temporare. Acest volum mare de muncă conduce la principalul inconvenient al depozitelor de

date şi anume timpul mare necesar exploatării lor. Un alt inconvenient îl constituie şi

aglomerarea motorului bazei de date cu task-uri de centralizare care încetineşte astfel

tranzacţiile curente.

Astfel a apărut necesitatea stocării datelor care sunt dedicate planificării şi deciziilor

strategice într-un sistem diferit de sistemul operaţional în aşa fel încât funcţionarea celor două

sisteme să se facă fără inconveniente. În depozitul de date se pot stoca atât arhive de date privind

activitatea anterioară cât şi date referitoare la tranzacţii ulterioare fără ca utilizatorul să poată

interveni.

Depozitele de date sunt o concentrare de date care organizează, consolidează şi

centralizează datele din surse eterogene şi care vor constitui baza procesărilor analitice atât de

necesare proceselor de decizie. Depozitul de date se construieşte progresiv adică el permite

completări şi dezvoltări ulterioare. Pentru a se asigura o calitate sporită a datelor acestea sunt

supuse unui proces de curăţire şi transformare, menţionând şi maniera de obţinere a unor date

colectate pe baza celor existente, acest proces ducând la micşorarea timpului cerut pentru

obţinerea unor rapoarte finale. În depozitele de date se face transformarea codurilor în date

explicite precum şi integrarea datelor din nomenclatoare în datele referitoare la tranzacţii. Acesta

este numit şi proces de denormalizare şi este caracterizat de faptul că nu modifică integritatea

datelor şi grăbeşte procesul de regăsire. Într-un depozit de date redundanţa datelor este permisă.

Literatura de specialitate prezintă mai multe arhitecturi de depozite de date, grupate în

două categorii: depozitele de date de tip întreprindere, EDW (Enterprise Data Warehouse) şi

rafturi de date (Data Marts). Un exemplu de arhitectură de depozit de date bazată pe Web

(Turban, 2007) este prezentat în fig.3.2. Această arhitectură pe 3-entităţi (three-tiers) cuprinde

clientul, serverul Web şi serverul de aplicaţie. Pe partea de client există o conexiune Internet şi

un navigator Web bazat pe o interfaţă grafică de tip GUI (Graphical User Interface). Mediul de

comunicaţie dintre client (atenţie: aici client are sensul de staţie de lucru – Work Station - pentru

utilizatorul final) şi servere este de tipul Internet/Intranet/Extranet. Pe partea de server se

foloseşte un server Web pentru gestionarea fluxurilor informaţionale dintre client şi server,

urmat de serverul de aplicaţie şi depozitul de date.

Page 49: SISTEME INFORMATICE PENTRU ASISTAREA DECIZIEI (SIAD) · Sistemele informatice pentru asistarea deciziei, SIAD – implică folosirea elementelor aplicative din discipline diverse

Fig.3.2 Arhitectura unui depozit de date bazat pe Web

O arhitectură generalizată a depozitului de date (Thalheim şi Lenz, 2005) este prezentată

în fig.3.3. Această arhitectură are în vedere aplicarea triadei „stocare-prelucrare-prezentare”, cu

sistemul de management al conţinutului, CMS (Content Management System) ca element central

al prelucrării datelor.

Sistemul de management al conţinutului, CMS, reprezintă în exenţă un sistem informatic

folosit pentru a gestiona conţinutul unui site Web (Web Content Management). Prin extensie,

CMS se referă şi la depozitele de date şi rafturile de date. Conţinutul gestionat de CMS cuprinde

fişiere, imagini media, fişiere audio, documente electronice, conţinut Web. CMS poate, de

asemenea, să fie folosit la fel de bine în calitate de arhivă electronică pentru forme non-

proprietare ale fişierelor10.

De regulă, un CMS constă din două elemente de bază: aplicaţia de management al

conţinutului, CMA (Content Management Application) şi aplicaţia de livrare a conţinutului,

CDA (Content Delivery Application)11. Un CMS indexează toate datele din interiorul sistemului

informatic integrat al organizaţiei economice. Prin CMS sunt folosite şabloanele sau seturile de

şabloane (templates) aprobate de managementul organizaţiei, ca şi ghidurile de lucru (wizards) şi

alte instrumente pentru crearea şi modificarea conţinutului Web.

Prin caracteristica de gestionare a formatelor documentelor, CMS asigură lucrul cu

formate de documente vechi (moştenite), a documentelor pe hârtie scanate ce pot fi convertite în

10 www.wikipedia.com 11 searchsoa.target.com

Navigator

Web

1. Client

Server Web

Depozit de

date

Pagini Web

Server de

aplicaţie

2. Server Web 3.Server de aplicaţie

Page 50: SISTEME INFORMATICE PENTRU ASISTAREA DECIZIEI (SIAD) · Sistemele informatice pentru asistarea deciziei, SIAD – implică folosirea elementelor aplicative din discipline diverse

format HTML sau PDF (Portable Document Format). Prin CMS se asigură actualizarea cu

ultima versiune a unui document sau restaurarea unui document în versiunea precedentă.

Fig.3.3 Arhitectura generalizată a depozitului de date (Thalheim şi Lenz)

Decizie de alegere a unei arhitecturi de depozit de date este influenţată de mai mulţi

factori, dintre care se menţionează:

- cerinţele de informaţie ale managementului de vârf (top-management);

- interdependenţele informaţionale existente între departamentele şi entităţile funcţionale

ale organizaţiei economice;

- gradul de limitare a resurselor organizaţiei economice;

- existenţa compatibilităţii cu sistemele informatice aflate deja în exploatare în organizaţie;

- motivaţia profundă a angajaţilor în dezvoltarea unui depozit de date.

Integrarea datelor într-un depozit de date conţine trei procese majore:

a) accesul la date;

b) realizarea federaţiei de date;

c) reflectarea oportună în depozitul de date a modificărilor semnificative ale datelor

provenite din sursele de date de tip întreprindere.

Există mai multe tehnologii de integrare a datelor şi metadatelor în depozit de date:

1) integrarea aplicaţiilor de tip întreprindere, EAI (Enterprise Application Integration);

2) arhitectura orientată pe servicii, SOA (Service-Oriented Architecture);

3) extragerea, transformarea şi încărcarea datelor în depozitul de date, ETL (Extraction,

Transformation and Load);

Date

OLTP

Date

externe

Date

moştenite

Instrumente

de import-

export

date

(nivel

micro)

Sistem de

management

al

conţinutului,

CMS

Extractoare

de date

Data

Mining

(nivel macro)

Sistem OLAP/DW

Utilizator

anonim

Unilizator

al unităţii

de afaceri

Utilizator

ESS/DSS

Page 51: SISTEME INFORMATICE PENTRU ASISTAREA DECIZIEI (SIAD) · Sistemele informatice pentru asistarea deciziei, SIAD – implică folosirea elementelor aplicative din discipline diverse

4) integrarea informaţiilor de tip întreprindere, EII (Enterprise Information Integration).

Integrarea aplicaţiilor de tip tip întreprindere, EAI (Enterprise Application Integration)

asigură modalitatea unitară de preluare a datelor din surse diverse şi stocarea lor în depozitul de

date de tip întreprindere, DEW. Această integrare a aplicaţiilor de tip întreprindere se realizează

la nivelul interfeţei de programare a aplicaţiei, API (Application Programming Interface). EAI

este combinată cu arhitectura orientată pe servicii, SOA (Service-Oriented Atchitecture) care

estre focalizată pe un ansamblu coerent de procese de afaceri orientate pe servicii Web.

Extragerea, transformarea şi încărcarea datelor în depozitul de date, ETL (Extraction,

Transformation and Load) reprezintă componenta integrală a oricărui proiect centrat pe

organizarea, stocarea şi prelucrarea datelor, aşa cum este depozitarea datelor (Data

Warehousing). Această componentă ETL consumă circa 70% din perioada de lucru la un proiect

centrat pe date12.

Extragerea datelor înseamnă citirea datelor destinate depozitului de date din una sau mai

multe baze de date.

Transformarea datelor reprezintă conversia datelor extrase din forma iniţială în forma

standard necesară pentru stocarea în depozitul de date sau în alte baze de date cu care depozitul

de date lucrează direct.

Încărcarea datelor înseamnă stocarea datelor, anterior transformate în forma standard,

curăţate şi rafinate, în depozitul de date.

Pot constitui surse de date relevante pentru depozitul de date (raftul de date): baze de

date tranzacţionale (provenite din sistemul informatic de procesare a tranzacţiilor, TPS), baze de

date provenite din aplicaţii ERP, din aplicaţii CRM, din tabele Excel (într-un cadru mai larg, din

baze de date specifice OAS), din baze de cunoştinţe specifice KWS, din şiruri de mesaje, din

fişiere externe etc.

Datele stocate în depozitul de date sunt conforme (prin forma standard dobândită prin

intermediul procesului ETL) cu regulile de afaceri ce definesc modul de folosire a datelor

stocate, cu regulile de întcomire a rezumatelor (sintezelor, rapoartelor), cu regulile de

standardizare a atributelor codificate, cu regulile de efectuare a calculelor. Toate aceste reguli

sunt memorate într-o bază de metadate şi sunt aplicate unitar în întreg depozitul de date.

Turban (2007) diferenţiază trei tipuri principale de depozite de date: rafturile de date,

DM (Data Marts), memoriile-tampon de date operaţionale, ODS (Operational Data Stores) şi

depozitele de date de tip întreprindere, EDW (Enterprise Data Warehouse).

3.2.2. Rafturile de date

Aşa cum s-a arătat în primul capitol al lucrării, organizaţia economică este structurată pe

departamente şi entităţi funcţionale, figurate ca domenii de gestiune ale organizaţiei economice.

La nivelul acestor departamente şi entităţi funcţionale, datele ce prezintă caracteristicile

prezentate în paragraful anterior sunt depuse în rafturi de date, DM (Data Marts). În unele

lucrări, noţiunea românească asociată lui Data Marts este de magazie de date, Altfel exprimat,

12 Turban, E., Op.cit.

Page 52: SISTEME INFORMATICE PENTRU ASISTAREA DECIZIEI (SIAD) · Sistemele informatice pentru asistarea deciziei, SIAD – implică folosirea elementelor aplicative din discipline diverse

dacă depozitele de date (Data Warehouse) combină baze de date la nivelul întregii organizaţii

economice (adică la nivelul sistemului informatic integrat al organizaţiei economice), în schimb

rafturile de date cu dimensiuni mai mici decât depozitele de date, sunt destinate unui anumit

departament al organizaţiei economice sau unui anumit subiect definit la dorinţa utilizatorului

final.

Utilizarea magaziilor sau rafturilor de date (Data Marts) conduce la creşterea

performanţelor în exploatare. Aceste depozite de date se construiesc de obicei cu tehnologii

relaţionale.

Majoritatea rafturilor de date sunt rafturi de date dependente (adică sunt generate direct

din depozitul de date). Există, însă, şi rafturi de date independente de depozitul de date al

organizaţiei ce sunt realizate special pentru o unitate strategică de afaceri, SBU (Strategic

Business Unit) şi care nu folosesc date din depozitul de date al organizaţiei economice. Raftul de

date independent poate constitui o alternativă „low cost” pentru firmele care nu-şi pot permite

achiziţionarea, menţinerea şi exploatarea unui depozit de date.

3.2.3. Memorii-tampon de date operaţionale

Între bazele de date operaţionale (tranzacţionale) de pe nivelul operaţional al

organizaţiei economice şi depozitele de date de pe nivelul de management mediu organizaţional

se pot constitui memorii-tampon de date operaţionale, ODS (Operational Data Stores).

Memoriile-tampon de date operaţionale servesc, de exemplu, pentru realizarea şi

utilizarea fişierelor cu informaţii despre client, CIF (Customer Information File) ce pot fi

actualizate în funcţie de evoluţia afacerii respective. Ca urmare, memoriile-tampon de date

operaţionale servesc pentru asistarea deciziei pe termen scurt, în special în aplicaţiile cu puncte

critice.

Memoriile-tampon de date operaţionale stochează cele mai recente date referitoare la

subiectul considerat, date ce provin din surse multiple. Datele din memoriile-tampon de date

operaţionale sunt date din surse diverse ce au fost supuse unui proces de extragere, transformare

şi încărcare, ETL (Extraction, Transformation and Load), similar cu procesul de la depozitele de

date. Când datele operaţionale sunt analizate multidimensional, memoriile-tampon de date

operaţionale devin rafturi de date operaţionale (Operational Marts sau Oper Marts)13.

3.2.4. Depozite de date de tip întreprindere

Un depozit de date de tip întreprindere, EDW (Enterprise Data Warehouse) este un

depozit de date integrat pe scară largă, cu un nvolum de date foarte mare, care se foloseşte la

nivelurile de management mediu şi strategic pentru asistarea luării deciziei.

13 Turban, E., 2007, Op.cit.

Page 53: SISTEME INFORMATICE PENTRU ASISTAREA DECIZIEI (SIAD) · Sistemele informatice pentru asistarea deciziei, SIAD – implică folosirea elementelor aplicative din discipline diverse

EDW utilizează date în format standard ce provin de la surse diverse. Datele din EDW

sunt folosite ca date de intrare pentru majoritatea tipurilor de sisteme informatice pentru asistarea

deciziei economice, cum sunt sistemele informatice pentru managementul relaţiilor cu clienţii,

CRM (Customer Relationship Management), sistemele informatice pentru managementul

lanţului de aprovizionare, SCM (Supply Chain Management), sistemele informatice pentru

managementul performanţelor afacerilor, BPM (Business Performance Management), sistemele

informatice pentru managementul ciclului de viaţă al produselor, PLM (Product Lifecycle

Mangement), sistemele informatice pentru monitorizarea activităţilor afacerilor, BAM (Business

Activity Monitoring), sistemele (aplicaţiile) informatice pentru managementul veniturilor,

sistemele informatice pentru automatizarea lucrărilor de birou, OAS (Office Automation

Systems), sistemul informatic de lucru cu cunoştinţe, KWS (Knowledge Work Management)14

etc.

3.2.5 Diferenţierea depozitului de date de baza de date

Diferenţele dintre depozitul de date şi baza de date sunt următoarele:

a) datele conţinute de un sistem de prelucrare a tranzacţiilor, OLTP (On-Line Transaction

Processing) sunt de tip operaţional, iar datele conţinute de un depozit de date sunt specifice

asistării deciziilor, sunt date centralizate sau derivate din date operaţionale, nu se modifică în

timp şi sunt destinate utilizatorilor finali;

b) în cazul sistemelor tranzacţionale, performanţele se referă la integritate, confidenţialitate,

siguranţă şi timp de răspuns întrucât un număr mare de utilizatori introduc date în sistem, în

timp ce în cazul SIAD (deci a depozitelor de date) numărul de utilizatori finali (manageri) este

foarte mic. Astfel şi securitatea şi siguranţa în exploatare nu sunt supuse unor riscuri majore,

procedurile de salvare şi restaurare fiind mai puţin utilizate decît în cazul sistemelor

tranzacţionale.

c) datele procesate în sistemele tranzacţionale sunt în seturi relativ mici, introduse recent şi

compact, astfel încât prelucrarea se face destul de rapid. În procesele decizionale, datele

necesare acestora sunt în volum mare, stocate dispersat ceea ce duce la o prelucrare mai lentă;

d) bazele de date construite pentru sisteme tranzacţionale sunt proiectate şi realizate pe baza

unor cerinţe cunoscute şi certe, modificările care intervin datorită adaptării sistemului la

schimbările intervenite reiau anumite faze ale ciclului de viaţă. Dar odată implementate ele

funcţionează perioade lungi de timp fără modificări. În SIAD cerinţele sunt cunoscute doar

parţial în momentul proiectării şi realizării lor, ceea ce obligă depozitul de date să se adapteze

din mers cerinţelor. De aceea se observă că datele gestionate pentru sisteme tranzacţionale sunt

privite ca un întreg, pe când cele din depozitele de date sunt organizate pe secţiuni deoarece ele

sunt organizate în funcţie de subiectul de analiză.

e) Sistemele tranzacţionale reflectă de obicei fluxul datelor din activităţi curente, pe când

depozitele de date sunt orientate pe subiecte cum ar fi de exemplu: resurse, produse, clienţi,

furnizori.

f) În cadrul sistemelor informatice operaţionale dedicate domeniilor de gestiune ale

organizaţiei, datele sunt adesea fragmentate, astfel încât managerii iau decizii pe baza unor

14 Idem.

Page 54: SISTEME INFORMATICE PENTRU ASISTAREA DECIZIEI (SIAD) · Sistemele informatice pentru asistarea deciziei, SIAD – implică folosirea elementelor aplicative din discipline diverse

informaţii parţiale (incomplete). Depozitele de date elimină acest dezavantaj prin accesarea,

integrarea şi organizarea datelor operaţionale cu rol-cheie într-o formă care se caracterizează

prin consistenţă, fiabilitate, oportunitate, disponibilitate rapidă şi cu referinţă în timp (timely).

3.2.6. Ciclul de viaţă al depozitelor de date

Depozitul de date (Data Warehouse) este o colecţie de date orientate pe subiecte,

integrate, corelate în timp şi non-volatile care sprijină decizia.* Datele care fac obiectul unui

depozit sunt integrate în acesta utilizând convenţii pentru măsurători, atribute. Structura de care

dispune depozitul de date prevede identificarea punctuală a datelor stocate şi, mai ales, un acces

rapid la ele. Proiectarea structurii depozitului de date se face prin modelare multidimensională,

structura implementându-se ca o bază de date care asigură stocarea unui volum mare de date şi

un acces rapid la ele, aşa numitele baze de date client/server.

Popularea depozitelor de date se face prin preluare din sisteme tranzacţionale, dar care

vor fi supuse unor procese complexe de transformare care să corespundă structurii depozitului

care a fost proiectat. După această etapă, depozitul va putea intra în exploatare pentru a obţine

analize şi rapoarte. Etapele enumerate anterior (proiectare, populare, exploatare) sunt asistate de

un soft specializat de la browsere şi generatoare de rapoarte până la instrumente specifice Data

Mining.

În exploatarea curentă a depozitului frecvent vor apare noi cerinţe informaţionale care

vor duce neapărat la extinderea structurii, la popularea cu extensii cuprinzând date istorice,

precum şi la integrarea noilor date încorporate în aplicaţii de analiză. Pe parcursul existenţei

sale, un depozit de date este incremental şi ciclic.

3.3. Modelarea conceptuală a depozitului de date

În etapa de concepţie a unui depozit de date se folosesc modele dimensionale care

grupează datele din tabelele relaţionale în scheme de tip stea sau fulg de zăpadă. În aceste

scheme pot fi regăsite date cantitative cum ar fi cantităţi sau valori sau grupate după diverse alte

criterii (pe client, pe produs, pe tipuri de servicii etc.). Datele cantitative din bazele de date

dimensionale sunt de tip medii, număr de tranzacţii, centralizări după anumite caracteristici,

totaluri şi reprezintă măsuri ale activităţii. Pe de altă parte, criteriile de agregare vor fi denumite

dimensiuni. Măsurile identificate prin dimensiuni vor fi stocate într-o tabelă relaţională care este

denumită tabelă de fapte, iar codurile utilizate sau asociate criteriilor de agregare sunt date de

tabelele de tip nomeclator asociate fiind cu tabelele de fapte şi în acest fel schema relaţională va

fi de tip stea. Dacă se reunesc mai multe scheme de tip stea care utilizează aceleaşi

nomenclatoare formează un model tip constelaţie. Dacă nomenclatoarele se pot divide în

subnomenclatoare atunci există o dependenţă între acestea. De remarcat că pentru acelaşi cod

* Dinu Airinei – Operă citată

Page 55: SISTEME INFORMATICE PENTRU ASISTAREA DECIZIEI (SIAD) · Sistemele informatice pentru asistarea deciziei, SIAD – implică folosirea elementelor aplicative din discipline diverse

pot exista mai multe nomenclatoare alternative. Dacă se integrează aceste subdimensiuni şi

dimensiuni alternative, se creează o schemă sub formă de fulg de zăpadă.

Schemele de tip stea, fulg de nea sau constelaţie sunt modele conceptuale

multidimensionale ale depozitelor de date, având ca rol organizarea datelor pe subiecte, necesară

procesului de decizie. Schema este deschisă, adică ea se poate modifica pe tot parcursul vieţii

depozitului de date.

3.4. Modul de utilizare a depozitului de date

Depozitele de date conţin structuri unice, integrate şi cumulative necesare procesului de

decizie. Administratorul depozitului de date are ca principală sarcină stabilirea accesului partajat

al categoriilor de manageri prin asigurarea de parole şi drepturi de acces. Datele din depozit sunt

accesate selectiv de manageri în funcţie de necesităţile acestora. În acest fel se crează colecţii

specializate pe diverse domenii care se numesc magazii de date (Data Marts). Magaziile de date

se pot utiliza şi ca structuri intermediare pentru colectarea datelor din surse primare şi al căror

conţinut este descărcat periodic în depozitul de date. Depozitele de date pot lua naştere şi printr-

o stocare exhaustivă a datelor din sistemele tranzacţionale în vederea aplicării tehnologiei Data

Mining. Utilizarea tehologiei Data Mining presupune că procesarea datelor se face fără

intervenţia utilizatorilor, în background, iar rezultatele sunt păstrate pentru a fi consultate ulterior

la cerere.

3.5. Mediul de depozitare al datelor

Mediul în care se contruieşte şi se exploatează un depozit de date conţine următoarele

elemente: surse de date tranzacţionale, instrumente de proiectare-dezvoltare, instrument de

extracţie şi transformare a datelor, sistemul de gestiune al bazei de date, instrumente de acces şi

analiză a datelor şi instrumente de administrare *.

În cazul suitei ce aparţine firmei Microsoft, toate componentele enumerate sunt integrate

pe o în mediul de lucru pentru depozitarea datelor (Data Warehousing), pentru diversele versiuni

ale SQL Server (SQL Server 7.0, SQL Server 2000, SQL Server 2005). Acest mediu de lucru

oferă asistarea proiectării, implementării şi administrării depozitelor de date pe întregul ciclu de

viaţă al acestora. Se poate concluziona că acest cadru de lucru pentru Data Warehousing oferă o

arhitectură care se poate integra relativ simplu cu produse ce provin de pe alte platforme, asigură

sevicii de import-export cu validare şi transformarea datelor, asigură metadate integrate pentru

proiectarea depozitului şi gestionează suportul, task-uri şi evenimente.

În cazul suitei firmei Oracle, produsul Oracle Express reprezintă un sistem de gestiune a

bazelor de date multidimensionale, SGBDMD, ce este fundamentat pe modelul de date

multidimensional, pe arhitectura client/server, cu posibilităţi de dezvoltare a aplicaţiilor Web.

* Zaharie D, Albescu F, colectiv – Operă citată

Page 56: SISTEME INFORMATICE PENTRU ASISTAREA DECIZIEI (SIAD) · Sistemele informatice pentru asistarea deciziei, SIAD – implică folosirea elementelor aplicative din discipline diverse

Produsul Oracle Express cuprinde următoarele componente arhitecturale: utilitare pentru

administrare (Express Instance Manager, Express Administrator şi Relational Access Manager),

instrumente pentru dezvoltare (Oracle Express Analyser, Oracle Express Objects etc) şi nucleul

(limbajul de programare Express). Instrumentul OLAP denumit Oracle Express Analyser

asigură selectarea, analiza şi vizualizarea datelor memorate în baza de date multidimensională,

iar instrumentul Oracle Express Objects asigură dezvoltarea de aplicaţii OLAP cu ajutorul

limbajului de programare Express. Prin integrarea instrumentului Oracle Express Objects cu

Oracle Discoverer, este facilitată realizarea aplicaţiilor destinate cercetării (inteligente) a

afacerilor (Oracle Integrated Business Intelligence Tools). Este prevăzut, de asemenea, un editor

de conexiuni, Express Connection Editor, care asigură definirea conexiunilor la baza de date

multidimensională.

Pentru ca un depozit de date să poată fi procesat este necesară existenţa unui set

specializat de instrumente pentru: descrierea fizică şi logică a surselor de date, a depozitelor sau

a magaziei de date în care acestea urmează să fie încorporate; validarea, curăţirea şi

transformarea datelor care urmează a fi stocate în depozitul de date; utilizatorii finali,

instrumente care permit acestora accesul la datele stocate în depozitul respectiv. Astfel de

instrumente sunt specializate pentru medii de dezvoltare a aplicaţiilor, produse program

specializate pe analiza datelor precum şi pentru aplicaţii personale (individuale).

3.6. Abordarea multidimensională a datelor stocate în depozite.

3.6.1. Definirea şi caracterizarea OLAP (On-Line Analytical Processing)

Dacă se analizează tehnologia relaţională se observă că cea mai mare parte a problemelor

tratate relaţional sunt în realitate multidimensionale. În modelul relaţional problemele sunt

tratate în tabele care au două dimensiuni: linie şi coloană. Problemele reale, care în cea mai mare

parte a lor sunt multidimensionale, nu impun limite stocării spaţiale a datelor. Astfel, un SGBDR

obişnuit nu poate face faţă cerinţelor de agregări de date, sintetizări, consolidări şi proiecţii

multidimensionale. De aceea, a apărut necesitatea extinderii funcţionalităţii unui SGBDR prin

adăugarea unor componente speciale care să permită modelare şi analiză multidimensională

(OLAP) şi Data Mining.

La modul general, termenul de procesare analitică online, OLAP (OnLine Analytical

Procesing) se referă la o varietate de activităţi ce sunt realizate de către utilizatorii finali în

sistemele informatice interactive (online). În mod obişnuit, OLAP cuprinde activităţi ca

generarea şi obţinerea răspunsurilor la interogări şi cererile ad-hoc de rapoarte şi grafice.

Obţinerea acestor răspunsuri la interogări, rapoarte şi grafice se fundamentează pe metodele

moderne ale statisticii şi cercetărilor operaţionale, precum şi pe tehnologiile de construire a

prezentărilor vizuale. Unele lucrări de specialitate includ analizele şi prezentările

multidimensionale, sistemele informatice pentru suportul executivului, ESS (Executive Support

Systems) sau EIS (Executive Information Sytstems) şi Data Mining în tehnologia OLAP15. În

esenţă, produsele de firmă OLAP furnizează posibilităţi de modelare, analiză şi vizualizare

15 Lungu, I. ş.a., Sisteme informatice executive, Editura ASE, Bucureşti, 2007.

Page 57: SISTEME INFORMATICE PENTRU ASISTAREA DECIZIEI (SIAD) · Sistemele informatice pentru asistarea deciziei, SIAD – implică folosirea elementelor aplicative din discipline diverse

pentru volume mari de date din baze de date (prin intermediul SGBDR) sau din depozite de date.

OLAP asigură vederi conceptuale multidimensionale asupra datelor. Modelele de date asociate

sistemelor OLAP se încadrează astfel în două categorii: extensii ale modelului de date relaţional

şi modelele bazate pe cuburi n-dimensionale. Din categoria extensiilor modelului de date

relaţional pentru OLAP fac parte, între altele:

- modelul Kimball (fundamentat pe schema tip stea ca o reprezentare relaţională a cubului

n-dimensional; din aceasta s-au dezvoltat schema tip fulg de nea şi schema tip

constelaţie);

- modelul Gary (fundamentat pe operatorii CUBE şi ROLLUP ai clauzei Group By din

limbajul de interogare structurată SQL);

- modelul Gyssens şi Lakshmanan (fundamentat pe o extensie ale algebrei relaţionale).

Din categoria modelelor bazate pe cuburi n-dimensionale se pot menţiona, între altele:

- modelul lui Agrawal, Gupta şi Sarawagi (fundamentat pe o mulţime de operatori

asemănători cu cei din algebra relaţională, cu organizarea datelor bazată pe cuburi n-

dimensionale);

- modelul Cabbibo şi Torlone (fundamentat pe o schemă multidimensională compusă din

mulţimea de dimensiuni, tabelele de fapte şi descrierile nivelurilor ierarhice)16.

Tehnologia OLAP permite utilizatorilor navigarea rapidă de la o dimensiune la alta şi

facilităţi sporite de obţinere a celor mai detaliate informaţii din depozitul de date. Tehnologia

OLAP se bazează pe 12 principii formulate de Ted Codd (1993), extinse la 18 principii în anul

1995. Acestea sunt:

1. abordarea conceptuală multidimensională a datelor; ca urmare, se folosesc modele

multidimensionale;

2. asigurarea unei transparenţe sporite prin existenţa unei arhitecturi deschise a sistemului;

3. accesibilitatea asigurată utilizatorului prin asistarea implicării acestuia în modalităţile

tehnice de furnizare a datelor (utilizatorul final reprezintă şi el o sursă de date); trebuie să se

realizeze o singură viziune logică a datelor din organizaţie (enterprise);

4. complexitatea dimensională a analizei oferă performanţe stabile; instrumentele OLAP

trebuie să aibă implementate patru modele de analiză: direct, explicativ, contemplativ şi

formativ;

5. utilizarea arhitecturii client-server, unde server-ul are ca scop omogenizarea datelor;

6. posibilitatea de a efectua aceleaşi operaţii asupra tuturor dimensiunilor şi care poartă

numele de prelucrare generică a dimensiunilor;

7. dimensiunile trebuie să fie echivalente operaţional şi structural (dimensionalitate

generică); prin intermediul acestui principiu sunt astfel asigurate ierarhii multiple;

8. gestionarea dinamică a matricilor încrucişate prin facilitatea de a elimina combinaţiile

dimensionale nule, pentru a nu încărca memoria calculatorului; indiferent de sursa lor, valorile

lipsă sunt ignorate;

9. posibilităţile de acces simultan al mai multor utilizatori (multi-user) la aceeaşi fază

(etapă) de analiză;

10. operaţii nerestrictive, ceea ce dă posibilitatea executării fără restricţii a calculelor pentru

toate combinările de dimensiuni şi niveluri ierarhice;

11. posibilitatea manipulării intuitive a datelor;

16 Muntean, M., Iniţiere în tehnologia OLAP. Teorie şi practică, Editura ASE, Bucureşti, 2004.

Page 58: SISTEME INFORMATICE PENTRU ASISTAREA DECIZIEI (SIAD) · Sistemele informatice pentru asistarea deciziei, SIAD – implică folosirea elementelor aplicative din discipline diverse

12. număr nelimitat de niveluri de agregare şi de dimensiuni 1.

13. valorile lipsă sunt diferite de valorile invalide şi de valorile zero (împrăştiere); valoarea

zero este validă; modelele OLAP satisfac regula referitoare la valorile NULL din modelul

relaţional. Ca urmare, datele lipsă şi invalide trebuie tratate în mod individual;

14. denormalizarea datelor, la introducerea lor în depozitul de date;

15. memorarea rezultatelor generate de OLAP; sistemele OLAP stochează datele în depozite

de date separat de sistemele tranzacţionale;

16. flexibilitatea rapoartelor, prin selectarea axelor la raportare la dorinţa utlizatorului final;

17. caracteristici superioare ale raportării, în funcţie de locaţia procesării datelor (client sau

server) şi de modul de efectuare a calculelor (după modele de preprocesare sau calcule executate

în momentul interogării depozitului de date);

18. ajustarea automată a nivelului fizic, în funcţie de volumul datelor şi de tipul de model

logic folosit.

OLAP este tehnologia de agregare a datelor stocate în depozite de date într-o manieră de

abordare multidimensională cu facilităţi referitoare la accesul la informaţii a managerilor în mod

interactiv şi flexibil. Legătura dintre OLAP şi depozitele de date este aceea că OLAP le

completează prin transformarea volumului imens de date stocate şi gestionat în depozite în

informaţii utile procesului de decizie. Cele 12 reguli (iniţiale, din 1993) ale lui Codd au fost apoi

regrupate într-un test cu 5 reguli denumit FASMI (Fast Analysis Shared Multidimensional

Information).

OLAP presupune existenţa unor tehnici care permit de la o navigare şi selecţie simplă a

datelor până la analiza detaliată şi complexă. Aplicaţiile care se rezolvă pe baza acestei

tehnologii au la bază analiza rapidă a informaţiei multidimensională dispersată în locaţii multiple

dar accesibile unui mare număr de utilizatori. Pentru utilizarea acestor facilităţi, OLAP dispune

de eficacitatea bazelor de date multidimensionale şi de posibilitatea de a construi alternative

pentru diverse probleme de decizie. OLAP presupune că analiza datelor (care pot fi de tip

numeric sau statistic) poate fi predefinită de cel care creează aplicaţia sau chiar de utilizatorul

final.

OLAP se caracterizează prin: perspectiva multidimensională a datelor, capacitatea de

calcul intensiv şi orientare în timp (time intelligence).* Aspectul multidimensional al datelor este

dat de posibilitatea de a integra multiplele aspecte care caracterizează activitatea unei

întreprinderi şi care sunt considerate din perspective multiple ca: timp, bani, produse. Fiecare

dimensiune este definită în genere prin mai multe niveluri ca de exemplu: timpul este divizat în

an, trimestre, luni, sezoane; produsul în: categorii, clasă. Conceptul de dimensiune este folosit ca

înţeles de aspect, dimensiunile fiind independente şi cu unităţi de măsură specifice dimensiunii

respective.

1 Grupul BDASEID – Operă citată şi M.Muntean, Iniţiere în tehnologia OLAP. Teorie şi practică, Editura ASE,

Bucureşti, 2004. * Zaharie D, Albescu F, colectiv – Operă citată

Page 59: SISTEME INFORMATICE PENTRU ASISTAREA DECIZIEI (SIAD) · Sistemele informatice pentru asistarea deciziei, SIAD – implică folosirea elementelor aplicative din discipline diverse

Fig.3.4. Hipercubul de date

Unităţile de măsură pot constitui criterii de agregare a datelor, iar nivelele unei

dimensiuni formează ierarhia care la rândul ei poate constitui criteriu de agregare a datelor.

Privite din punct de vedere multidimensional, datele sunt reprezentate în hipercuburi de date

(fig.3.4), prin extinderea cubului tridimensional la cel n-dimensional.

Pe acest tip de cub se pot efectua calcule prin aplicarea unor algoritmi complecşi asupra

datelor structurate în acesta. Acestea implică posibilitatea de adresare multidimensională directă

a cuburilor unitare şi optimizarea timpului de răspuns.

Caracteristica de orientare în timp (time intelligence) presupune flexibilitatea exploatării

acestei dimensiuni care este necesară pentru comparaţii şi aprecieri de valoare în analizale

economice. Această dimensiune este luată de obicei din calendarele tranzacţiilor economice aşa

cum se află în bazele de date ale sistemului informatic al companiei. Se pot face astfel grupări pe

dimensiuni ca: trimestre, luni, ani, sezoane. Se pot utiliza şi dimensiuni speciale cum sunt:

perioada curent, perioada precedentă, aceeaşi perioadă din anul..., care trebuie neapărat luate în

considerare la proiectarea hipercubului. Bazele de date multidimensionale folosite de OLAP sunt

suprapuse depozitelor de date şi stochează straturi de date agregate pe diferite criterii ierarhice.

De asemenea, aceste baze de date multidimensionale conţin şi date statistice pentru fiecare nivel

de agregare.

Un server OLAP reprezintă un motor de manipulare a datelor multiutilizator de mare

capacitate ce a fost proiectat pentru a sprijini şi funcţiona cu structuri de date multidimensionale.

O structură de date multidimensională este astfel aranjată încât fiecare articol (item) de date este

localizat şi accesat pe baza intersecţiei membrilor dimensiunii care definesc acel articol (irem).

Proiectarea serverului şi a structurii de date sunt optimizate pentru regăsirea rapidă („ad-hoc”) a

dalelor în oricare dintre orientările dorite, pentru calculul flexibil şi rapid, precum şi

transformarea rândurilor de date pe baza relaţiilor de tip formulă. O formulă este un obiect al

bazei de date (calcul, regulă sau altă expresie) destinat pentru manipularea datelor în interiorul

bazei de date multidimensionale. Serverul OLAP poate să reprezinte, fie o etapă fizică a

Page 60: SISTEME INFORMATICE PENTRU ASISTAREA DECIZIEI (SIAD) · Sistemele informatice pentru asistarea deciziei, SIAD – implică folosirea elementelor aplicative din discipline diverse

procesării informaţiei multidimensionale pentru a furniza timp de răspuns rapid şi consistent

utilizatorilor finali, fie poate să populeze structurile sale de date în timp real având ca surse baze

de date relaţionale sau alte tipuri de baze de date. De asemenea, serverul OLAP poate să fie o

reprezentare a ambelor alternative de mai sus.

3.6.2. Modelarea dimensională – cuburi OLAP

Modelarea dimensională presupune conceptualizarea şi reprezentarea aspectelor

măsurabile ale activităţii studiate în interdependenţă cu contextul în care acesta se desfăşoară,

aspect identificat prin parametrii activităţii. Legătura dintre valorile înregistrate ale activităţii

(valori vânzări, cheltuieli comune, costul produselor) şi contextul de desfăşurare al acesteia

formează baza numeroaselor rapoarte de sinteză care sunt produse de sistemele tranzacţionale.

Prin modelare dimensională se oferă un model conceptual comun acestor rapoarte şi agreagarea

lor într-o structură uniformă şi flexibilă. Totodată se păstrează şi legătura cu sursele iniţiale de

date, deci posibilitatea de descompunere a datelor centralizate pe niveluri din ce în ce mai mici

până se ajunge la setul de tranzacţii iniţiale (drill-down).

Cubul OLAP (fig.3.4) se consideră a fi element structural pentru datele din procesul on-

line. Acesta este o structură multidimensională, un hipercub prin care se modelează complexul

de activităţi pe o perioadă îndelungată de timp. Acest tip de modelare este caracterizat de câteva

concepte de bază:

• cuantificarea activităţii (aspectul cantitativ) care se face prin utilizarea unităţilor de

măsură clasice ca de exemplu: m, m3, kg, unităţi monetare. Măsuri cantitative sunt: volum

vânzări, volum salarii, cost materiale, cost produs etc.

• dimensiunile activităţii sunt de fapt parametrii activităţii măsurate ca de exemplu: zi,

lună, trimestru, client sau grupă de clienţi. Dimensiunile sunt de obicei de natură diferită şi

răspund la întrebări de tipul: unde?, când?, cu ce? etc.

• faptele sunt colecţii ale cuantificării activităţii precum şi dimensiunile care identifică

modul în care acestea s-au desfăşurat. Sursa de existenţă a faptelor este constituită din

înregistrările stocate în tabelele de tranzacţie ale aplicaţiilor operaţionale care susţin activitatea

respectivă. Se pot folosi şi dimensiuni scenarii care pot stoca în tabelele de fapte şi măsuri

imaginare alături de cele reale, pentru ca utilizatorul să poată stoca valori estimate pentru o

măsură.

În bazele de date tranzacţionale, dimensiunile sunt de fapt câmpuri care conţin

caracteristicile unei tranzacţii adică datele de identificare ale tranzacţiilor care sunt de obicei chei

externe care fac legătura cu nomenclatoarele care le explicitează.

Ca atare, se poate afirma că dimensiunile se materializează în setul de valori posibile care

formează domeniul caracteristicii respective, valori care poartă numele de membrii dimensiunii.

O altă caracteristică a dimensiunii este aceea că poate avea multipli adică sunt grupe de

valori ale dimensiunii cu o caracteristică comună. Grupele pot fi identificate prin atribute care

se află în nomenclatorare şi pot lua aceeaşi valoare pentru mai multe valori ale cheii primare.

Multiplii unei dimensiuni nu trebuie să fie neapărat de aceeaşi natură cu dimensiunea primară,

Page 61: SISTEME INFORMATICE PENTRU ASISTAREA DECIZIEI (SIAD) · Sistemele informatice pentru asistarea deciziei, SIAD – implică folosirea elementelor aplicative din discipline diverse

aceasta putând avea mai multe tipuri de multipli în funcţie de caracteristicile luate în considerare.

Se poate afirma că dimensiunile împreună cu multiplii lor formează structuri arborescente care

sunt recunoscute de OLAP ca fiind ierarhii. Ierarhiile pot fi regulate, adică toate ramurile au

acelaşi număr de ramificaţii sau neregulate dacă pe anumite ramuri lipseşte un nivel de

semnificaţie. La rădăcina arborelui se află o caracteristică cu aceeaşi valore pentru toţi membrii

dimensiunii de bază. Acest tip de caracteristică este una implicită ca, de exemplu, unitatea care

are ca activitate cea analizată sau “all”. Frunzele arborelui formează membrii dimensiunii

iniţiale, iar dimensiunile intermediare pot fi pe mai multe nivele. Dacă arborele este neregulat,

pentru a uniformiza ierarhia se poate introduce un membru de tip “alte”. În acest fel se constata

că centralizările pe nivelul respectiv nu vor fi de 100% din valoarea centralizată pe nivelul cel

mai de jos. Atributele care definesc ierarhia sunt atribute derivate din atributul care defineşte

dimensiunea acţiunilor măsurate, prin referire la nomenclatoare sau prin clasificări ale valorilor

pe care le poate lua atributul respectiv. De exemplu, furnizorii se pot clasifica în furnizori stabili

dacă compania face tranzacţii cu ei de mai mult de 4 ani, furnizori noi dacă au vechime cuprinsă

între 1 şi 4 ani şi furnizori volatili sau ocazionali dacă în câmpul respectiv din Furnizori nu este

completat nimic. Din acest exemplu se observă că asemenea clasificări conduc la obţinerea unor

atribute derivate prin calcul din caracteristicile aflate în nomenclatoare. În acest fel se vor obţine

seturi de membri calculaţi ai dimensiunii. Dimensiunile ierarhizabile se constituie în ierarhii

alternative. Nivelele ierarhiilor sunt văzute ca nivel de agregare pentru valorile stocate în tabele

de fapte. Membrii dimensiunilor identifică măsura activităţii stocată în tabelul de fapte. Dacă

unui fapt îi sunt asociate mai multe dimensiuni, identificarea unică a acestuia va necesita valori

precise pentru fiecare dimensiune. Ca urmare, din tabelele de fapte sunt selectate mai multe

înregistrări, adică toate valorile posibile asociate dimensiunilor nespecificate.

Pentru dezvoltarea unui depozit de date, modelarea datelor are un rol important deoarece

permite vizualizarea structurii înainte ca ea să fie construită. Modelul multidimensional

reprezentat prin el va fi prezentat desfăşurat în secţiuni sau în proiecţii tridimensionale.

Secţiunea unui hipercub este definită ca o secţiune din cub dată prin coordonatele sale.

Proiecţia este definită ca o secţiune care centralizează datele de pe toate dimensiunile suprimate.

Vizualizarea on-line se face de fapt tot în secţiuni sau proiecţii tridimensionale. Datele

din celule sunt prezentate numai în secţiuni sau proiecţii transversale bidimensionale. Hipercubul

ar putea fi imaginat ca un set de tabele-pivot grupate pe dimensiunea cerută. Pentru procesul de

modelare, hipercubul se poate prezenta în formă tabelară în care măsurile sunt evidenţiate pe

coloane iar liniile reprezintă combinaţiile de dimensiuni. De asemenea, în plan fizic, hipercubul

poate fi stocat într-un tabel cu coloane multiple în care se stochează măsurile şi cu identificatori

pe rânduri. Identificatorii de rânduri sunt de fapt chei formate din toate combinaţiile posibile de

valori ale dimensiunilor. Utilizarea indecşilor pentru acces rapid nu are prea mare eficienţă

întrucât cheia este compusă din mai multe caracteristici, iar câmpurile de valoare sunt puţine şi

numerice, astfel că tabelul de indecşi este aproape de aceeaşi dimensiune cu tabelul iniţial. De

aceea, se utilizează tabelul bitmap pentru un acces direct rapid. Datele modelate ca hipercuburi

formează baze de date multidimensionale.

Tipurile majore de OLAP sunt17:

17 Turban E., Op.cit.

Page 62: SISTEME INFORMATICE PENTRU ASISTAREA DECIZIEI (SIAD) · Sistemele informatice pentru asistarea deciziei, SIAD – implică folosirea elementelor aplicative din discipline diverse

- OLAP multidimensional (MOLAP) – atunci când cubul OLAP este implementat prin

intermediul unei baze de date multidimensionale specializate (sau memorie-tampon de

date – data store);

- OLAP relaţional (ROLAP) – atunci când o bază de date OLAP este implementată în

vârful unei baze de date relaţionale existente;

- OLAP hibrid (HOLAP) – combinaţie între MOLAP şi ROLAP;

- OLAP bază de date (DOLAP) – atunci când se referă la un SGBDR care este proiectat

pentru a găzdui structuri OLAP şi a permite calcule OLAP;

- OLAP Web (WOLAP) – atunci când se refră la date OLAP ce sunt accesibile prin

intermediul unui navigator Web;

- OPAP pe desktop – reprezintă o variantă de OLAP cu preţ scăzut, atunci când

instrumentele OLAP şi bazele de date sunt localizate pe staţia de lucru (desktop) a

utilizatorului final.

3.6.3. Baze de date multidimensionale

Baza de date multidimensională este formată din două structuri: structura datelor în care

se stochează măsurile activităţilor preluate din tabela de fapte a depozitului de date. Datele vor fi

prezentate utilizatorului în celulele tabelelor pivot; structura metadatelor care este formată din

totalitatea dimensiunilor şi membrilor acestora precum şi din structurile ierarhice ale

dimensiunilor. Utilizatorul poate vizualiza această structură ca nume de coloane şi linii care

reprezintă informaţiile de pe axele cuburilor.

Numerotarea nivelurilor începe de la rădăcină (nivel 0) către frunze (unde va apare

nivelul maxim). Ierarhiile posedă propriile lor seturi de niveluri, chiar dacă unele ramuri sunt

comune. De exemplu: ierarhia Calendar este formată din nivelele (0-5): Timp, An, Semestru,

Trimestru, Lună, Dată calendaristică, ierarhia Anotimp este formată din nivelele (0-4): Timp,

An, Sezon, Lună, Dată calendaristică, iar ierarhia Anotimp este formată din nivelele (0-3): Timp,

Săptămână, Zi, Dată calendaristică. Pe fiecare nivel se stochează membrii dimensiunilor

respective. Rădăcina care se observă că este comună (Timp) este nivelul de agregare maxim

având ca unic membru implicit “all”. Orice nod în arbore este un membru al unei subdimensiuni.

Nodurile subordonate unui nod formează un set, iar orice membru al unui set are un număr de

ordine începând cu 0. De asemenea, orice membru poate avea proprietăţi ca de exemplu unele

zile sunt sărbători legale, unii ani sunt bisecţi. Exemplul prezentat presupune o structură strict

arborescentă întrucât fiecare membru al unei dimensiuni are submembri distincţi, chiar dacă

aceştia au aceleaşi valori. De exemplu fiecare an are setul lui de luni, fiecare săptămână are setul

ei de zile. Ca mod de identificare, membrii vor fi calificaţi cu numele membrului de pe nivelul

precedent căruia acesta i se subordonează: 2007-feb, 2008-feb. Tipul acesta de dimensiuni care

au membri ce se repetă se pot crea şi ulterior prin combinarea a două nivele din ierarhie sau din

ierarhii diferite pentru a crea un nivel nou, virtual.

Pentru a se putea naviga pe o structură arborescentă, sistemele de gestiune pun la

dispoziţie operatori ierarhici. De exemplu, pentru exploatarea datelor, sistemele de gestiune

oferă operatori pe hipercuburi. Fizic, datele sunt stocate într-un fişier cu acces direct pe baza

adresei fizice absolute sau relative a înregistrării obţinute prin exploatarea tabelelor bitmap

Page 63: SISTEME INFORMATICE PENTRU ASISTAREA DECIZIEI (SIAD) · Sistemele informatice pentru asistarea deciziei, SIAD – implică folosirea elementelor aplicative din discipline diverse

obţinute în urma creerii structurii de date. Aceste tabele sunt puntea de legătură dintre structura

de date şi structura de metadate. Iată cum se face această legătură: se ştie că pentru fiecare

membru al fiecărei dimensiuni există o coloană (1 bit) în tabele bitmap pentru fiecare înregistrare

există un rând în acelaşi tabel în care se stochează 1 în dreptul biţilor asociaţi membrilor

dimensiunii existente în înregistrare. Datorită acestui procedeu, câmpul respectiv nu trebuie

stocat în înregistrare, iar structura datelor este redusă la un minim necesar. Din tabelul de măsuri

se vor putea selecta acele înregistrări care au un bit 1 în poziţia corespunzătoare biţilor 1 din

mască. Un inconvenient al tabelelor bitmap este acela că ele sunt greu de obţinut, iar apariţia

unor noi membri sunt greu de inserat în poziţia corespunzătoare. Procesul de refacere a unui

tabel bitmap este mare consumator de timp având în vedere că tabelul de fapte din depozit (care

se va transforma în baza multidimensională) poate avea un număr imens de înregistrări.

Masca de interogare se obţine prin exploatarea structurii ierarhice a metadatelor de unde

se pot extrage seturi de membri pentru dimensiunile desemnate prin specificatorii de axe.

Adresarea tabelului de măsuri se face în mod direct pe baza unui set de adrese de înregistrări

care se suprapun cu tiparul măştii. Din tabel se preiau în această manieră valorile care se

centralizează pentru celula cubului cu dimensiunile sale.

Se poate afirma că structura metadatelor este de tip ierarhic, fiecare dimensiune fiind

stocată într-o structură arborescentă cu o singură rădăcină (all) şi cu o multitudine de ramuri care

pot conţine frunze comune (ierarhii alternative). Orice nivel al unei ierarhii poartă un nume şi

conţine un set de membri. De altfel şi ierarhiile alternative poartă un nume pentru a putea fi

distinse. Structura în care sunt stocate datele este o structură cu acces direct prin tabele bitmap

exploatate prin măşti.

3.6.4. Operaţii OLAP asupra hipercubului

Un hipercub este proiectat astfel încât el să aibă în vedere nivelul de detaliu necesar în

procesul de analiză. Nivelul de detaliu (granularitatea) reprezintă numărul de membri ai unei

dimensiuni. Datele pot fi vizualizate printr-o selecţie în hipercub pe baza unui criteriu ierarhic

care ar putea fi de exemplu structura organizaţională pe care o conduce un anumit manager. Dacă

de la pornire, granularitatea este prea mare, datele vor fi mult prea centralizate şi nu se va putea

face decât o analiză grosieră. Ajustarea nivelului de granularitate este realizată de OLAP prin

exploatarea ierarhiilor dimensiunilor prin comasări şi descompuneri ale măsurilor prin proceduri

care poartă numele de roll-up şi drill-down. Prin intermediul acestor proceduri se face o

deplasare a proiecţiei cubului în sus sau jos pe nivelele ierarhice ale fiecărei dimensiuni (zoom

in; zoom out), executând de fiecare dată centralizări ale măsurilor stocate la cea mai mică

granularitate după criterii ierarhice stabilite în prealabil.

Este stabilit un nivel de granularitate iniţial sub care nu se poate coborî. Din acest motiv

este important ca dimensiunile de bază să fie cât mai rafinate sau să se creeze Data Marts unde

hipercuburile sunt proiectate la nivelul de detaliu stabilit de managementul operaţional. Pentru

managementul superior se va construi un depozit cu hipercuburi centralizatoare cu granularitate

mare. Prin drill-down se obţin detalii, iar prin roll-up se obţin date sintetice.

Page 64: SISTEME INFORMATICE PENTRU ASISTAREA DECIZIEI (SIAD) · Sistemele informatice pentru asistarea deciziei, SIAD – implică folosirea elementelor aplicative din discipline diverse

Un alt grup de operaţii oferit de OLAP este secţionarea (slicing) şi defalcarea (dicing).

Prin secţionare, se creează posibilitatea selectării prin vizualizare doar pentru un membru al unei

dimensiuni, adică un plan din cubul tridimensional. Secţiunea astfel obţinută va apare ca un tabel

pilot cu valorile dimensiunilor pe laturi şi cu specificarea valorii alese pentru dimensiunea

suprimată. Defalcarea (dicing) este operaţia de proiectare a unei dimensiuni pe o alta. De obicei

o dimensiune din primul plan este combinată cu o altă dimensiune din adâncime. Acest proces se

mai numeşte imbricarea dimensiunilor.

Dimensiunile unui cub pot fi private sau pot fi utilizate în comun şi de alte cuburi (ele

provin din depozitele cu schema de tip constelaţie). Proiectarea structurilor depozitelor de date şi

a cuburilor OLAP este un proces ce se desfăşoară continuu pe tot parcursul existenţei (vieţii)

aplicaţiei, dimensiunile cuburilor fiind în strânsă dependenţă cu detaliile activităţii structurate.

Aplicaţiile construite cu tehnologia OLAP îşi găsesc locul în multiplele domenii ale

activităţii întreprinderilor, de la finanţe, bănci, marketing până la producţie şi vânzări. De

exemplu, activitatea de producţie poate fi susţinută de aplicaţii OLAP cum sunt: planificarea

operaţiilor, controlul calităţii produselor, analiza rebuturilor, analiza optimizării raportului dintre

cost-beneficii.

OLAP, utilizând tehnici inteligente de optimizare, beneficiază de avantajul timpului de

răspuns mic.

3.7. Aplicaţie privind analiza datelor cu Microsoft OLAP

3.7.1. Analiza problemei de rezolvat

O societate comercială îşi propune să analizeze, cu tehnica OLAP, datele referitoare la

gestionarea mijloacelor fixe. Gestiunea mijloacelor fixe ale societăţii este realizată într-o bază

de date relaţională, MIFIX (bază de date operaţională). Datele operaţionale sunt curăţate,

transformate, consolidate şi selectate după criterii prestabilite, după care sunt memorate într-un

depozit de date, denumit MIFIX. Tabelul de fapte al depozitului de date se referă la

componentele gestiunii - mişcarea mijloacelor fixe (intrare mijloc fix sau ieşire mijloc fix) şi

calculul amortizărilor. Cu ajutorul aplicaţiei informatice se vor realiza, după analiza datelor cu

cubul OLAP, rapoarte diverse (de exemplu, Situaţia mijloacelor fixe la data de ..., Situaţia

amortizărilor mijloacelor fixe în luna..., ).

Se reaminteşte faptul că mijloacele fixe se amortizează începând cu luna următoare

punerii în funcţiune (data calendaristică este specificată în procesul verbal de punere în

funcţiune a mijlocului fix). Rata lunară de amortizare se calculează în funcţie de regimul de

amortizare fixat pentru fiecare tip de mijloc fix prin reglementările legale în vigoare la data

efectuării operaţiunii. Această rată lunară de amortizare se calculează prin aplicarea cotelor de

amortizare asupra valorii iniţiale (de intrare) a mijloacelor fixe şi se include în cheltuielile de

exploatare. Atunci când se execută modernizări (adăugare de valoare) asupra unui anumit mijloc

fix, rata de amortizare lunară se modifică prin adăugarea valorii acestor modernizări. Legea de

amortizare aplicată poate să fie liniară (sume fixe, proporţionale cu numărul de ani ai ciclului de

viaţă normat sau duratei normale de utilizare a mijlocului fix) sau degresivă (cotele de

amortizare liniară sunt multiplicate cu coeficientul k ce este funcţie de durata normală de

utilizare a mijlocului fix).

Page 65: SISTEME INFORMATICE PENTRU ASISTAREA DECIZIEI (SIAD) · Sistemele informatice pentru asistarea deciziei, SIAD – implică folosirea elementelor aplicative din discipline diverse

3.7.2. Definirea schemei bazei de date multidimensionale

Cubul OLAP este o structură multidimensională de date care se defineşte printr-o

mulţime de dimensiuni şi măsuri. Accesul la date este realizat prin intermediul interogărilor şi

prin accesul utilizatorului la ierarhiile de date. Datele cubului sunt stocate într-o structură de date

multidimensională. Cubul poate fi realizat cu Cube Wizard sau cu Cube Editor. Schema cubului

conţine o tabelă de fapte şi cel puţin o dimensiune.

Analiza de tipul OLAP are la bază schema multidimensională definită încă de la

construirea cubului. Sunt necesare definirea sursei de date, a tabelului de fapte (cu măsuri de tip

coloană numerică şi nivel de detaliere) şi a dimensiunilor. O măsură apare ca rezultat al unor

combinaţii între mai multe coloane, sub forma unor expresii.

Definirea modului în care este memorat cubul OLAP se poate realiza cu General tab prin

intermediul casetei de dialog Storage Options din BIDS. Opţiunile de memorare sunt MOLAP

(se memorează atât datele cât şi agregările în structuri multidimensionale), ROLAP (datele

rămân memorate în baza de date relaţională alături de memorarea agregărilor) şi HOLAP (datele

rămân memorate în baza de date relaţională, iar agregările sunt memorate în structurile

multidimensionale).

Crearea bazei de date tranzacţionale în Microsoft SQL Server 2005

Datele referitoare la gestiunea mijloacelor fixe sunt stocate într-o bază de date

tranzacţională ce stă la baza construirii cuburilor de date. Datele sunt organizate în tabele care

corespund dimensiunilor, ierarhiilor şi tabelelor de fapte ale cuburilor multidimensionale.

Această bază de date tranzacţională este denumită MIFIX şi conţine următoarele tabele

(fig. 3.5):

• Dbo.fapte_miscare_MF– conţine faptele referitoare la mişcarea mijloacelor fixe (intrări

şi ieşiri), precum şi la valoarea de inventar şi amortizarea acestora.

• Dbo.PV_intrare – conţine date referitoare la intrarea mijloacelor fixe;

• Dbo.PV_iesire – conţine date referitoare la ieşirea mijloacelor fixe;

• Dbo.Gestionari - conţine date cu privire la identificarea gestionarilor care răspund de

mijloace fixe;

• Dbo.Timp - datele conţinute în acest tabel reprezintă perioadele de timp de manipulare a

mijloacelor fixe; pe baza acestor date se realizează dimensiunea Timp cu următoarea ierarhie: an,

luna, trimestru, sezon.

Page 66: SISTEME INFORMATICE PENTRU ASISTAREA DECIZIEI (SIAD) · Sistemele informatice pentru asistarea deciziei, SIAD – implică folosirea elementelor aplicative din discipline diverse

Fig.3.5 Structura bazei de date MIFIX realizată în Microsoft SQL Server 2005

În crearea şi dezvoltarea depozitelor de date (Data Warehouse) pe Microsoft SQL Server

2005, se folosesc, în principal, următoarele componente:

a) Business Intelligence Development Studio, pentru dezvoltarea de proiecte de

Analysis Services;

b) SQL Server Management Studio, pentru gestionarea proiectelor de Analysis

Services.

4. DATA MINING – TEHNOLOGII DEDICATE EXTRAGERII

CUNOŞTINŢELOR DIN DATE

4.1. Problematica generală

Data Mining este rezultatul firesc al evoluţiei tehnologiilor informaţiei şi ale

comunicaţiilor (IT&C) determinat de creşterea volumului de date produs de societatea umană

pentru desfăşurarea activităţilor sale, urmată de nevoia iminentă de transformare a datelor

respective în informaţii şi cunoştinţe utile în aplicaţii din gama analizei şi controlului producţiei,

Page 67: SISTEME INFORMATICE PENTRU ASISTAREA DECIZIEI (SIAD) · Sistemele informatice pentru asistarea deciziei, SIAD – implică folosirea elementelor aplicative din discipline diverse

analizei de piaţă, detectării fraudei, explorărilor ştiinţifice etc. În acest context, industria

sistemelor informatice cu baze de date a evoluat în direcţia dezvoltării următoarelor

funcţionalităţi1: sisteme cu baze de date avansate, analiza avansată a datelor (Data Warehousing

şi Data Mining) şi baze de date bazate pe Web.

Condiţia esenţială pentru dezvoltarea mecanismelor profesionale de stocare, de regăsire şi

de tranzacţionare a datelor o reprezintă dezvoltarea colecţiilor de date şi a mecanismelor de

creare a bazelor de date, fără de care analiza avansată a datelor este practic imposibilă. Bazele de

date şi tehnologia informaţiei au evoluat sistematic, de la sisteme simple de procesare a

colecţiilor de date la sisteme cu baze de date puternice şi sofisticate, care oferă utilizatorilor

accesul direct la datele stocate, lucru convenabil şi foarte avantajos. Metodele eficiente utilizate

pentru procesarea on-line a tranzacţiilor de date, OLTP (On-Line Transaction Processing) au

contribuit semnificativ la evoluţia şi acceptarea tehnologiei bazelor de date relaţionale ca

instrument de stocare eficientă, de regăsire şi de management al cantităţilor mari de date.

Începând din 1990 tehnologia bazelor de date relaţionale a fost unanim acceptată, iar

activităţile de cercetare în domeniu au fost canalizate către sisteme cu bază de date mai

puternice şi mai eficiente, dezvoltate în jurul unor modele avansate de date care au creat

posibilitatea de realizare a aplicaţiilor orientate pe rezolvarea problemelor. Totodată, s-au

obţinut rezultate spectaculoase legate de distribuţia, diversificarea şi partajarea datelor, care au

contribuit la dezvoltarea sistemelor de informaţii globale, bazate pe Internet, ca de exemplu

WWW.

Pe de altă parte, progresul în domeniul tehnologiei digitale a condus la apariţia unor

calculatoare puternice, a echipamentelor de colectare a datelor şi a mediilor de stocare în masă

care reprezintă suportul fizic, atât pentru bazele de date de informaţii şi de cunoştinţe, cât şi

pentru aplicaţiile care le gestionează. Şi împreună, ansamblul hardware- software şi de

comunicaţii, cunoscut sub denumirea generică de tehnologiile informaţiei şi ale comunicaţiilor,

IT&C (Information Technology and Communications), face posibilă analiza cantităţilor uriaşe de

informaţii şi de date, stocate în diferitele tipuri de baze de date şi în depozite de informaţii, în

vederea regăsiri cunoştinţelor şi informaţiilor utile.

O arhitectură de depozit de date a condus la data warehouse, un depozit de surse multiple

de date heterogene organizat unitar, cu scopul de a uşura asistarea informatizată a deciziei.

Tehnologia data warehouse include ştergerea datelor, integrarea datelor şi procesarea analitică

on- line (On- Line Analytical Processing- OLAP), precum şi posibilitatea de vizualizare a datelor

şi informaţiilor. Deşi instrumentele OLAP suportă analiza multidimensională şi formularea

deciziilor, volumele imense de date crează nevoia unor instrumente de analiză efectivă şi

eficientă a datelor respective mai în detaliu, ca de exemplu clasificarea, gruparea şi

caracterizarea datelor care variază în timp.

Creşterea rapidă şi continuă a volumelor de date, care a depăşit capacitatea umană de a le

interpreta, a impus apariţia şi utilizarea instrumentelor data mining pentru extragerea

informaţiilor şi cunoştinţelor utile din cantităţile enorme de date colectate şi stocate în depozite

de date de dimensiuni mari şi foarte mari.

În esenţa lor, instrumentele data mining realizează analiza datelor şi pun în evidenţă

modele de date importante pentru stabilirea direcţiilor de evoluţie a diferitelor domenii de

activitate (economic, ştiinţific, medical, educaţional etc.) pe care le desfăşoară organismele

economice pentru a- şi atinge obiecticele specificate în documentele de constituire.

1 Han, J., Kamber, M. - Data Mining- Concepts and Technique, Second Edition, Morgan Kaufmann Publishers,

USA, San Francisco CA 2006.

Page 68: SISTEME INFORMATICE PENTRU ASISTAREA DECIZIEI (SIAD) · Sistemele informatice pentru asistarea deciziei, SIAD – implică folosirea elementelor aplicative din discipline diverse

Existenţa unor volume imense de date a pus problema reorientării utilizării lor de la un

proces de exploatare retrospectiv către unul prospectiv. Data Mining poate avea mai multe

definiţii, însă toate converg în esenţă către miezul problemei şi anume că acest concept

reprezintă un proces de extragere de informaţii noi din colecţiile de date existente. Termenul de

dată are semnificaţia de descriere a unui eveniment bine determinat care se produce în lumea

reală şi este perfect verificabil. Prin tehnologia Data Mining se prelucrează date care referă

perioade anterioare (date istorice), care sunt examinate şi sunt deja cunoscute, pe baza lor

constituindu-se un model sau şablon. Acest model sau şablon va putea fi aplicat situaţiilor noi de

acelaşi tip cu cele deja cunoscute. Informaţiile care se pot obţine prin Data Mining sunt

predictive sau descriptive. De exemplu direcţionarea acţiunilor de marketing pot constitui o

problemă tipică predictivă.1 Detectarea fraudelor produse cu carduri bancare reprezintă o

problemă tipică de aplicaţie descriptivă.

Dezvoltarea tehnicilor de Data Mining se explică prin acumularea de volume imense de

date pe care organizaţiile economice le-au derulat de-a lungul anilor. De asemenea, concurenţa

tot mai acerbă precum şi creşterea exigenţelor pieţei au determinat firmele să ia tot mai mult în

considerare potenţialul uriaş pe care îl oferă arhivele de date. Alături de arhivele de date

memorate pe suporturi informatice mai există încă doi factori care au dus la necesitatea Data

Mining: existenţa şi perfecţionarea algoritmilor şi a produselor-program dedicate precum şi

creşterea capacităţii de memorare şi prelucrare a calculatoarelor electronice care permit tratarea

corelativă a volumelor mari de date.

Este de remarcat că depozitele de date pot fi surse pentru Data Mining, iar rezultatele

obţinute pot completa câmpurile înregistrărilor din depozitele de date, care apoi pot fi

valorificate prin proiecţiile multidimensionale specifice OLAP.

Potenţialul oferit de Data Mining se încorporează în procesele comerciale ale firmelor,

iar căutarea informaţiilor şi cunoştinţelor nu devine un scop în sine ci este utilă doar dacă este

transformată ca acţiune. Astfel firmele pot alege să reacţioneze sau nu la situaţiile diverse create

de realitate (diminuarea numărului de clienţi, scăderea vânzărilor, pierderea unor pieţe de

desfacere etc.). Pasul următor după această alegere este exploatarea propriu-zisă a datelor

utilizând diverşi algoritmi. De multe ori, acţiunea de Data Mining poate fi un eşec şi nu o reuşită,

fiind posibil ca măsurile luate să nu fie adecvate informaţiilor obţinute.

Prin Data Mining, oamenii de afaceri reuşesc să se focalizeze mai bine pe cei mai buni

clienţi ai lor, să depisteze şi să prevină fraudele, să descopere caracteristicile de influenţă care

afectează cel mai mult indicatorii-cheie de performanţă, KPI (Key Performance Indicators) ai

afacerii, respectiv ai societăţii, să găsească informaţia ascunsă în baza de date/depozitul de date.

Cu ajutorul tehnicilor Data Mining, orice proces sau fenomen reflectat în bazele de date,

respectiv depozitele de date, constituie temă de analiză şi raportare în cadrul unei platforme

dedicate pentru cercetarea afacerilor, BI (Business Intelligence), impropriu dar sugestiv tradusă

în unele lucrări româneşti sub denumirea de „inteligenţa afacerilor”.

Spre deosebire de tehnicile OLAP (abordate în capitolul anterior) care abordau interogări

şi raportări standard (care sunt clienţii cei mai valoroşi, care produse s-au vândut cel mai mult

sau care sunt zonele de costuri cele mai ridicate), tehnicile Data Mining explorează volumele

foarte mari de date heterogene cu scopul de a previziona, a înţelege şi de a dezvolta noi abordări

1 Zaharie D, Albescu F, colectiv – Operă citată

Page 69: SISTEME INFORMATICE PENTRU ASISTAREA DECIZIEI (SIAD) · Sistemele informatice pentru asistarea deciziei, SIAD – implică folosirea elementelor aplicative din discipline diverse

asupra problematicii supuse soluţionării. Pe piaţa actuală extrem de competitivă, companiile

trebuie să-şi administreze şi să exploateze cu eficienţă cele mai valoroase active (assets) şi

depozite de date (Data Warehouse), cu precădere informaţia valoroasă ascunsă în aceste

depozite.

Instrumentele tradiţionale de cercetare a afacerilor – rapoarte, interogări şi raportări

interactive – permiteau sintetizarea a ceea ce s-a întâmplat în trecut, aspecte reflectate de datele

istorice ale companiei şi de unele date curente. Prin tehnica OLAP se obţin analize asupra unor

tendinţe, bazate în special pe rezumate, comparări, analize şi previziuni ce au la bază valori

medii, sume şi grupări de date prin agregare. Prin Data Mining se adânceşte explorarea

depozitelor de date prin descoperirea informaţiei ascunse cu ajutorul şabloanelor (patterns),

factorilor de influenţă, clusterelor, profilelor şi predicţiilor aplicate volumului mare de date. De

exemplu, prin analiza profilurilor celor mai buni clienţi actuali, prin Data Mining se pot construi

modele şi aplicaţii integratoare destinate identificării clienţilor care au cele mai mari şanse să

devină performanţi în viitor, cu toate că, în prezent, nu fac parte din portofoliul cu cei mai buni

clienţi ai companiei. Managerii organizaţiilor economice lucrează astfel, în deciziile lor, cu

„valoarea strategică” a clienţilor actuali prin care se previzionează însăşi viitorul afacerii.

Toate elementele considerate anterior conduc spre ideea de ciclu în utilizarea Data

Mining în cursul căruia sunt patru etape:

• definirea oportunităţilor comerciale şi a datelor pe care se face exploatarea;

• obţinerea de informaţi şi cunoştinţe din colecţiile de date existente prin tehnici Data

Mining;

• adoptarea deciziilor şi acţiunilor în urma informaţiilor rezultate;

• cuantificarea cât mai corectă a rezultatelor concrete pentru a identifica şi alte căi de

exploatare a datelor.

4.2. Definirea conceptului Data Mining

Aşa cum s-a arătat deja în paragraful precedent, conceptul Data Mining („mineritul

datelor”) defineşte procesul de descoperire a modelelor de cunoştinţe şi/sau informaţii utile

dintr-o cantitate mare de date, colectate şi stocate în diferite tipuri de depozite de date (baze de

date, Data Warehouses, WWW etc.), în vederea folosirii lor pentru fundamentarea deciziilor

manageriale pe toate nivelele de competenţă din cadrul unei organizaţii economice. În literatura

de specialitate modelele de cunoştinţe şi/sau de informaţii obţinute ca rezultat al desfăşurării unui

proces Data Mining sunt denumite, mai simplu, modele de cunoştinţe, pornind de la definiţiile

conceptelor informaţie (care exprimă elementele din realitatea înconjurătoare în momentul în

care sunt percepute pentru prima dată de utilizator, adică atunci când au caracter de noutate, de

ştire), cunoştinţă (care desemnează informaţia relevantă, informaţie cu înţeles şi informaţie care

acţionează1, pentru un domeniu de interes, după momentul aflării acestei informaţii) şi dată (care

desemnează informaţia sau cunoştinţa înregistrată în vederea evidenţei, prelucrării şi/sau

analizei).

Data Mining este o expresie improprie care asociază într-un mod foarte sugestiv

procesul de descoperire2(căutare şi găsire) a cunoştinţelor dintr-o cantitate mare de date cu

1 Mihai Drăgănescu, Societatea Informaţională – Societatea cunoaşterii, www.academiaromana.ro,

Studii tematice. 2 www.dexonline.ro - DEX online: Dicţionar explicativ al limbii române.

Page 70: SISTEME INFORMATICE PENTRU ASISTAREA DECIZIEI (SIAD) · Sistemele informatice pentru asistarea deciziei, SIAD – implică folosirea elementelor aplicative din discipline diverse

procesul de extragere a mineralelor din roci, spre a-l face mai uşor de înţeles. Această asociere

se bazează pe faptul că ambele procese, în realitate foarte diferite deoarece materia primă folosită

este de natură diferită (dată-cunoştinţă şi rocă-mineral), sunt procese de extracţie care constau

primul în extragerea cunoştinţelor utile din cantităţi mari de date, iar al doilea în extragerea de

minerale din cantităţi mari de roci (procesul clasic de exploatare minieră, denumit pe scurt

minerit). Practic, cantităţile enorme de date disponibile, care conţin cunoştinţe utile în procesul

decizional, sunt asemănate cu rocile scoarţei terestre, care conţin substanţe minerale necesare în

procesul industrial, în timp ce cunoştinţele necesare procesului decizional, care se extrag din

depozitele de date, sunt asemănate cu mineralele care se extrag din rocile respective. Ca urmare a

acestei similitudini, denumirea cea mai adecvată pentru procesul de descoperire a cunoştinţelor

dintr-o cantitate mare de date este exploatarea cunoştinţelor din date (Knowledge Mining from

Data), o expresie mai lungă şi mai puţin sugestivă. Pentru desemnarea procesului respectiv se

pot folosi şi alte expresii, cu semnificaţie similară sau uşor diferită de Data Mining, ca de

exemplu extragerea cunoştinţelor (knowledge extraction), analiza datelor/modelelor (data/

pattern analysis) sau arheologia datelor (data archaeology). Dintre toate acestea, cea mai uzuală

expresie este Data Mining, fiind cea mai scurtă şi cea mai sugestivă datorită asocierii implicite

cu procesul clasic de minerit, vechi de sute de ani, înţeles în esenţa sa chiar şi de către

nespecialiştii în domeniu minier.

Expresia Data Mining este sinonimă cu expresia descoperirea cunoştinţelor din date,

KDD (Knowledge Discovery from Data) ce este uzual folosită în literatura de specialitate prin

abrevierea sa KDD, care face să-şi piardă semnificaţia implicită, motiv pentru care se preferă

utilizarea primei expresii (Data Mining) pentru a desemna procesul de descoperire a

cunoştinţelor din cantităţile mari de date stocate în depozitele de date disponibile.

În realitate, procesul de descoperite a cunoştinţelor din cantităţi mari de date este un

proces complex format, în principal, din următoarele procese mai simple, care se succed din

punct de vedere cronologic (fig. 4.1)1:

1. curăţirea datelor (data cleaning): înlăturarea datelor inutile şi a celor inconsistente;

2. integrarea datelor (data integration): combinerea datelor provenite de la mai multe surse

de date diferite;

3. selectarea datelor (data selection): extragerea datelor relevante pentru analiză din

depozitele de date disponibile (baze de date, data warehouses, WWW etc.);

4. transformarea datelor (data transformation): punerea datelor în formate unitare,

corespunzătoare pentru mining (analiza în vederea descoperirii de cunoştinţe) prin

realizarea unor operaţii rezumative şi/sau de agregare (de unificare);

5. “mineritul datelor” (Data Mining): extragerea unor modele de date aplicând asupra

datelor rezultate după parcurgerea etapelor anterioare metode inteligente, denumite

generic metode Data Mining; acest proces este esenţial pentru descoperirea cunoştinţelor

utile “ascunse” în depozitele de date;

6. evaluarea modelelor (pattern evaluation): evaluarea modelelor de date extrase pentru

identificarea celor care reprezintă cunoştinţele care interesează în mod real;

7. prezentarea cunoştinţelor (knowledge presentation): prezentarea cunoştinţelor astfel

obţinute utilizatorilor lor, prin folosirea unor tehnici de vizualizare şi de reprezentare

adecvate.

1 Han, J., Op.cit.

Page 71: SISTEME INFORMATICE PENTRU ASISTAREA DECIZIEI (SIAD) · Sistemele informatice pentru asistarea deciziei, SIAD – implică folosirea elementelor aplicative din discipline diverse

În mod uzual, datele rezultate din procesele de curăţire şi integrare sunt stocate în Data

Warehouses, caz în care transformarea şi unificarea lor se realizează înainte de procesul de

selecţie. Pentru a obţine o reprezentare mai „mică” a datelor originale poate fi realizată şi

reducerea datelor (data reduction), fără a le afecta integritatea datelor.

Procesul Data Mining interacţionează cu utilizatorul prin baza de cunoştinţe destinată

acestuia, dintre modelele de date descoperite, cele cu importanţă pentru utilizator reprezentând,

de fapt, cunoştinţe noi care se stochează în baza de cunoştinţe spre a-i fi prezentate.

Procesul Data Mining este o parte esenţială a procesului de descoperire a cunoştinţelor

din date deoarece descoperă modelele de date “ascunse” pentru a fi evaluate, în conformitate cu

cerinţele utilizatorilor.

Din punctul de vedere al funcţionalităţii sale, Data Mining este procesul de descoperire a

cunoştinţelor care interesează dintr-o cantitate mare de date stocată în baze de date, Data

Warehouses sau în alte tipuri de depozite de date.

Privit din perspectiva depozitului de date - Data Warehouse, procesul Data Mining

reprezintă un stadiu avansat de procesare analitică on-line (OLAP). Data Mining depăşeşte însă

procesul analitic limitat, de tip rezumativ, al sistemelor Data Warehouse prin tehnicile specifice

de analiză a datelor, mult mai avansate.

Fig. 4.1. Data Mining- parte a procesului de descoperire a cunoştinţelor

Data

Warehouse

MODELE

DE DATE

curăţire şi integrare

selecţie, transformare

şi eventual reducere

Data Mining (mineritul datelor):

se extrag o parte din date

evaluare modele şi prezentare

cunoştinţe

UTILITATOR

pentru

Database Database Database

Page 72: SISTEME INFORMATICE PENTRU ASISTAREA DECIZIEI (SIAD) · Sistemele informatice pentru asistarea deciziei, SIAD – implică folosirea elementelor aplicative din discipline diverse

Data Mining implică o integrare de tehnici din mai multe domenii. Practic, Data Mining

reprezintă un domeniu interdisciplinar, principalele discipline cu care se intersectează fiind cele

cuprinse generic sub denumirea de Tehnologia Bazelor de Date - Databases (DB), Tehnologia

depozitelor de date - Data Warehouse (DW), Tehnologia Digitală, Tehnologiile Informaţiei şi

ale Comunicaţiilor (IT&C) şi Statistică (fig. 4.2).

Cunoştinţele şi informaţiile descoperite în procesul data mining se folosesc în formularea

deciziilor, în controlul unui proces economic sau industrial, în managementul informaţiei etc.

Tehnicile de Data Mining se pot aplica atât ascendent cât şi descendent. Pentru

abordarea descendentă se iau în considerare ipotezele formulate în prealabil prin alte mijloace.

Abordarea ascendentă urmăreşte extragerea de cunoştinţe sau informaţii noi din date disponibile,

această căutare putând fi dirijată sau nedirijată. Căutarea dirijată presupune că se ia în

considerare un atribut sau un câmp, ale cărui valori se explică prin celelalte câmpuri. Căutarea

nedirijată identifică relaţiile sau structurile din datele examinate fără a asigura prioritate unui

câmp sau a altuia. Ceea ce se exploatează prin Data Mining sunt colecţii de date constituite

pentru alte scopuri (exemplu tranzacţii derulate pe o perioadă de timp). Deseori la acest tip de

date se adaugă şi cele provenite din alte surse cum statistici oficiale care privesc evoluţia în

ansamblu a economiei, date privind concurenţa sau măsuri legislative. De aceea se foloseşte tot

mai des noţiunea de informaţie ascunsă în sensul că este aproape imposibilă detectarea

corelaţiilor sau raporturile pe care datele le încorporează în mod intrinsec. Rezultatea obţinute

sunt cu atât mai relevante cu cât ele se bazează pe un volum mare de date. Datele pot fi

exploatate pentru a obţine informaţii prin diverse tehnici cum sunt: reţele neuronale, arbori de

decizie, algoritmi genetici, analiza grupurilor, raţionamente bazate pe cazuri, analiza legăturilor.

Aceste tehnici pot fi asociate cu tehnici statistice cum sunt regresiile sau analiza factorială.

Data Mining nu este capabilă, ca tehnică, să rezolve orice problemă de gestiune. De fapt

ceea ce poate oferi se rezumă la câteva acţiuni cum sunt: clasificarea, estimarea, predicţia,

Fig. 4.2. Principalele domenii (discipline) care se

intersectează cu domeniul Data Mining

Tehnologiile Bazelor de Date

(DB) şi Data

Warehouses

(DW)

Statistică

Alte domenii

Tehnologia

Data Mining

Tehnologia

Digitală şi

IT&C

Calculatoare

Machine

learning Reţele

neurale

Modelarea

datelor

Vizualizarea

datelor

Regăsirea

informaţiilor

or

Analiza

datelor

Procesarea

imaginilor

Page 73: SISTEME INFORMATICE PENTRU ASISTAREA DECIZIEI (SIAD) · Sistemele informatice pentru asistarea deciziei, SIAD – implică folosirea elementelor aplicative din discipline diverse

gruparea, analiza grupărilor, care folosite la locul potrivit pot deveni utile pentru o mulţime de

probleme din domeniul decizional18.

Herb Edelstein de la Two Crows Corporation defineşte Data Mining ca un ansamblu de

tehnici de descoperire a şabloanelor ascunse (hidden patterns) şi a relaţiilor existente între date

cu scopul de a asista luarea celor mai bune decizii în afaceri.

Clasificarea are ca scop plasarea obiectelor prelucrate într-un grup limitat de clase

predefinite. De exemplu, vânzarea unui produs nou se poate încadra într-una din următoarele

categorii de risc: scăzut, mediu, ridicat. Obţinute în mod clasificat vor fi reprezentate sub formă

de înregistrări care la rândul lor sunt compuse din atribute sau câmpuri. Ca tehnici de Data

Mining pentru clasificare sunt arborii de decizie şi raţionamentul bazat pe cazuri.

Estimarea va atribui o valoare unei variabile pe baza celorlalte date de intrare.

Rezultatele obţinute în urma estimării sunt valori continue. Pentru acest tip de prelucrări se pot

utiliza reţelele neuronale.

Predicţia poate clasa înregistrările luate în considerare în funcţie de un anumit

comportament sau o valoare viitoare estimată. De aceea se va recurge la o colecţie de exemple

care vizează date din trecut, în care valorile variabilei de previzionat sunt deja cunoscute. Cu

ajutorul lor se va construi un model care va putea explica comportamentul observat. Aplicând

acest model înregistrărilor care fac obiectul prelucrării, se va obţine o predicţie a

comportamentului sau a valorilor acestora în viitor.

Gruparea poate duce la determinarea acelor obiecte care apar cel mai fecvent împreună.

Un exemplu este “analiza coşului gospodăriei” în evaluările statistice.

Analiza grupului urmăreşte o divizare a populaţiei eterogene în grupuri mai omogene

care poartă numele de clustere.

În această tehnică nu se pleacă de la un set predeterminat de clase şi nici din exemple din

trecut. Segmentarea pe grupuri se face în funcţie de similitudinile obiectelor.

4.3. Categorii de date care pot fi “minerite”

În principiu, procesul Data Mining poate fi aplicat asupra oricărui tip de depozit de date,

precum şi asupra fluxurilor de date („trecătoare”). Dintre acestea cele mai uzuale sunt:

• bazele de date relaţionale;

• bazele de date tranzacţionale;

• depozitele de date - Data Warehouses;

• bazele de date obiecturale;

• bazele de date în tehnologii avansate.

Tehnicile Data Mining pot fi comune sau diferite de la o categorie la altă categorie de

date, fiind determinate de caracteristicile specifice fiecăreia dintre aceste categorii.

4.4. Categorii de modele de date care pot fi “minerite”

În termeni generali, modelul reprezintă o simplificare a realităţii. Practic, descrierea

elementelor şi fenomenelor din realitatea înconjurătoare, reduse la caracteristicile lor esenţiale

pentru un anumit domeniu de activitate, defineşte un model.

18 Two Crows: Data Mining Glossary.

Page 74: SISTEME INFORMATICE PENTRU ASISTAREA DECIZIEI (SIAD) · Sistemele informatice pentru asistarea deciziei, SIAD – implică folosirea elementelor aplicative din discipline diverse

Modelarea este o tehnică general acceptată de specialiştii din toate domeniile de

activitate. Se construiesc modele arhitecturale pentru a ajuta utilizatorii lor să vizualizeze

clădirile. Se construiesc modele matematice pentru a analiza traiectoria navetelor spaţiale în

cosmos sau tendinţele de evoluţie a pieţei. În era comunicaţiilor digitale şi a internet- ului, se

construiesc modele software care conduc la realizarea unor sisteme informatice flexibile, uşor

adaptabile la schimbările rapide de tehnologice şi la cerinţele utilizatorilor, mereu în creştere.

După cum, se construiesc modele de date pentru a descoperi cunoştinţele “ascunse” în depozitele

de date, utile în fundamentarea deciziilor manageriale strategice şi de perspectivă.

Extragerea modelelor de date, aplicând asupra datelor stocate în baze de date, data

warehouse sau în orice alt tip de depozit de date tehnici inteligente (avansate) de analiză,

denumite generic tehnici data mining, este un proces laborios denumit, în mod uzual, proces

data mining sau, pe româneşte, proces de “minerit”, prin similitudine cu procesul clasic de

minerit care urmăreşte extragerea minereurilor din roci. În acest context, se spune, în mod uzual,

că modelele de date care pot fi extrase printr-un proces de “minerit” sunt “minate”, adică

sunt căutate şi extrase din datele stocate în depozitele de date ale utilizatorului, aşa cum sunt

căutate şi extrase minereurile din roci.

Modelele de date care pot fi “minerite” sunt grupate pe categorii determinate de funcţiile

sistemului Data Mining, denumite pe scurt funcţii Data Mining, care urmăresc extragerea

modelelor de date din datele utilizatorului stocate în depozite de date. Pentru îndeplinirea

(realizarea) funcţiilor sale, sistemul Data Mining execută sarcini specifice, denumite în mod

uzual sarcini Data Mining, care au ca rezultat modele de date care pot fi “minerite” de

utilizator.

O sarcină Data Mining se defineşte ca fiind o activitate sau un set de activităţi care se

execută pentru îndeplinirea sau realizarea unei funcţii a sistemului Data Mining. Practic, sarcina

Data Mining reprezintă partea procesului Data Mining care se desfăşoară pentru îndeplinirea

unei funcţii Data Mining. La modul general, sarcinile Data Mining pot fi clasificate în două mari

categorii:

- sarcini descriptive, cele care descriu caracteristicile generale ale datelor stocate

în baza de date, Data Warehouse sau în orce alt tip de deposit de date;

- sarcini predictive, cele care realizează deduceri de date din datele curente cu

scopul de a face previziuni, determinând tendinţele de evoluţie ale acestora.

Principalele funcţii Data Mining, sarcinile Data Mining care trebuie executate pentru

realizarea lor şi categoriile de modele Data Mining care se pot obţine ca rezultat, sunt

următoarele:

- descriere clasă/concept este funcţia sistemului Data Mining realizată prin

executarea sarcinilor Data Mining - caracterizare date şi discriminare date care au

ca rezultat un model Data Mining de tip descriere, denumit în mod uzual descriere;

- “mineritul” modelelor frecvente este funcţia sistemului Data Mining realizată prin

executarea sarcinilor Data Mining asociaţie date şi corelaţie date care au ca rezultat

modele Data Mining frecvente;

- clasificarea şi predicţia, este funcţia sistemului Data Mining realizată prin

executarea sarcinilor Data Mining de clasificare date şi predicţie care au ca rezultat

modele Data Mining de clasificare (clasificator) şi predicţie (predictor);

- analiza grupurilor, este funcţia sistemului Data Mining realizată prin executarea

sarcinii Data Mining de grupare a datelor cu caracteristici representative

commune, care are ca rezultat un model Data Mining de grupare;

Page 75: SISTEME INFORMATICE PENTRU ASISTAREA DECIZIEI (SIAD) · Sistemele informatice pentru asistarea deciziei, SIAD – implică folosirea elementelor aplicative din discipline diverse

- analiza excepţiilor, este funcţia sistemului data mining realizată prin executarea

sarcinii Data Mining de analiză a excepţiilor care are ca rezultat un model Data

Mining al excepţiilor (date atipice);

- analiza evoluţiei, este funcţia sistemului Data Mining realizată prin executarea

sarcinii Data Mining de analiză a evoluţiei datelor care are ca rezultat un model

Data Mining tendinţelor de evoluţie (a datelor).

De cele mai multe ori, utilizatorii nu ştiu ce modele de date prezintă interes pentru ei şi

doresc să extragă mai multe categorii diferite de modele din datele stocate în depozitlele de date

la dispoziţia lor (baze de date, Data Warehouse etc.). De aceea, este important ca un sistem Data

Mining să poată “mineri” categorii variate de modele de date pentru a răspunde diverselor

aplicaţii şi/sau aşteptărilor diferiţilor utilizatori. Este important ca un sistem Data Mining să

permită extragerea de modele de date pe diferite nivele de abstracţie, corespunzătoare nivelelor

de detaliu solicitate de utilizatori. Şi este important ca un sistem Data Mining să accepte

sugestiile utilizatorilor pentru a direcţiona căutările către modelele de date care îi interesează.

4.4.1. Descriere clasă/concept

Într-un sistem Data Mining datele stocate în baze de date, Data Warehouse sau în orice

alt tip de depozit de date sunt grupate în clase sau asociate la concepte. Spre exemplu, datele

stocate în baza de date de evidenţă a producţiei organismului economic definit generic pot fi

grupate în două clase care conţin produse de categoria a I-a şi produse de categoria a II-a, iar

datele stocate în baza de date de evidenţă a clienţilor pot fi asociate conceptelor mariClienţi şi

bugetClienţi. După cum, datele stocate în baza de date de evidenţă a articolelor unui magazin de

tehnică de calcul pot fi grupate în şase clase care conţin calculatoare, imprimante, scannere,

camere video şi produse software, şi pot fi asociate conceptelor articolePentruCasa,

articoleProfesionale, articoleScumpe şi articoleCuPreţRedus.

Descrierea clasă/concept este funcţionalitatea sistemului Data Mining care se realizează

prin executarea următoarelor sarcini Data Mining:

- caracterizarea datelor, este sarcina Data Mining care constă în rezumarea datelor din clasa

analizată, denumită în mod uzual clasă-ţintă;

- discriminarea datelor, este sarcina Data Mining care constă în compararea datelor din clasa

ţintă cu datele dintr-una sau din mai multe clase de comparat;

- caracterizarea şi discriminarea datelor, este sarcina Data Mining care constă atât în

rezumarea datelor din clasa ţintă, cât şi în compararea acestora cu cu datele dintr-una sau din

mai multe clase de comparat.

Caracterizarea datelor este rezumarea, în termeni cât mai concişi şi mai precişi cu

putinţă, a caracteristicilor sau trăsăturilor generale, esenţiale, aferente datelor din clasa ţintă.

Datele din clasa ţintă, specificate de utilizator, se pot colecta, în mod tipic, printr-o interogare a

bazei de date (database query) în care sunt stocate. Spre exemplu, pentru caracterizarea

produselor fabricate de un organism economic ale căror vânzări au crescut cu mai mult 20% în

ultimul an, utilizatorul colectează datele de analizat prin executarea unei interogări (query) SQL

asupra bazei de date de evidenţă a vânzărilor.

Caracterizarea efectivă a datelor stocate într-o bază de date, Data Warehouse sau în orice

alt tip de depozit de date se realizează prin aplicarea următoarelor metode de analiză a datelor:

- rezumarea simplă a datelor, bazată pe măsurători statistice şi pe eşantionare;

Page 76: SISTEME INFORMATICE PENTRU ASISTAREA DECIZIEI (SIAD) · Sistemele informatice pentru asistarea deciziei, SIAD – implică folosirea elementelor aplicative din discipline diverse

- cubul de date, bazat pe operaţiile OLAP roll- up şi drill- down, care poate fi utilizat pentru

rezumarea datelor, proces controlat de utilizator, de-a lungul dimensiunilor specificate de

acesta;

- tehnica de inducţie orientată pe atribut, care poate fi utilizată pentru a realiza caracterizarea

şi generalizarea datelor fără interacţiunea directă a utilizatorului cu sistemul Data Mining.

Caracterizarea datelor, ca sarcină Data Mining descriptivă, are ca rezultat descoperirea

unui model Data Mining de tip descriere (denumit în mod uzual descriere), care poate fi

prezentat utilizatorului sub diferite forme denumite în mod uzual forme de caracterizare, cele

mai uzuale fiind diagramele, graficele, tabelele, cuburile de date, relaţiile generalizate sau

regulile de caracterizare.

Discriminarea datelor este comparaţia caracteristicilor generale, esenţiale, aferente

datelor din clasa ţintă cu caracteristicile generale, esenţiale, aferente datelor dintr-una sau mai

multe clase de comparat. Datele din clasele ţintă şi de comparat, specificate de utilizator, se pot

colecta, în mod tipic, prin interogarea bazei de date (database query) în care sunt stocate. De

exemplu, pentru compararea trăsăturilor generale ale studenţilor cu medie de promovare în anul

universitar anterior, cu trăsăturile generale ale studenţilor cu medie sub media de promovare în

aceeaşi perioadă de timp, utilizatorul poate colecta datele de analizat prin executarea unei

interogări (query) SQL asupra bazei de date de evidenţă a studenţilor.

Metodele de analiză a datelor, utilizate pentru discriminarea datelor stocate într-o bază de

date, Data Warehouse sau în orice alt tip de depozit de date, sunt similare celor utilizate pentru

caracterizarea datelor, şi anume:

- compararea simplă a datelor, bazată pe rezumarea acestora, obţinută prin măsurători

statistice şi de eşantionare efectuate asupra datelor din clasele ţintă şi de comparat;

- cubul de date, bazat pe operaţiile OLAP roll- up şi drill- down, care poate fi utilizat pentru

rezumarea şi compararea datelor prin controlul utilizatorului, de-a lungul dimensiunilor

specificate de acesta;

- tehnica de inducţie orientată pe atribut, care poate fi utilizată pentru a realiza discriminarea

şi generalizarea datelor fără interacţiunea directă a utilizatorului cu sistemul Data Mining.

Discriminarea datelor, ca sarcină Data Mining descriptivă, are ca rezultat descoperirea unui

model Data Mining de tip descriere (denumit în mod uzual descriere), care poate fi prezentat

utilizatorului sub aceleaşi forme ca şi modelul data mining rezultat prin caracterizarea datelor,

cu deosebirea că formele de prezentare obţinute în acest caz sunt denumite, în mod uzual, forme

de discriminare (grafice de discriminare, reguli de discriminare etc.) şi descrierile

discriminărilor pot conţine măsuri de comparaţie care ajută la deosebirea clasei ţintă de clasele

de comparat.

4.5. Sistemul Data Mining

Sistemul Data Mining este sistemul informatic format din ansamblul componentelor

hardware şi software care interacţionează şi comunică între ele pentru descoperirea (extragerea)

modelelor de date care reprezintă cunoştinţele ce interesează dintr-o cantitate mare de date

stocată în baze de date, Data Warehouses sau în alte tipuri de depozite de date. Altfel spus, este

sistemul informatic în cadrul căruia se desfăşoară procesul Data Mining.

Page 77: SISTEME INFORMATICE PENTRU ASISTAREA DECIZIEI (SIAD) · Sistemele informatice pentru asistarea deciziei, SIAD – implică folosirea elementelor aplicative din discipline diverse

4.5.1. Structura sistemului Data Mining

Structura sistemului Data Mining (model de principiu) reprezintă, prin definiţie, modul

de organizare internă a acestuia pentru îndeplinirea funcţiei sale: aplicarea tehnicilor Data

Mining asupra datelor stocate în baze de date, Data Warehouses sau în alte tipuri de depozite de

date, cu scopul de a descoperi modele de date care interesează în fundamentarea deciziilor

manageriale, proces denumit generic proces Data Mining (fig. 4.3).

Setul de date care trebuie “minerit”, tehnicile Data Mining şi modelele de date

descoperite în procesul Data Mining reprezintă componentele structurale ale sistemului Data

Mining.

Intrările sistemului Data Mining

Intrările sistemului Data Mining specifică sarcinile Data Mining care se execută pentru

îndeplinirea sau realizarea funcţiilor sistemului Data Mining de descoperire (extragere) a

modelelor de date ascunse în datele utilizatorului stocate în depozite de date, cel mai adesea de

tip bază de date sau depozit de date.

Intrările sistemului Data Mining sunt, prin definiţie, interogări Data Mining (Data

Mining query) deoarece se formulează sub formă de întrebări, fie folosind un limbaj de

interogare adecvat, fie cu asistenţa unei interfeţe grafice dedicate. Practic, fiecare întrebare

(query) se transformă pe durata procesului Data Mining într-un set de operaţii care definesc o

sarcină Data Mining ce se execută pentru îndeplinirea sau realizarea unei funcţii a sistemului

Data Mining.

O interogare Data Mining este formată din aşa numitele primitive Data Mining care, prin

definiţie, reprezintă elementele fundamentale (de bază) necesare pentru specificarea unei sarcini

Data Mining sub formă de interogare Data Mining. Acestea sunt:

- setul de date relevante pe sarcină Data Mining, care cuprinde specificaţiile datelor

“minerite” prin execuţia sarcinii Data Mining de către sistemul Data Mining;

cuprinde:

• denumirea depozitului de date (bază de date, data warehouse etc.) care stochează

datele care se “mineresc”;

• tabele bază de date sau cuburi data warehouse;

rezultă

asupra

căruia

se aplică

INTRĂRI

(de date)

setul de date care

trebuie “minerit”

(analizat în detaliu

pentru descoperirea

cunoştinţelor care

interesează)

PRELUCRĂRI

(de date)

tehnici

Data Mining

(operaţii care se

aplică asupra

setului de date în

procesul

Data Mining)

IEŞIRI

(de date)

modele de date

(cunoştinţe extrase prin

aplicarea de tehnici Data

Mining asupra setului de

date analizat în procesul

Data Mining)

Fig. 4.3. Structura sistemului Data Mining

Page 78: SISTEME INFORMATICE PENTRU ASISTAREA DECIZIEI (SIAD) · Sistemele informatice pentru asistarea deciziei, SIAD – implică folosirea elementelor aplicative din discipline diverse

• atribute bază de date sau dimensiuni data warehouse de interes pentru utilizator

denumite, în mod curent, atribute sau dimensiuni relevante;

• condiţii de selecţie a datelor;

• criterii de grupare a datelor;

- categoria de cunoştinţe care trebuie “minerită”; reprezintă categoria de modele de

date de interes pentru utilizator care se extrag prin execuţia sarcinii Data Mining de

către sistemul Data Mining (caracterizare/discriminare, asociere/corelare,

clasificare/predicţie, grupare etc);

- cunoştinţele de bază - sunt cunoştinţe despre domeniul care trebuie “minerit”

necesare pentru direcţionarea procesului Data Mining şi pentru evaluarea modelelor

de date; cea mai uzuală formă a cunoştinţelor de bază este ierarhia, care permite

“mineritul” datelor pe mai multe nivele de abstracţie, corespunzătoare nivelelor de

detaliu specificate de utilizator;

- măsurile interesului pe care îl reprezintă un model de date pentru utilizator; se

utilizează pentru direcţionarea procesului Data Mining către extragerea modelelor de

date care prezintă interes pentru utilizator, precum şi pentru evaluarea modelelor de

date extrase; spre exemplu, regulile de asociere cu suport şi încredere sub limitele

specificate de utilizator sunt considerate neinteresante;

- reprezentarea modelului extras pentru vizualizare; specifică forma în care sunt

prezentate utilizatorului modelele de date extrase; poate cuprinde reguli, tabele, hărţi,

grafice, arbori decizionali şi cuburi de date.

Formularea interogărilor Data Mining formate din primitive Data Mining se face cu

ajutorul unui limbaj de interogare Data Mining (Data Mining Query Language- DMQL) orientat

pe interacţiunea utilizatorilor cu aplicaţiile Data Mining. Practic, limbajul de interogare Data

Mining permite utilizatorului să formuleze cereri (Data Mining) sub formă de întrebări

(interogări) pentru executarea sarcinilor Data Mining specificate prin primitivele Data Mining.

Un asemenea limbaj trebuie să furnizeze comenzi pentru specificarea fiecăreia dintre primitivele

Data Mining.

Limbajul de interogare Data Mining, cu editorul corespunzător, permit utilizatorului

uman şi aplicaţiilor- utilizator din cadrul altor sisteme informatice să interogheze sistemul Data

Mining în mod compilativ şi/sau interactiv. Comunicarea interactivă a utilizatorului cu sistemul

Data Mining se poate face fie direct, prin formularea de interogari Data Mining, fie prin

intermediul unei interfeţe grafice dedicate, construită pe baza unui limbaj de interogare Data

Mining. Practic, se poate construi o interfaţă grafică prietenoasă pentru fiecare tip de limbaj de

interogare Data Mining definit.

4.5.2. Arhitectura sistemului Data Mining

Sistemul Data Mining este, în esenţa sa, un produs software cu funcţii Data Mining

denumit generic aplicaţie Data Mining care cuprinde:

- interfaţa Data Mining, modulul software care asigură interacţiunea (comunicarea) cu

utilizatorii care formulează cereri Data Mining (solicitări de execuţie a sarcinilor Data

Mining pentru extragerea de modele de date);

- serverul Data Mining, modulul software care gestiunează cererile Data Mining efectuate

de utilizator;

Page 79: SISTEME INFORMATICE PENTRU ASISTAREA DECIZIEI (SIAD) · Sistemele informatice pentru asistarea deciziei, SIAD – implică folosirea elementelor aplicative din discipline diverse

- tehnicile Data Mining, module software care fac analiza datelor stocate în depozitele de

date pentru descoperirea modelelor de date şi evluarea acestora, atât ca interes pentru

utilizator, cât şi ca bază de cunoştinţe, răspunzând astfel cererilor data mining efectuate

de utilizator

Aplicaţia Data Mining este singura componentă a sistemului Data Mining care integrează

tehnici de analiză avansată a datelor pentru extragerea modelelor de date “ascunse” în datele

utilizatorului şi pentru evaluarea acestora, motiv pentru care, din punctul de vedere al

utilizatorului, sistemul Data Mining se reduce la acest produs software. Altfel spus, aplicaţia

Data Mining reprezintă pentru utilizatorul final sistemul Data Mining şi este referită ca atare.

Sistemul Data Mining este, în ansamblul său, o interfaţă software între utilizator şi

depozitul de date “minerit” pentru extragerea modelelor de date care reprezintă cunoştinţe cu

importanţă în managementul decizional, fie că este vorba de o aplicaţie utilizator sau de

utilizatorul uman.

Arhitectura sistemului Data Mining (model constructiv) cuprinde, în principal,

următoarele componente (fig.4.4):

• DataBase, Data Warehouse, World Wide Web sau alt tip deposit de informaţii; este

vorba de una sau mai multe baze de date, data warehouses, spreadsheets sau alte categorii

de depozite de date;

• Serverul Database sau Data Warehouse; este sistemul de calcul responsabil pentru

extragerea datelor relevante (semnificative), în funcţie de cererea Data Mining efectuată

de utilizator;

• Knowledge Database (baza de date de cunoştinţe); reprezintă domeniul de cunoştinţe

utilizat pentru direcţionarea căutării modelelor de date sau pentru evaluarea importanţei

acestora în raport cu solicitările utilizatorului;

• Data Mining engine: set de module funcţionale necesare pentru analiza sarcinilor

specifice procesului Data Mining: asocierea, corelarea, caracterizarea, clasificarea,

predicţia, analiza grupurilor (cluster analysis), analiza excepţiilor (outlier analysis),

analiza evoluţiei etc.;

• Modul de evaluare a modelului (atât ca interes cât şi ca bază de cunoştinţe): este

componenta care interacţionează cu modulele Data Mining pentru a focaliza căutarea

către modelele de date care interesează; poate utiliza limite de importanţă pentru a filtra

modelele de date descoperite la iesire; pentru eficienţa procesului Data Mining este

recomandat să se “împingă” analiza importanţei modelului de date cât mai adânc posibil

(mai în detaliu), astfel încât să se limiteze căutarea numai la modelele care interesează;

• Interfaţa utilizator (grafică): este componenta care asigură comunicarea sistemului

Data Mining cu utilizatorii săi, cărora le permite:

- să furnizeze informaţiile necesare pentru direcţionarea căutării şi realizarea explorării

datelor, prin intermediul unei interogări sau unei sarcini Data Mining;

- să baleieze schemele bazelor de date, data warehouses sau altor structuri de date, pentru

extragerea setului de date care prezintă înteres în procesul Data Mining;

- să evalueze modelele de date extrase (“minerite”) şi să le vizualizeze în diferite forme,

cât mai prietenoase pentru utilizator.

O arhitectură bine stabilită (model constructiv), încă din faza de proiectare, conduce la un

sistem Data Mining capabil să utilizeze optim performanţele mediului informatic implicat pentru

desfăşurarea eficientă a procesului Data Mining, ceea ce impune:

Page 80: SISTEME INFORMATICE PENTRU ASISTAREA DECIZIEI (SIAD) · Sistemele informatice pentru asistarea deciziei, SIAD – implică folosirea elementelor aplicative din discipline diverse

- asigurarea eficientă a schimbului de date cu alte sisteme informatice (spre exemplu, bază

de date sau data warehouse);

- dezvoltarea şi utilizarea tehnicilor Data Mining impuse de specificul datelor aspupra

cărora se aplică procesul Data Mining;

- adaptarea funcţionalităţii la cerinţele de “minerit” solicitate de utilizatori.

4.5.3. Clasificarea sistemelor Data Mining

Clasificarea sistemelor Data Mining se face în funcţie de criterii astfel stabilite încât să

ofere fiecărui utilizator posibilitatea de a identifica cu uşurinţă sistemul Data Mining cel mai

potrivit pentru necesităţile sale manageriale. Principalele criterii de clasificare a sistemelor Data

Mining sunt următoarele:

1. categoria de depozit de date care conţine datele asupra cărora se aplică procesul

Data Mining şi care, la rândul lor, se clasifică în funcţie de:

- modelul de date în jurul căruia este construit depozitul de date, caz în care se

deosebesc sisteme Data Mining relaţionale, tranzacţionale, data warehouse,

obiecturale, relaţional- obiecturale sau heterogene;

- tipul datelor manipulate, caz în care se deosebesc, în principal, sisteme Data Mining

temporale, secvenţiale sau time-series, text sau multimedia, pentru fluxuri şi secvenţe

de date, precum şi pentru Web;

2. categoria de tehnici Data Mining integrate pentru îndeplinirea funcţiilor Data

Mining, care caz în care se deosebesc sisteme Data Mining care:

Fig. 4.4. Arhitectura unui sistem Data Mining tipic

Bază de

cunoştinţe

Database Data

Warehouse

World

Wide Web

Alte depozite

de informaţii

Interfaţa utilizator

Evaluarea modelului

Data mining engine

Database sau data warehouse server

data cleaning, integration and selection

Page 81: SISTEME INFORMATICE PENTRU ASISTAREA DECIZIEI (SIAD) · Sistemele informatice pentru asistarea deciziei, SIAD – implică folosirea elementelor aplicative din discipline diverse

- integrează o singură categorie de tehnici Data Mining care realizează funcţiile Data

Mining pentru descoperirea unei singure categorii de modele de date, ca de exemplu

tehnici pentru caracterizarea şi discriminarea datelor, pentru asociaerea şi corelaţia

datelor, pentru clasificare şi predicţie, pentru grupare şi analiză excepţii sau pentru

analiza evoluţiei datelor;

- integrează tehnici Data Mining multiple care realizează funcţiile Data Mining pentru

descoperirea unor categorii variate de modele de date necesare în diverse aplicaţii

şi/sau pentru a răspunde aşteptărilor diferiţilor utilizatori (sisteme Data Mining

complexe);

3. nivelul de abstracţie la care se “mineresc” datele, caz în care se deosebesc sisteme

Data Mining care asigură extragerea modelelor de date:

- pe un singur nivel de abstractie, corespunzător unui singur nivel de detaliu care este

specificat de utilizator, caz în care se obţin cunoştinţe generalizate- la un nivel ridicat

de abstracţie sau cunoştinţe primare- la cel mai de jos nivel de abstracţie;

- pe mai multe nivele de abstractie, corespunzătoare nivelelor de detaliu solicitate de

utilizatori (sisteme Data Mining avansate);

4. frecvenţa de apicare a procesului Data Mining, caz în care se deosebesc sisteme

Data Mining care “mineresc“ datele:

- regulat (frecvent sau ritmic), pentru extragerea modelelor de date respectate de

majoritatea datelor din setul de date selectat de utilizator pentru analiză; în general,

tehnicile Data Mining de tip caracterizare şi discriminare, asociaţie şi corelaţie,

clasificare şi predicţie, precum şi grupare “mineresc” datele cu regularitate, rejectând

excepţiile;

- neregulat (la nevoie), pentru extragerea datelor aflate în afara modelelor de date

respectate de majoritatea datelor din setul de date selectat de utilizator pentru analiză,

considerate excepţii; în acest caz în care se folosesc, în mod uzual, tehnicile Data

Mining de analiză a excepţiilor;

5. modul de interacţiune cu utilizatorul implicat, caz în care se deosebesc sistemele

Data Mining care

- nu interacţionează cu utilizatorul implicat pe durata procesului Data Mining

(autonome sau independente);

- interacţionează cu utilizatorul implicat pe durata procesului Data Mining

(interactive); spre exemplu, interacţiunea bazată pe interogare (query- driven);

6. metoda de analiză a datelor utilizată, caz în care se deosebesc sisteme Data Mining

care folosesc metode de analiză a datelor orientate pe:

- modelul de date în jurul căruia este construit depozitul de date care conţine datele

asupra cărora se aplică procesul Data Mining, care, la modul general, poate fi

bidimenional- pentru baze de date sau multidimensional- pentru data warehouse;

- forma de analiză a datelor asupra cărora se aplică procesul Data Mining, caz în care

se deosebesc sisteme Data Mining pentru analiză statistică sau vizuală, pentru reţele

neurale etc.

7. domeniul de aplicabilitate, caz în care se deosebesc sisteme Data Mining adaptate la

specificul domeniilor de activitate care utilizează forme avansate de analiză a datelor

pentru eficientizarea meanagementului decizional, ca de exemplu finanţe, comerţ,

telecomunicaţii, e- mail, pentru Web etc.

Page 82: SISTEME INFORMATICE PENTRU ASISTAREA DECIZIEI (SIAD) · Sistemele informatice pentru asistarea deciziei, SIAD – implică folosirea elementelor aplicative din discipline diverse

4.5.4. Explorarea datelor – conţinut şi etape

Programele care realizează implementarea algoritmilor pentru Data Mining nu sunt

suficiente. Ele trebuie alimentate cu date care provin din diverse surse organizate pentru alte

scopuri. De aceea este necesar un proces de curăţare a acestora şi de uniformizare pentru a fi

explorate aşa cum sunt ele furnizate de programe, conţinutul lor trebuind a fi analizat de

specialişti care vor identifica informaţiile utile pe care acestea (rezultatele) le conţin. Având în

vedere aceste particularităţi, tehnicile de Data Mining se pot utiliza numai în procese specifice

complexe şi de cele mai multe ori neliniare. Se pot astfel distinge etapele: definirea problemei;

identificarea surselor de date; colectarea şi selectarea datelor; pregătirea datelor; definirea şi

construirea modelului; evaluarea modelului; integrarea modelului.

Definirea problemei constă în sesizarea unei oportunităţi sau necesităţi de afaceri. De

aceea se va delimita ceea ce urmează a fi rezolvat prin Data Mining, obiective urmărire şi

rezultate scontate. Problema ce urmează a fi rezolvată prin Data Mining este o parte componentă

a oportunităţii organizaţiei, dar nu se identifică cu ea. De asemenea problema trebuie să

primească o formă adecvată pentru a putea fi tratată cu această tehnică.

Identificarea surselor de date constă în stabilirea structurii generale a datelor necesare

pentru rezolvarea problemei precum şi regulile de constituire a acestora şi localizarea lor. Fiecare

sursă de date va fi exeminată pentru o familiarizare cu conţinutul său şi pentru identificarea

incoerenţelor sau a problemelor de definire.

Colectarea şi selecţia datelor este etapa în care se face extragerea şi depunerea într-o

bază comună a datelor care urmează a fi utilizate ulterior. Această etapă ocupă un timp mare,

cam 80% din timpul total, iar existenţa depozitelor de date constituie un real avantaj.

În funcţie de limitele echipamentelor de calcul folosite, de produsele program aplicate

colecţiilor de date şi nu în ultimul rând de bugetul disponibil se poate prelucra întregul fond de

date disponibil sau un eşantion. Dacă opţiunea aleasă este dirijată spre lucrul cu eşantionare,

atunci trebuie respectate toate regulile şi cerinţele de selectare a acestora.

Pregătirea datelor. Datele sunt de obicei stocate în colecţii de date care au fost construte

pentru alte scopuri. De aceea firesc este să existe o fază preliminară de pregătire înainte de

extragere prin Data Mining. Transformările la care sunt supuse datele pentru Data Mining se

referă la: valori extreme, valori lipsă, valori de tip text, tabele. Traterea valorilor extreme se

poate face prin încadrarea între anumite limite cuprinse între medie şi un număr de abatere

standard prin excludere sau limitare sau prin izolarea vârfurilor.

În cazul valorilor lipsă se pot elimina câmpurile cu valori nule din înregistrări, sau se pot

completa câmpurile cu date de valori medii, deoarece existenţa lor poate duce la o funcţionare

incorectă a algoritmilor de Data Mining.

Valorile de tip text ridică probleme întrucât separarea prin spaţii a cuvintelor duc la

apariţia de valori diferite. Din acest motiv este indicată eliminarea lor, dar dacă prelucrarea lor

nu poate fi eliminată, soluţia cea mai pertinentă este de codificare prin tabele de corespondenţe,

în care să se evidenţieze toate şirurile valide de caractere.

Rezumarea se aplică atunci când datele sunt considerate a reprezenta detalii

nesemnificative pentru rezolvarea problemei, sau când numărul de exemple este insuficient.

Page 83: SISTEME INFORMATICE PENTRU ASISTAREA DECIZIEI (SIAD) · Sistemele informatice pentru asistarea deciziei, SIAD – implică folosirea elementelor aplicative din discipline diverse

Codificarea incoerentă apare în momentul în care obiecte identice sunt reprezentate

diferit în unele din sursele utilizate.

Incompatibilităţile arhitecturale informatice se referă la diferenţele existente între modul

de reprezentare internă a valorilor datorat creării lor cu sisteme din generaţii diverse.

Definirea şi construirea modelului este etapa care se apropie cel mai mult de noţiunea

de Data Mining şi se referă la crearea modelului informatic care va efectua exploatarea. Etapa

de definire şi construire a modelului este însoţită de faza de instruire sau învăţare, depinzând de

tehnicile de Data Mining utilizate. Indiferent de aceste tehnici toate au de parcurs două etape:

învăţarea şi testarea. Invăţarea presupune existenţa unui set suficient de reprezentativ de exemple

complete de la care se porneşte pentru a identifica relaţiile de legătură între valorile câmpurilor

sau atributelor. Se consideră ca fiind încheiat procesul de învăţare, în momentul în care

rezultatele obţinute prin model se apropie suficient de mult de soluţiile conţinute de datele după

care s-a învăţat. Nu întotdeauna rezultatele sunt cele scontate şi atunci modelul va fi supus

testării cu date diferite de cele folosite pentru învăţare, dar care aparţin aceleiaşi colecţii. În

această etapă sunt formulate alte două obiective şi anume: obţinerea de date preclasate şi

distribuirea acestora în seturi de învăţare, testare sau evaluare.

Evaluarea modelului are ca scop de a determina corect valorile în care modelul are

capacitatea de a determina corect valorile pentru cazurile noi. Modelul va fi astfel aplicat asupra

ultimei părţi din datele preclasate care sunt dedicate evaluării. Procentul de eroare ce se stabileşte

acum va fi considerat că va fi acceptat şi pentru datele noi. Performanţele unui model se vor

aprecia cu “matricea de confuzie” care are rolul de a compara situaţia reală cu cea pe care

modelul o furnizează.

Integrarea modelului este etapa în care se finalizează procesul, prin încorporarea

modelului în SIAD ca element de bază, sau prin includerea sa într-un proces decizional general

din organizaţie.

4.5.5 Raţionamentul bazat pe cazuri

Prin această tehnică se caută o rezolvare a problemelor apărute prin analogie cu

experienţa acumulată. Această metodă se poate aplica pentru clasificări şi pentru predicţii.

Cazurile pe care este bazat raţionamentul sunt memorate ca înregistrări compuse din setul de

atribute care descriu fiecare caz. Un caz nou este prezentat tot ca o înregistrare, numai că în

câmpurile în care valoarea trebuie determinată sunt vide. Pentru a determina aceste valori se

caută înregistrările cu care înregistrarea “caz nou” se aseamănă şi conţinutul acestora se

consideră a fi răspunsul. Prin urmare se poate afirma că există două funcţii fundamentale de

prelucrare:

a) măsurarea distanţei dintre membrii fiecărui cuplu de înregistrări, pentru a afla vecinele

cele mai apropiate;

b) combinarea rezultatelor obţinute de la “vecine” în răspunsul propus pentru cazul curent;1

Măsurarea distanţei dintre câmpuri. Se numeşte distanţă expresia modului în care se

evaluează similitudinea. Distanţa are ca proprietăţi: poate fi definită şi se prezintă ca un număr

real; distanţa de la un element la el însuşi este totdeauna nulă; sensul de măsurare este fără

1 Zaharie D, Albescu F, colectiv – Op. Cit.

Page 84: SISTEME INFORMATICE PENTRU ASISTAREA DECIZIEI (SIAD) · Sistemele informatice pentru asistarea deciziei, SIAD – implică folosirea elementelor aplicative din discipline diverse

semnificaţie în maniera că distanţa de la elementul A la elementul B este egală cu distanţa de la

B la A şi nu există un punct C intermediar lui A şi B prin a cărei parcurgere să se scurteze

drumul de la A la B. Ca moduri de calcul pentru distanţa câmpurilor numerice se enumeră:

• diferenţa între valoare absolută |A-B|;

• pătratul diferenţei (A-B)2

• diferenţa între valoare absolută normalizată |A-B| (diferenţa maximă). Ultima variantă

produce rezultate cu valori cuprinse între 0 şi 1.

Măsurarea distanţei între înregistrări. Când apare necesitatea de a considera simultan

mai multe câmpuri ale înregistrării, se calculează distanţa pentru fiecare câmp în parte, iar

rezultatul se combină într-o valoare mică care reprezintă distanţa înregistrării respective.

Se vor enumera câteva procedee de combinare a distanţei câmpurilor: însumarea,

însumarea normalizată (suma distanţelor/suma maximă), distanţa euclidiană (rădăcina pătrată din

suma pătratelor distanţelor). Distanţa euclidiană evidenţiază cel mai bine înregistrările pentru

care toate câmpurile sunt vecine.

Combinarea rezultatelor presupune aflarea celor mai apropiaţi vecini, iar soluţia

problemei se obţine prin combinarea răspunsurilor obţinute de la aceştia. Fiecare vecin poate

avea diverse variante de răspuns, dar se vor lua în calcul doar cei care sunt mai apropiaţi.

Rezultatul ce obţine majoritatea va fi atribuit cazului curent. Cerinţa minimă este ca numărul

votanţilor să fie impar, pentru a evita situaţiile de nedeterminare.

Metodele care se bazează pe vot dau rezultate satisfăcătoare în situaţiile în care

răspunsurile aşteptate sunt de tip enumerativ. O altă soluţie posibilă este interpolarea valorilor

înregistrărilor vecine care însă introduce o aplatizare a rezultatelor care se înscriu între cele două

limite folosite în calcul. De asemenea, se poate constata că rezultate bune se obţin prin metode de

regresie statistică aplicate asupra valorilor date de vecinii cei mai apropiaţi. Se obţine ecuaţia

unei drepte sau a unei curbe care permite calcularea mai precisă a valorilor aferente cazului

curent.

Se poate concluziona că raţionamentul bazat pe cazuri este o tehnică de Data Mining

suficient de bună şi care se poate aplica unui mare număr de probleme, caz în care conduce la

soluţii acceptabile. Toate acestea sunt valabile dacă volumul de date pe care se bazează este bine

ales şi concludent. Ca avantaje pentru această metodă se pot enumera:

• aplicarea unui mare număr de tipuri de date, pe structuri de date complexe, iar câmpurile

tip text sunt mai bine tratate decât în alte tehnici;

• luarea în considerare a oricât de multor câmpuri;

• rezultatele obţinute sunt explicite;

• elementele de noutate care apar în procesul de învăţare sunt uşor de înglobat şi de folosit

în raţionamente.

Ca orice metodă prezintă şi unele dezavantaje dintre care se pot menţiona: volumul mare

de memorie şi resursă timp de prelucrare relativ mare, şi de asemenea, timpul de prelucrarea

mare pentru aplicarea funcţiilor de distanţă asupra tuturor înregistrărilor şi câmpurilor necesare

pentru obţinerea rezultatelor.