29
FÖ 2 Dtb k FÖ 2: Databaskursen 1. Kvalitetsbegreppet 2. Kommunikation 3. Olika typer av data 4 Olika typer av datalagring 4. Olika typer av datalagring 5. Databas 6. DBMS 7. Molntjänster 8. Tabeller 9 ANSI-SPARC 9. ANSI-SPARC 10. SQL 11. Oracle Arkitektur Pär Douhan pdo@du se 1 Pär Douhan, pdo@du.se

FÖ 2 FÖ 2: Dtb kDatabaskursen - users.du.seusers.du.se/~pdo/databaser/forelasningar/pdf/02_kvalitet_databas... · buffer cache edo og buffer SQL Resultat unik session DBMS cache

Embed Size (px)

Citation preview

FÖ 2 D t b kFÖ 2: Databaskursen

1. Kvalitetsbegreppet2. Kommunikation3. Olika typer av data4 Olika typer av datalagring4. Olika typer av datalagring5. Databas6. DBMS7. Molntjänster8. Tabeller9 ANSI-SPARC9. ANSI-SPARC10. SQL11. Oracle Arkitektur

Pär Douhan pdo@du se

1

Pär Douhan, [email protected]

K lit t?Kvalitet?

Datakvalitet?Datakvalitet?

Informationskvalitet?Informationskvalitet?

2

K lit t b t d fi itiKvalitetsbegreppet - definitioner

1. Ordböcker och lexikon: ”God beskaffenhet” eller ”goda egenskaper” (Swan, 1987)2. En definition: ”Uppfyllandet av satta krav” (Crosby, 1979)3 En annan definition: ”Alla sammantagna egenskaper hos ett objekt eller företeelse som 3. En annan definition: Alla sammantagna egenskaper hos ett objekt eller företeelse som

ger dess förmåga att tillfredsställa uttalade eller underförstådda behov" (ISO9000 SS020104)

Termen kvalitet används, enligt Bo Sundgren, på två olika sätt:

1. På ett neutralt sätt – i det neutrala läget har kvalitet ungefär samma betydelse som egenskap. Man kan alltså förse viss data med ett antal egenskaper som kan ses som kvalitetsbeskrivningar för datatkvalitetsbeskrivningar för datat.

2. På ett normativt sätt – i det normativa läget är det meningsfullt att prata om god kvalitet, bättre kvalitet, sämre kvalitet och dålig kvalitet.

God kvalitet är relaterad till användaren och användningen. Det som i en situation kan vara brakvalitet, kan i en annan situation vara oacceptabelt dålig kvalitet.

3

Tjä t k lit t kTjänstekvalitet - egenskaper

Egenskaper som, enlig Bergman och Klefsjö, karaktäriserar tjänstekvalitet:

1. Omgivning – miljön som tjänsten presenteras i2. Pålitlighet – hur tillförlitligt tjänsten utförs av leverantören3. Tillgänglighet – Hur lätt det är för kunden att få kontakt med leverantören3. Tillgänglighet Hur lätt det är för kunden att få kontakt med leverantören4. Tjänstvillighet –Viljan hos leverantören att hjälpa kunden5. Artighet – leverantörens uppförande i form av artighet och vänlighet6. Kommunikationsförmåga – förmåga att tala med kunden på ett sätt som kunden g g p

förstår

Testa själv att utvärdera t. ex. köp och installation av ett kök, eller en j ptotalrenovering av tvättstugan med hjälp av ovanstående kvalitetskriterier!

4

P d ktk lit t kProduktkvalitet - egenskaper

Egenskaper som, enlig Bergman och Klefsjö, karaktäriserar produktkvalitet:

1. Prestanda – hur produkten tillfredsställer kundens förväntningar på prestanda2. Driftsäkerhet– hur ofta det blir fel på produkten och hur alvarliga felen är3. Underhållsmässighet – hur lätt det är att underhålla och reparera produkten3. Underhållsmässighet hur lätt det är att underhålla och reparera produkten4. Säkerhet – hur säker produkten är att använda

Citat av okänd 90-åring: ”Om jag ändå vetat att livet består av 90% underhåll” g j g

5

A ä db h t kAnvändbarhet - egenskaper

Egenskaper som, enligt Stefan Cronholm, karaktäriserar användbarhet:

(Användbarhet är ett centralt forskningstema inom MDI området)

1. Relevans – hur väl IS tillgodoser användarens behov2 Eff kti it t h ff kti t ll d kti t b t ift k tfö

(Användbarhet är ett centralt forskningstema inom MDI-området)

2. Effektivitet – hur effektivt eller produktivt arbetsuppgifterna kan utföras3. Användarens attityd – användarens subjektiva känslor mot systemet4. Lärbarhet – hur lätt systemet är att lära sig5 Flexibilitet hur IS klarar anpassningar till verksamhetsförändringar5. Flexibilitet – hur IS klarar anpassningar till verksamhetsförändringar6. Funktionalitet – hur väl stödjer IS de arbetsuppgifter som användaren utför7. Samtidighet – olika användare ska kunna använda IS samtidigt8 Lättanvänt – hur lätt IS är att lära sig och hur nöjd användaren är med IS8. Lättanvänt – hur lätt IS är att lära sig och hur nöjd användaren är med IS

Analysera Fronter utifrån ovanstående kriterier…

6

K lit t k NVDBKvalitetsegenskaper NVDBInnehållsorienterad Indirekt metadataInnehållsorienterad metadata

Indirekt metadata

7

K ik tiKommunikationDirekt kommunikation: Hans frågar Pär med ett lismande tonfall:

Får jag låna en femhundring?

1. Pär varseblir meddelandet med sina sinnen2. Tolkar meddelandet3. Redogör med sin Frame of Referenceg f f4. Svarar: Ja

Kommunikation via IT-system: Hans skriver ett meddelande:

Får jag låna en femhundring? IT-

system

Får jag låna en femhundring?

8

K ik ti k lit tKommunikationskvalitet

Generiska kriterier för kommunikationskvalitet enligt Owen Eriksson:

1 Informationen ska gå att förstå samt vara relevant för användaren1. Informationen ska gå att förstå samt vara relevant för användaren2. Relevant och begriplig handlingsaspekt - Den illukutionära beståndsdelen (verbet) i

handlingen måste vara begriplig. Är det ett erbjudande? En order? En bekräftelse? Ett önskemål? Ett avtal? En fråga?Ett avtal? En fråga?

3. Trovärdig information – Användaren måste kunna lita på att informationen är trovärdig

9

T ä di i f ti i NVDBTrovärdig information i NVDBLåg trovärdighetHög trovärdighet Låg trovärdighetHög trovärdighet

Ofta är det bristen på rutiner som gör att användare börjar tro att informationen inte är trovärdig. Om detta väl inträffar spelar det ingen roll om datakvaliteten är hög eller inte, det räcker med att man tror att den är dålig. Man kan öka trovärdigheten genom att lagra information om vem som har uppdaterat viss information och när det gjordes.

10

(Gustavsson och Sörman, 2004)

D t k lit t i f ti k lit tDatakvalitet - informationskvalitet

InformationLåg datakvalitet medför låg informationskvalitet.

Data

InformationHög datakvalitet kan medföra låg informationskvalitet Otillräckligt med

DataInformation informationskvalitet. Otillräckligt med

metadata, låg trovärdighet, otillräcklig frame of reference etc. hos användaren.

Hög datakvalitet kan medföra hög

DataInformation

g ginformationskvalitet. Tillräckligt med metadata, hög trovärdighet, tillräcklig frame of reference etc. hos användaren.

11

K kKonsekvenser

Information låg informationskvalitet

Beslut fattas med hjälp av information. Om informationen (beslutsunderlaget) är otillräckligt föreligger stor risk för dåliga beslut otillräckligt föreligger stor risk för dåliga beslut.

Några exempel på konsekvenser kan vara:

1. Avgrävning av kablar. Om det är otillräcklig lägesnoggrannhet på geografiska koordinater

g p p

koordinater2. I krigssituationer kan flyktingförläggningar och sjukhus bombas istället för

militära mål, om lägesnoggrannheten är för låg eller om den är felaktig3. Patienter kan felbehandlas i vården3. Patienter kan felbehandlas i vården4. Oskyldiga människor kan dömas för brott

12

Olik t d tOlika typer av data

13

Olik t d t l iOlika typer av datalagring

14

I f ti b hInformationsbehov

All fö ll i i h i f ti b hAlla företag eller organisationer har ett informationsbehov

15

D t l iDatalagring

På 60-talet dominerades datalagringen av s.k. enkla filsystem.

kundfilerFortran

personal-filer

Cobol

Varje program bearbetade sina egna datafiler.

Hög nivå av beroende mellan program och datafiler.

16

D t bDatabas

En databas är en organiserad samling information.

Data En databas innehåller alltid en beskrivning av lagrad

Dictionaryen beskrivning av lagrad information. Denna brukar kallas för Data Dictionary. Ibland även för metadatabasenIbland även för metadatabasen.

Det skall vara enkelt att läsaDet skall vara enkelt att läsaoch manipulerainformation i databasen.

17

DBMSDBMS

DBMS = DatabaseManagement System

DBMS är ett system som lagrar, modifierar och hämtar data i databasen.

Olika termer används: ORDBMS RDBMS och ORDBMS, RDBMS och DBMS.

18

Olik t d t bOlika typer av databaser

R l ti d t b k å 1970 t l t L t d t Relationsdatabaser, kom på 1970-talet. Lagrar masterdata, transaktionsdata och analytisk data. Det är detta kursen handlar om.

NoSQL databaser, kom en bit in på 2000-talet. Lagrar Big Data, data från bl. a. sociala medier, från sensorer, från webbloggar etc.

19

Olik l töOlika leverantörer

Det finns olika leverantörer av databaser. Exempel på några vanligt förekommande databaser:

20

Olik l tjä tOlika molntjänsterData as a service (DaaS) http://www gapminderorg Hans RoslingData as a service (DaaS)

Database as a service (Cloud Database)

http://www.gapminder.org Hans Rosling

21

Ed "T d" C ddEdgar "Ted" CoddEd F k "T d" C dd (19 A ti 1923 18 A il 2003) Edgar Frank "Ted" Codd (19 Augusti 1923 - 18 April 2003) var en engelsk datavetare som, när han arbetade för IBM, 1965 uppfann relationsmodellen för databashantering, den teoretiska grunden för relationsdatabaser.

Data organiseras i tabeller på de logiska g p gnivåerna.

Hög nivå av program/data oberoende Hög nivå av program/data oberoende. Klientprogram behöver inte veta hur data fysiskt är lagrat i databasen.

Detta realiseras av en tre lager(schema)-arkitektur enligt ANSI/SPARC, med två logiska

h f k å22

och en fysisk nivå.

T b llTabeller

En relationsdatabas är samling av relationer eller tvådimensionella tabellertvådimensionella tabeller.

E l ti d t b En relationsdatabas använder dessa två-dimensionella tabeller för att lagra data.

23

ANSI SPARC A kit ktANSI-SPARC Arkitekturen

Extern nivå

Vy 1 Vy 2 Vy 3

Del av helheten Extern nivå

Logiskt dataoberoende

Hela logiska vyn av databasen Konceptuell nivå

Alla objekt i databasen med metadata om dessa

Fil -och postbeskrivningar Fysisk nivå

Fysiskt dataoberoende

Hur dessa objekt fysiskt är lagrade i databasen

D t (111000111001)

postbeskrivningar

OS

ylagrade i databasen

Data (111000111001)OS

24

G t fö ll d t bGemensamt för alla databaser

Alla databaser består av:

1. Memory (minne)2. Processes (processer)3 Storage (lagring filer på disk)3. Storage (lagring, filer på disk)

25

SQLSQL

SQL, Structured Query Language

DBMS

SQL

DB DBMSResultat

Databas: Består av olika filer; datafiler kontrollfiler och redo loggfilerDatabas: Består av olika filer; datafiler, kontrollfiler och redo loggfilerlagrade på disk.

DBMS: Mjukvara t ex Oracle eller MySQL som via SQL tillhandahåller åtkomstDBMS: Mjukvara, t. ex. Oracle eller MySQL, som via SQL tillhandahåller åtkomsttill filerna i databasen. Består av olika minnesareor och bakgrundsprocesser. I Oracle's arkitektur kallas DBMS för Oracle Instance.

26

O lOracle Server

Oracle

Oracle Instance

SGA

klient

database Redo log

SGAShared pool

User process

Librarycache

Dictionary

databasebuffer cache

edo ogbuffer

SQLResultat

unik session DBMS

Dictionarycache

Server process

Resultat

PMON SMON DBWR LGWR CKPT

B k dDatafiler Kontrollfiler redo logg 1a redo logg 1b

DB

Bakgrundsprocesser(Tasks)

27Datafiler Kontrollfiler

Olik llOlika roller

DBA, Databasadministratör, ansvarar för säkerhet, drift och underhåll av databasen.

De elopers d Developers, de som utvecklar applikationer

E d d End users, de som använder databasens tjänster

28

SQL f lik d lSQL, fem olika delar

SQL åk b å f lik d lSQL-språket består av fem olika delar:

1. Data Retrivial Language select

2. DML, Data Manipulation Language insert, update och delete

3. DDL, Data Definition Language create, alter och drop

4. DCL, Data Control Language grant och revoke

5 TCL T ti C t l L5. TCL, Transaction Control Language commit och rollback

29