Informatika Predavanje br. 3 Podaci i informacije P3.pdf · Šta je atribut? •Atribut je osobina...

Preview:

Citation preview

Informatika

Predavanje br. 3

Podaci i informacije

dr Ana Kovačević

kana@rcub.bg.ac.rs

Fakultet bezbednosti

Plan predavanja

• Podaci

• Informacije

1.4.2019. autor: dr Ana Kovačević, FB 2

1.4.2019. autor: dr Ana Kovačević, FB 3

Podaci

• Podaci – jedna od osnovnih komponenata računarskog sistema.

• Podaci i informacije nisu sinonimi u računarstvu.

• Danas sve više podataka je raspoloživo krajnjim korisnicima (zbog pada cene hardvera; pristupa preko Interneta).

• Podaci: – sirove, nestruktuirane zabeležene činjenice.

– značenje zavisi od konteksta.

– tumačenjem se dobijaju informacije.

– računari obrađuju podatke bez razumevanja njihovog značenja.

PRIMERI PODATAKA

1.4.2019. autor: dr Ana Kovačević, FB 4

1.4.2019. autor: dr Ana Kovačević, FB 5

Podaci

– broj: 1234,45

– tekst: “Analiza socijalnih mreža je popularna.”

– slika

– video zapis

– zvuk

1.4.2019. autor: dr Ana Kovačević, FB 6

Tekstualni podaci

• Slobodan tekst nedovoljno struktuiran i

pruža mogućnost višestruke interpretacije.

• Manja je pouzdanost kod slobodnog teksta

nego u egzaktnim numeričkim podacima,

zbog mogućnosti različite interpretacije.

Transakcioni podaci

7

Specijalni tip slogovnih podataka gde važi:

svaki slog (transakcija) sadrži skup stavki

Na primer, podaci o prodavnici prehrambene robe.

Transakciju predstavlja skup proizvoda koji je

neki kupac kupio. Stavke su individualni

proizvodi.

TID Items

1 Bread, Coke, Milk

2 Beer, Bread

3 Beer, Coke, Diaper, Milk

4 Beer, Bread, Diaper, Milk

5 Coke, Diaper, Milk

Graf zasnovani podaci

• <a href="papers/papers.html#aaaa"> Graph

Partitioning </a>

• <li>

• <a href="papers/papers.html#aaaa">

• Parallel Solution of Sparse Linear System of Equations </a>

• <li>

• <a href="papers/papers.html#ffff">

• N-Body Computation and Dense Linear System Solvers

8

2

5

1

2

5

Primer: Generički graf i HTML veze <a

href="papers/papers.html#bbbb">

Data Mining </a>

<li>

Podaci o hemijskim

strukturama • Molekul benzena: C6H6

Prikaz strukture (ugljenik - crno, vodonik -

sivo)

1.4.2019. autor: dr Ana Kovačević, FB 9

Podaci sa poretkom

10

Element u

nizu

Stavka/Događaj Nazivaju se i vremenski

podaci

Niz transakcija

Podaci sa poretkom

(transakcija)

Podaci sa poretkom

12

Genomske sekvence GGTTCCGCCTTCAGCCCCGCGCC

CGCAGGGCCCGCCCCGCGCCGTC

GAGAAGGGCCCGCCTGGCGGGCG

GGGGGAGGCGGGGCCGCCCGAGC

CCAACCGAGTCCGACCAGGTGCC

CCCTCTGCTCGGCCTAGACCTGA

GCTCATTAGGCGGCAGCGGACAG

GCCAAGTAGAACACGCGAAGCGC

TGGGCTGCCTGCTGCGACCAGGG

Podaci sa poretkom

13

Prostorno-

vremenski podaci

U prostorne podatke

spadaju i podaci

vezani za

vremenske serije

Prosečne mesečne temeprature

kopna i mora

1.4.2019. autor: dr Ana Kovačević, FB 14

Podatak

• Svaki podatak karakteriše:

– simbol

– opis

– kontekst

Šta su podaci?

Skup objekata i njihovih

atributa

Atributi su svojstvo ili

karakteristika objekta Primer: temperatura, boja auta, veličina

ekrana, itd.

Atributi su poznati i kao promenljive, polja,

osobine, karakteristike, obeležja...

Skup atributa opisuje

objekat Objekat je takođe poznat i kao slog, tačka,

slučaj, primer, entitet, instanca, ...

15

Tid Refund Marital

Status

Taxable

Income

Cheat

1 Yes Single 125K No

2 No Married 100K No

3 No Single 70K No

4 Yes Married 120K No

5 No Divorced 95K Yes

6 No Married 60K No

7 Yes Divorced 220K No

8 No Single 85K Yes

9 No Married 75K No

10 No Single 90K Yes 10

Atributi

Objekti

Šta je atribut?

• Atribut je osobina ili karakteristika objekta koja se razlikuje među objekima ili je različita (vremenski) za jedan objekat.

• Npr. Boja očiju se razlikuje za osobe (simbolički atribut), dok temperatura varira u vremenu (numerik)

• Merna skala je pravilo (funkcija) koja je pridružena numeričkoj ili simboličkoj vrednosti atributa objekta.

Vrednosti atributa

17

Vrednosti atributa su brojevi ili simboli koji su pridruženi atributu

Razlika između atributa i njihovih vrednosti Isti atributi mogu da budu preslikani u

različite vrednosti atributa Primer: visina može da se meri u metrima ili kilometrima

Različiti atributi mogu da budu preslikani u isti skup vrednosti, pri čemu osobine vrednosti atributa mogu da budu različite

Primer: vrednosti za broj godina i težinu su celobrojne, ali broj godina ne može da se smanjuje dok težina može

Tipovi atributa

18

Osobine i operacije (nad brojevima) koje se

najčešće koriste radi određivanja tipa atributa

su:

Različitost

:

= i

Uređenje

:

<, ≤, > i ≥

Aditivnost

:

+ i -

Multiplikativnost

:

* i /

Tip atributa Opis Primeri

Imenski

(eng. Nominal)

Vrednost imenskog

atributa su upravo

različita imena, tj.

imenski atributi pružaju

samo mogućnost

razlikovanja jednog od

drugog objekta (=, )

poštanski kodovi,

identifikacije

zaposlenih, boja

očiju, pol (muški,

ženski)

Kvalitativni

Redni

(eng.

Ordinal)

Vrednosti rednih atributa

pružaju dovoljno

informacija za uređenje

objekata (<, >)

tvrdoća minerala

(dobar, bolji,

najbolji), stepeni,

redni brojevi

zgrada u ulici

Kvalitativni

Intervalni (eng. Interval)

Za intervalne atribute, ima

smisla razlika između

vrednosti, tj. postoji

jedinica mere takvih atributa

(+, - )

datumi u

kalendaru,

temepratura u

stepenima

Celizijusa

Kvantitativni

Razmerni

(eng. Ratio)

Kod razmernih atributa ima

smisla i proizvod i količnik

(*, /) tih atributa

količina novca,

godine, masa,

dužina

Kvantitativni

20

Tip atributa Opis Primeri Operacije

Imenski

(eng. Nominal)

Vrednost imenskog atributa su

upravo različita imena, tj.

imenski atributi pružaju samo

mogućnost razlikovanja jednog

od drugog objekta (=, )

poštanski kodovi,

identifikacije

zaposlenih, boja

očiju, pol (muški,

ženski)

entropija,

korelacija

kontingenata, 2

test

Redni

(eng.

Ordinal)

Vrednosti rednih atributa

pružaju dovoljno informacija za

uređenje objekata (<, >)

tvrdoća minerala

(dobar, bolji,

najbolji), stepeni,

redni brojevi zgrada

u ulici

procenat,

korelacija ranga,

izvršavanje

testova, oznake

testova

Intervalni

(eng. Interval) Za intervalne atribute, ima smisla

razlika između vrednosti, tj. postoji

jedinica mere takvih atributa (+, - )

datumi u kalendaru,

temepratura u

stepenima Celizijusa

srednja vrednost,

standardna

devijacija,

Pearson’ova

korelacija, t i F

test

Razmerni

(eng. Ratio)

Kod razmernih atributa ima smisla i

proizvod i količnik (*, /) tih atributa

količina novca,

godine, masa, dužina

geometrijska

sredina,

harmonijska

sredina, procenat

varijacije

21

Diskretni i kontinuirani atributi

23

Atributi mogu da budu opisani i preko broja vrednosti koje sadrže

Diskretni atributi Imaju konačan ili prebrojivo beskonačan skup vrednosti

Primer: poštanski brojevi, računi, skup reči u nekom

dokumentu

Često se prikazuju kao celobrojne promenljive

Binarni atributi su specijalan slučaj diskretnih atriubuta

Kontinuirani (neprekidni) atribututi Skup vrednosti ovih atributa čine realni brojevi

Primer: temepratura, visina, težina, pritisak, brzina

Realne vrednosti mogu da se mere i predstavljaju samo preko konačnog broja cifara

Uobičajen način predstavljanja je u obliku realnih brojeva u pokretnom zarezu

Kvalitet podataka

24

Koje su vrste problema pri određivanju

kvaliteta podataka?

Kako odrediti probleme sa podacima?

Šta raditi sa uočenim problemima?

Primer problema kvaliteta podataka:

greške pri merenju i prikupljanju podataka

šum i elementi van granica

nedostajuće vrednosti

duplirani (multiplicirani) podaci

1.4.2019. autor: dr Ana Kovačević, FB 25

Računari i pouzdanost podataka

• Važno kod predstavljanja podataka u

računarima:

– kompletnost

– tačnost

– preciznost podatka

1.4.2019. autor: dr Ana Kovačević, FB 26

Kompleksnost podataka

• Kompletnost: da svaka karakteristika ili

atribut nekog složenog podatka ili pojma

budu definisani.

• Nekompletni podaci nepouzdane

informacije.

• garbage in garbage out

1.4.2019. autor: dr Ana Kovačević, FB 27

Tačnost podataka

• Tačnost:

– korektnost:

• sposobnost da se izvršava zadatak bez grešaka ili omaški;

• mera veličine greške podataka;

• greška:

– sistematska – određena samim principom merenja

– statistička – zavise od slučajnih varijacija jedne merne veličine.

– primer: očitavanje merne vrednosti na instrumentu ima i

sistematski i statistički karakter.

– konformnost (usaglašenost podataka): odnosi se na

primenu standarda ili klasifikacionih pravila za

snimanje i prikazivanje podataka.

1.4.2019. autor: dr Ana Kovačević, FB 28

Preciznost podataka

• Preciznost podataka – stepen rafiniranosti

ili rezolucije kojom se mereni podaci

prikazuju, npr. broj decimalnih mesta.

• Primer: 1,234 kg preciznije od 1,2 kg.

Šum

Šum predstavlja modifikaciju oriinalnih vrednosti

Šum

Šum se nekada meša sa pravim podacima

Eliminacija šuma nije jednostavna

Robusni algoritmi - daju prihvatljiva rešenja i kada je šum

prisutan

Elementi van granica

32

Elementi van granica su objekti sa karakteristikama koje

su značajno različite od najvećeg broja objekata u skupu

podataka

Nedostajuće vrednosti

33

Razlozi za pojavu Informacije nisu prikupljene (npr. ljudi odbijaju da prikažu

svoju težinu, starost, veličinu plate,...)

Atributi nisu primenljivi u svim slučajevima (npr. plata nije primenljiva na decu)

Rukovanje nedostajućim vrednostima Eliminacija objekata

Procena nedostajućih vrednosti

Ignorisanje nedostajućih vrednosti pri obradi

Zamena sa svim mogućim vrednostima (poređanim težinski prema verovatnoći pojavljivanja)

Nekonzistentne vrednosti

Duplirani podaci

34

Skupovi podataka mogu da uključe duplikate,

ili skoro identične podatke

Najčešće se javljaju kod spajanja podataka

iz heterogenih izvora

Primer:

Ista osoba sa više elektronskih adresa

Proces obrade (eliminacije) duplikata se

naziva čišćenje podataka

Preprocesiranje

podataka

35

Primenjuje se radi dobijanja podataka koji više

odgovaraju potrebama istraživanja podataka

Agregacija

Izbor uzoraka (eng. sampling)

Smanjenje dimenzije

Izbor podskupa atributa

Formiranje atributa

Diskretizacija i binarizacija

Transformacija atributa

Agregacija

36

Kombinovanje dva ili više atributa (ili objekata)

u jedan atribut (objekat)

Svrha

Redukcija podataka

Smanjivanje broja atributa ili objekata

Promena skale

Npr. umesto 365 dana dobijamo 12 meseci

'Stabilniji' podaci

Agregirani podaci imaju tendenciju da imaju manja

odstupanja

Primer

IZBOR UZORKA, REDUKCIJA

DIMENZIJE

1.4.2019. autor: dr Ana Kovačević, FB 38

Izbor uzoraka

39

Izbor uzoraka je glavna tehnika koja se koristi u izdvajanju

podataka.

Često se koristi kako za preliminarna istraživanja tako i za konačne analize podataka

Statističari biraju uzorke jer je dobijanje kompletnog

skupa podataka koji su od interesa jako skupo i vremenski zahtevno

Izbor uzoraka se koristi u analizi podataka jer je obrada

kompletnog skupa podataka koji je od interesa takođe jako skupa ili vremenski zahtevna

Izbor uzoraka

40

Ključni principi za efektivan izbor uzoraka su:

Korišćenjem uzoraka koji su reprezentativni dobija

se efekat skoro isti kao da je rađeno na

kompletnom skupu podataka

Uzorak je reprezentativan ako ima

aproksimativno iste osobine kao i originalni skup

podataka

Dimenzionalna

redukcija

6 43

Veliki broj algoritama za istraživanje

podataka bolje rade sa podacima manjih

dimenzija

Eliminišu se šum, redundantni podaci, ....

Dobija se jednostavniji model

Lakša vizuelizacija

Dimenzionalna

redukcija

44

Skupovi podataka mogu da imaju veliki broj atributa (u eng. literaturi se koristi i feature)

Svrha:

Smanjuje se količina vremena i memorije potrebna za rad algoritama za istraživanje podataka

Lakša vizuelizacija

Eliminišu se šum, redundantni podaci, ....

Tehnike Analiza glavnih komponenata (eng. Principle

Component Analysis)

Dekompozicija singularne vrednosti (eng. Singular Value Decomposition)

Druge nelinearne tehnike i tehnike sa nadzorom

Izbor podskupa atributa

45

Još jedan način redukcije dimenzije

Redundantni atributi ponavljanje jedne ili svih informacija sadržanih u

jednom ili više atributa

Primer: cena proizvoda i PDV

Atributi sa irelevantnim vrednostima sadrže informacije koje nisu korisne za proces IP-a

Primer: maticni broj studenta je irelevantan za predviđanje prosečne ocene studenta

Izbor podskupa atributa info Tehnike: Gruba sila:

Probaju se svi mogući podskupovi atributa kao ulaz u IP

algoritam

Neprikladan zbog velikog broja podskupova

Ugnježdeni pristup:

Izbor podskupova atributa je deo IP algoritma.

Filteri:

atributi se biraju pre početka rada IP algoritma nekim

pristupom koji je nezavisan od IP procesa

Pristup pomoću omotača:

Koristi se IP algoritam kao crna kutija koja pronalazi

najbolji podskup skupa atributa.

Slično primeni grube sile ali se ne uzimaju u obzir baš svi

podskupovi 46

Izbor skupa atributa -info

47

Formiraju se novi atributi koji sadrže

najvažnije informacije iz skupa podataka na

mnogo efikasniji način nego originalni

atributi

Opšte metodologije:

Izdvajanje atributa

zavisi od domena

Preslikavanje atributa u novi prostor

Konstrukcija atributa

kombinovanje (starih) atributa

Diskretizacija i binarizacija

49

Transformacija neprekidnih u

kategoričke atribute - diskretizacija

Transformacija neprekidnih i diskretnih atributa

u binarne - binarizacija

Jednostavna tehnika binarizacije: ako ima m

kategoričkih vrednosti tada se svakoj

dodeljuje jedinstven broj u intervalu [0,m-1] i

konvertuje svaki od tih brojeva u binarnu

vrednost

1.4.2019. autor: dr Ana Kovačević, FB 52

Kodiranje podataka

• Kodiranje – proces dodeljivanja individualnog objekta klasi ili skupu klasa, u slučaju višedimenzionalne klasifikacije.

• Primeri:

– numerički kodovi (111123)

– mnemonički kodovi (FB)

– hijerarhijski kodovi (roditelj-dete)

– binarni kodovi

1.4.2019. autor: dr Ana Kovačević, FB 53

Dani u nedelji binarno kodirani

• Ponedeljak 000

• Utorak 001

• Sreda 010

• Četvrtak 011

• Petak 100

• Subota 101

• Nedelja 110

• Ne koristi se 111

Transformacija atributa

6 54

Transformacija promenljive označava

transformaciju koja se primenjuje na sve

vrednosti te promenljive.

Za svaki objekat, transformacija se primenjuje

na vrednosti promenljive za taj objekat.

Primer: ako je bitna jedino veličina objekta,

promenljiva može da se transformiše

uzimanjem apsolutne vrednosti.

Transformacija atributa –

55

Jednostavne funkcije, npr. : √x, xk, log(x), ex, |x|, 1/x

U statistici se često koriste √x, log(x) i 1/x radi

transformacije podataka koji nemaju Gausovu

(normalnu) raspodelu u podatke koji imaju tu

raspodelu

U IP procesu ima i drugih razloga. Npr. ako je vrednost

promenljive između 1 i 1.000.000.000, primenom log

funkcije se dobijaju bolji odnosi kod poređenja (npr. 108

sa 109 i 10 sa 1000)

Transformaciju promenljivih treba primenjivati sa

oprezom jer može da promeni prirodu podataka (npr.

transformacija sa 1/x)

1.4.2019. autor: dr Ana Kovačević, FB 58

Integracija podataka

• Integracija važna: radi objedinjavanja

podataka iz autonomnih ili izolovanih

aplikacija, i težnja ka formiranju Integralnih

informacionih sistema.

• Integracija podataka:

– integracija unutar organizacije

– integracija podataka između organizacije

(integracija podataka na web-u).

1.4.2019. autor: dr Ana Kovačević, FB 59

Integracija podataka

• Integracija podataka je problem

obezbeđivanja jedinstvenog i

transparentnog pristupa podacima koji su

uskladišteni unutar autonomnih i

heterogenih izvora podataka.

1.4.2019. autor: dr Ana Kovačević, FB 60

Aktivnosti nad podacima

• klasifikacija, svrstavanje u klase na osnovu

odabranog kriterijuma

• sortiranje, proces uređivanje redosleda

podataka u nizi, prema zadatom kriterijumu

• agregacija, spajanje, združivanje

• računanje, izvodi se nad numeričkim podacima

• selekcija, izdvajanje podataka iz skupa

podataka na osnovu odabranog kriterijuma

• …

Primer klasifikacije

1.4.2019. autor: dr Ana Kovačević, FB 61

INFORMACIJE

1.4.2019. autor: dr Ana Kovačević, FB 62

1.4.2019. autor: dr Ana Kovačević, FB 63

Podatak vs. Informacija

• Podaci sirove, nestruktuirane činjenice,

materijal za dobijanje informacija.

• Svaka informacija sadrži podatak, ali svaki

podatak nije informacija.

• Različitom kombinacijom istih podataka

moguće je dobiti sasvim različite

informacije.

• Informacija doprinosi otklanjanju neznanja.

1.4.2019. autor: dr Ana Kovačević, FB 64

Informacije

• Potiče od lat. Informare (informisanje ili

obaveštavanje)

• Informacija se može definisati kao:

– PROTUMAČENI PODATAK

– Podaci kada se posmatraju u datom

kontekstu i prenose značenje korisniku.

– Izvedena vrednost sa pridruženim značenjem

dobijena primenom operacija obrade

podataka.

1.4.2019. autor: dr Ana Kovačević, FB 65

Pojam informacije

• Informacija je inkrement znanja

– Povećava ili doprinosi skupu poznatih

pojmova ili činjenica.

– Informacija zavisi od: konteksta, i predznanje

primaoca informacije.

1.4.2019. autor: dr Ana Kovačević, FB 66

Pojam informacije (komunikacija)

• Prenos poruka (komunikacija)

– mogućnost dobijanja informacije

– vrlo složen

– discipline koje ga proučavaju:

• psihologija, biologija, filozofija

• telekomunikacije

• informacioni sistemi

• druge discipline

1.4.2019. autor: dr Ana Kovačević, FB 67

Pojam informacije

• Količina informacije

– informacije su različitog značaja

– formalna mera za količinu informacija –

entropija

– bit (binary digit) – jedinična količina

informacija

– semantički aspekt informacija:

• značenje ili smisao poruka zavisi od osobe

• ne utiče na meru količine informacija

1.4.2019. autor: dr Ana Kovačević, FB 68

Podatak vs. Informacija

• Podatak: 10

• Informacija 1: Sada je 10 sati.

• Informacija 2: Matija je dobio 10 iz

Informatike.

1.4.2019. autor: dr Ana Kovačević, FB 69

Informacija

• “Informacija je nešto što ukida ili smanjuje

neodređenost sistema, odnosno smanjuje

neizvesnost promena.”

– C. Shannon.

1.4.2019. autor: dr Ana Kovačević, FB 70

Informacija

• Informacija povezana sa:

– neizvesnošću, očekivanjem i pretpostavkom.

• Informacija raste kada verovatnoća pojavljivanja

datog događaja opada.

– “U januaru je padao sneg” – mala kol. informacija.

– “U avgustu je padao sneg” – veća količina

informacija.

• pretpostavka: severna polulopta,

• manja verovatnoća – veća neizvesnost, manje očekivanje.

1.4.2019. autor: dr Ana Kovačević, FB 71

Informacija

• INFORMACIJA je rezultat obrade

podataka i pojavljuje se kao značajna za

one koji je dobiju u specifičnom domenu,

odnosno datom kontekstu.

• Informacija zavisi od:

– konteksta

– predznanja primaoca informacija.

1.4.2019. autor: dr Ana Kovačević, FB 72

Poželjna svojstva informacija

• Poželjna svojstva informacija su: – tačnost

– raspoloživost

– kompletnost

– jednostavnost

– ekonomičnost

– mogućnost verifikacije

– pouzdanost

– relevantnost

– trajnost

– fleksibilnost

– zaštićenost od neautorizovanog pristupa.

• Neka svojstva su međusobno protivrečna, npr. Mogućnost pristupanja i zaštita

1.4.2019. autor: dr Ana Kovačević, FB 73

Vrednovanje informacija:

Različiti korisnici – različito vrednuju

informaciju.

Faktori koji utiču na vrednost informacije:

• njena aktuelnost

• tačnost

• pouzdanost

• mera u kojoj zadovoljava potrebe

korisnika

1.4.2019. autor: dr Ana Kovačević, FB 74

Količina informacija

• U teoriji informacija: Količina informacije u

jednoj poruci se definiše kao broj bitova

potrebnih za kodiranje svih mogućih

značenja te poruke (pod pretpostavkom da

su sva moguća značenja podjednako

verovatna).

1.4.2019. autor: dr Ana Kovačević, FB 75

Aspekti informacija

• sintaksni: način predstavljanja nosioca

informacija (podataka)

• semantički: značenje (važan je kontekst)

– Kosa leži na kosi.

– Kosa: žensko ime, poljoprivredna alatka,

dlaka na glavi, kosa linija, kosina...

• pragmatički: akcije koje nastaju kao

rezultat interpretacije informacije.

1.4.2019. autor: dr Ana Kovačević, FB 76

Transformacija podataka u

informacije • Proces transformacije podataka u

informacije:

– selekcija,

– obrada: skup aktivnosti kojima se podaci

transformišu u informacije

• Informacije se prikazuju u formi pogodnoj

za korisnika.

1.4.2019. autor: dr Ana Kovačević, FB 77

Transformacija podataka u

informacije • Važno za transformaciju podataka:

– da su podaci ispravno zapisani

– preneto korisnicama bez ostavljanja

mogućnosti za različite interpretacije.

• Podaci postaju informacije u trenutku

njihovog korišćenja, ako se prikupljeni

podaci ne koriste oni ne postaju

informacije.

1.4.2019. autor: dr Ana Kovačević, FB 78

Proces akumuliranja znanja

• Informacija se transformiše u znanje kada

se koristi za donošenje odluka i

preduzimanje odgovarajućih akcija.

1.4.2019. autor: dr Ana Kovačević, FB 79

Znanje

• Znanje je informacija koja ima kontekst,

relevantna je i na osnovu njenog sadržaja

se može delovati.

• Znanje je dinamično znanje informacija

u akciji.

• Tokom vremena sa iskustvom znanje

evoluira.

1.4.2019. autor: dr Ana Kovačević, FB 80

Unapređenje znanja

• Za pojedince i organizacije je veoma

važno da unapređuju svoje znanje, da bi

ga održale kao izvor konkurentske

prednosti potrebno da organizacije

imaju i unapređuju sistem za upravlje

znanjem i intelektualnim kapitalom.

• Znanje je Intelektualni kapital znanje

ima finansijsku vrednost.

1.4.2019. autor: dr Ana Kovačević, FB 81

Znanje

• Znanje: – objektivno:

• dokumentovano u formi koja se može distribuirati drugima ili transformisati u proces;

• znanje koje otiče.

– subjektivno: • teško se može dokumentovati, nestruktuirano, rasuto;

• ugrađeno znanje.

• U savremenim IS uglavnom se prikuplja, skladišti, upravlja, izveštava o objektivnom znanju, ali treba razmatrati i subjektivno znanje.

1.4.2019. autor: dr Ana Kovačević, FB 82

Upravljanje znanjem

• Upravljanje znanjem (engl. Knowledge

Management) je proces koji doprinosi

povećanju njegove vrednosti ponovnom

upotrebom.

• Sistem upravljanja znanjem (Knowledge

Management) omogućava dostupnost

upravljanja znanjem u celoj organizaciji ili

preduzeću.

1.4.2019. autor: dr Ana Kovačević, FB 83

Upravljanje znanjem

• Životni ciklus upravljanja znanjem:

– stvaranje znanja

– osvajanje znanja

– oplemenjivanje znanja

– upravljanje znanjem

– širenje znanja.

Upravljanje znanjem

• Podeliti ono što ste naučili, stvorili ili dokazali.

• Inovirati da bi bili kreativniji, inventivniji i

maštovitiji

• Ponovno koristiti ono što su drugi već naučili,

kreirali i dokazali.

• Sarađivati sa drugima da bi se bolje iskoristilo

njihovo znanje

• Učiti radeći, od drugih, i iz postojećih informacija.

1.4.2019. autor: dr Ana Kovačević, FB 84

1.4.2019. autor: dr Ana Kovačević, FB 85

Klasifikacija

• Prema Russell Ackoff-u, sistem teoretičaru i profesoru organizacionih promena, ljudski um se može klasifikovati u 5 kategorija: – podaci: simboli,

– informacije: podaci koji postaju korisni nakon neke obrade (ko, šta, gde i kada?).

– znanje: aplikacije nad podacima i informacijama, (kako?)

– razumevanje: zašto?

– mudrost: evaluirano razumevanje; omogućava kreiranje budućnosti.

1.4.2019. autor: dr Ana Kovačević, FB 86

Tranzicija podataka u informacije

(Russell Ackoff)

DIKW piramida III

87 Joe Gollner: The Anatomy of

Knowledge

1.4.2019. autor: dr Ana Kovačević, FB 88

Primer

• Podatak: 1234567.89

• Informacija: Vaš račune je porastao za 1234567.89$ što je 8087% .

• Znanje: Niko mi ne duguje toliko novca.

• Mudrost: Bolje da proverim u banci pre nego što ih potrošim, zbog onoga što se desilo drugim ljudima.

• (Izvor: Free on-line Dictionary of Computing)

1.4.2019. autor: dr Ana Kovačević, FB 89

Definicije informacija

• SINTAKSNI aspekt: Informacija predstavlja negativnu vrednost logaritma verovatnoće dešavanja događaja

(C. Shenon)

• SEMANTIČKI aspekt: Informacija je funkcija odnosa između mogućih odgovora pre i posle prijema poruke (Briljon)

• PRAGMATIČKI aspekt: Informacija je naziv za sadržaj koji je razmenjen sa spoljašnjim svetom u postupku usaglašavanja sa njim (Viner)

1.4.2019. autor: dr Ana Kovačević, FB 90

Entropija

• 1948. Claude Shannon

• U teoriji informacija entropija je mera

neizvesnosti koja se pridružuje nekoj

slučajnoj promenljivoj.

• Mera za količinu informacija koja

nedostaje u datom sistemu pre prijema:

Šenonova entropija.

1.4.2019. autor: dr Ana Kovačević, FB 91

Pojam entropije

• Entropija

– mera neorganizovanosti sistema

– mera za nered u sistemu

• potpuni nered i potpuni red ne postoje

– mera neizvesnosti o podacima u prenetim porukama

• Informacija

– Shannon: negativna vrednost entropije

– mera za red, izvesnost, organizovanost sistema.

1.4.2019. autor: dr Ana Kovačević, FB 92

Šenonova definicija informacija

• I-informacioni sadržaj (količina informacije)

koji se može desiti sa verovatnoćom p:

I = -log2 p, gde je 0 <= p <= 1.

I – izražen u bitovima (bit-jedinica informacije).

Šenonova definicija informacija u matematičkoj

formi povezuje informaciju sa svojim

numeričkom (digitalnom) prezentacijom—

sintaksni aspekt.

1.4.2019. autor: dr Ana Kovačević, FB 93

Primer

• “Fer” novčić, novčić koji prilikom bacanja

ima podjednaku verovatnoću pojavljivanja

“pisma” i “glave” ima entropiju 1 bit.

• I = – log2 0.5= 1 bit.

• Napomena: ukoliko novčić nije fer, tada je

neizvesnost manja, a samim tim i

Shannon-ova entropija.

1.4.2019. autor: dr Ana Kovačević, FB 94

Literatura

• Dejan Simić, 2011, Osnove informaciono

komunikacionih tehnologija, glava 3.

• Ozren Džigurski, Informatika, Fakultet

civilne odbrane, 2002.

• Tan, P., Steinbach, M., Kumar, V.

(2006). Introduction to data mining.

Pearson AddisonWesley

– Nenad Mitić, Podaci

http://poincare.matf.bg.ac.rs/~nenad/ip.2016/2

.podaci.pdf)

Recommended