32
Пословна интелигенција (ПИ) Откривање законитости у подацима - завршна разматрања Универзитет у Београду Факултет организационих наука

Пословна интелигенција (ПИ)odlucivanje.fon.bg.ac.rs/.../uploads/07-oas-pi-vizualizacija.pdf · CRISP-DM Cross Industry Standard Process for Data Mining •Разумевање

  • Upload
    haxuyen

  • View
    233

  • Download
    3

Embed Size (px)

Citation preview

Page 1: Пословна интелигенција (ПИ)odlucivanje.fon.bg.ac.rs/.../uploads/07-oas-pi-vizualizacija.pdf · CRISP-DM Cross Industry Standard Process for Data Mining •Разумевање

Пословна интелигенција (ПИ)

Откривање законитости у подацима - завршна разматрања

Универзитет у Београду Факултет организационих наука

Page 2: Пословна интелигенција (ПИ)odlucivanje.fon.bg.ac.rs/.../uploads/07-oas-pi-vizualizacija.pdf · CRISP-DM Cross Industry Standard Process for Data Mining •Разумевање

Циљеви предавања

• Разумевање сложености процеса ОЗП

• Разумевање итеративног процеса ОЗП

• Коришћење техника визуализације код:

– Разумевања података

– Разумевање и унапређивање модела

2

Page 3: Пословна интелигенција (ПИ)odlucivanje.fon.bg.ac.rs/.../uploads/07-oas-pi-vizualizacija.pdf · CRISP-DM Cross Industry Standard Process for Data Mining •Разумевање

CRISP-DM Cross Industry Standard Process for Data Mining

• Разумевање пословања

• Разумевање података

• Припрема података

• Развој модела

• Евалуација процеса ОЗП

• Примена процеса ОЗП

3

Page 4: Пословна интелигенција (ПИ)odlucivanje.fon.bg.ac.rs/.../uploads/07-oas-pi-vizualizacija.pdf · CRISP-DM Cross Industry Standard Process for Data Mining •Разумевање

Слојевитост процеса ОЗП

4

Page 5: Пословна интелигенција (ПИ)odlucivanje.fon.bg.ac.rs/.../uploads/07-oas-pi-vizualizacija.pdf · CRISP-DM Cross Industry Standard Process for Data Mining •Разумевање

Референтни модел и корисничко упутство

• Референтни модел даје брзи увид у цео процес

• Корисничко упутство даје детаљан преглед за вођење ОЗП пројеката

5

Page 6: Пословна интелигенција (ПИ)odlucivanje.fon.bg.ac.rs/.../uploads/07-oas-pi-vizualizacija.pdf · CRISP-DM Cross Industry Standard Process for Data Mining •Разумевање

Откривање законитости у подацима

• Законитост је основна јединица коју тражимо у подацима.

• Постоје различити модели који говоре из различитог угла о истој законитости.

• Визуални алати су најједноставнији алати за уочавање законитости.

6

Page 7: Пословна интелигенција (ПИ)odlucivanje.fon.bg.ac.rs/.../uploads/07-oas-pi-vizualizacija.pdf · CRISP-DM Cross Industry Standard Process for Data Mining •Разумевање

Визуализација података

• Део припреме података?

• Може да се користи и за визуализацију података, али и за визуализацију модела.

• Разлика између визуелизације података и визуализације модела.

– Алати су исти

– Разлика између података и модела?

7

Page 8: Пословна интелигенција (ПИ)odlucivanje.fon.bg.ac.rs/.../uploads/07-oas-pi-vizualizacija.pdf · CRISP-DM Cross Industry Standard Process for Data Mining •Разумевање

Визуализација података

• Једнодимензионална (униваријабилна)

– Distribution, Box Plot

• Дводимензионална (бибаријабилна)

– Scatter Plot, Sieve Diagram

• Вишедимензионална (мултиваријабилна)

– Mosaic Display, Linear Projection

8

Page 9: Пословна интелигенција (ПИ)odlucivanje.fon.bg.ac.rs/.../uploads/07-oas-pi-vizualizacija.pdf · CRISP-DM Cross Industry Standard Process for Data Mining •Разумевање

Визуализација модела

• Визуализација кластера

• Визуализација ОЗП модела

– Стабло одлучивања

– Линеарна, логистичка регресија (параметри модела)

• Визуализација асоцијативних правила

9

Page 10: Пословна интелигенција (ПИ)odlucivanje.fon.bg.ac.rs/.../uploads/07-oas-pi-vizualizacija.pdf · CRISP-DM Cross Industry Standard Process for Data Mining •Разумевање

Расподела променљиве

10

Page 11: Пословна интелигенција (ПИ)odlucivanje.fon.bg.ac.rs/.../uploads/07-oas-pi-vizualizacija.pdf · CRISP-DM Cross Industry Standard Process for Data Mining •Разумевање

График кутија

11

Page 12: Пословна интелигенција (ПИ)odlucivanje.fon.bg.ac.rs/.../uploads/07-oas-pi-vizualizacija.pdf · CRISP-DM Cross Industry Standard Process for Data Mining •Разумевање

График распршености • Приказује корелацију између двe променљиве

12

Page 13: Пословна интелигенција (ПИ)odlucivanje.fon.bg.ac.rs/.../uploads/07-oas-pi-vizualizacija.pdf · CRISP-DM Cross Industry Standard Process for Data Mining •Разумевање

Левак дијаграм

13

Page 14: Пословна интелигенција (ПИ)odlucivanje.fon.bg.ac.rs/.../uploads/07-oas-pi-vizualizacija.pdf · CRISP-DM Cross Industry Standard Process for Data Mining •Разумевање

Мозаик дијаграм

14

Page 15: Пословна интелигенција (ПИ)odlucivanje.fon.bg.ac.rs/.../uploads/07-oas-pi-vizualizacija.pdf · CRISP-DM Cross Industry Standard Process for Data Mining •Разумевање

PCA (Principal component analysis) АГК (Анализа главних компонената) • Техника која прави компоненте од линеарне

комбинације атрибута тако да: – Су компоненте међусобно некорилисане – Имају појачан варијабилитет (сигнал)

• Компоненти има колико и атрибута, али прва компонента узима највише варијабилитета, па друга, итд. (Постоји хијерархијско устројство)

• Очекује се да се уз помоћ свега пар компоненти може успешно представити цео скуп података

• Компоненте могу да имају и “значење”.

15

Page 16: Пословна интелигенција (ПИ)odlucivanje.fon.bg.ac.rs/.../uploads/07-oas-pi-vizualizacija.pdf · CRISP-DM Cross Industry Standard Process for Data Mining •Разумевање

АГК

16

Page 17: Пословна интелигенција (ПИ)odlucivanje.fon.bg.ac.rs/.../uploads/07-oas-pi-vizualizacija.pdf · CRISP-DM Cross Industry Standard Process for Data Mining •Разумевање

Линеарна пројекција

17

Page 18: Пословна интелигенција (ПИ)odlucivanje.fon.bg.ac.rs/.../uploads/07-oas-pi-vizualizacija.pdf · CRISP-DM Cross Industry Standard Process for Data Mining •Разумевање

Визуализација кластера

• Помоћу стабла одлучивања

• Визуализација центроида

• Визуализација мере квалитета кластеровања

– График силуета

18

Page 19: Пословна интелигенција (ПИ)odlucivanje.fon.bg.ac.rs/.../uploads/07-oas-pi-vizualizacija.pdf · CRISP-DM Cross Industry Standard Process for Data Mining •Разумевање

Кластери + стабла одлучивања

• Сваки кластер модела производи атрибут припадности кластеру, који може да се посматра као излазни атрибут.

• Потом може да се примени класификација (асоцијативна правила, стабло одлучивања, логистичка регресија, итд.) са циљем да се боље објасни добијени кластер.

19

Page 20: Пословна интелигенција (ПИ)odlucivanje.fon.bg.ac.rs/.../uploads/07-oas-pi-vizualizacija.pdf · CRISP-DM Cross Industry Standard Process for Data Mining •Разумевање

Визуализација мера квалитета кластера

20

w(i))max(b(i),

w(i)-b(i)=s(i)

Page 21: Пословна интелигенција (ПИ)odlucivanje.fon.bg.ac.rs/.../uploads/07-oas-pi-vizualizacija.pdf · CRISP-DM Cross Industry Standard Process for Data Mining •Разумевање

График силуета

21

Page 22: Пословна интелигенција (ПИ)odlucivanje.fon.bg.ac.rs/.../uploads/07-oas-pi-vizualizacija.pdf · CRISP-DM Cross Industry Standard Process for Data Mining •Разумевање

Кластеровање може и да се поправи

22

Page 23: Пословна интелигенција (ПИ)odlucivanje.fon.bg.ac.rs/.../uploads/07-oas-pi-vizualizacija.pdf · CRISP-DM Cross Industry Standard Process for Data Mining •Разумевање

Кластери + стабла одлучивања

• Кластер се описује преко атрибута DayMins.

23

Page 24: Пословна интелигенција (ПИ)odlucivanje.fon.bg.ac.rs/.../uploads/07-oas-pi-vizualizacija.pdf · CRISP-DM Cross Industry Standard Process for Data Mining •Разумевање

Визуализација центроида

24

Page 25: Пословна интелигенција (ПИ)odlucivanje.fon.bg.ac.rs/.../uploads/07-oas-pi-vizualizacija.pdf · CRISP-DM Cross Industry Standard Process for Data Mining •Разумевање

Визуализација линеарних модела

• Логистичка регресија

– Визуализација параметера модела

– Визуализација целог модела преко стабла одлучивања

25

Page 26: Пословна интелигенција (ПИ)odlucivanje.fon.bg.ac.rs/.../uploads/07-oas-pi-vizualizacija.pdf · CRISP-DM Cross Industry Standard Process for Data Mining •Разумевање

Визуализација преко номограма

26

Page 27: Пословна интелигенција (ПИ)odlucivanje.fon.bg.ac.rs/.../uploads/07-oas-pi-vizualizacija.pdf · CRISP-DM Cross Industry Standard Process for Data Mining •Разумевање

Фреквентни скупови података

27

Page 28: Пословна интелигенција (ПИ)odlucivanje.fon.bg.ac.rs/.../uploads/07-oas-pi-vizualizacija.pdf · CRISP-DM Cross Industry Standard Process for Data Mining •Разумевање

А приори правило

• Сваки надскуп {јабука, банана} има мању или једнаку подршку (фреквенцију заступљености) у скупу као његови подскупови {јабука}, {банана}

• Нпр. Ако је P({јабука, банана}) = 50%, тада или {јабука} и/или {банана} има већу или једнаку подршку од 50%.

• Исто тако сваки надскуп {јабука, банана, јагода} има мању или једнаку подршку од 50%.

28

Page 29: Пословна интелигенција (ПИ)odlucivanje.fon.bg.ac.rs/.../uploads/07-oas-pi-vizualizacija.pdf · CRISP-DM Cross Industry Standard Process for Data Mining •Разумевање

Фреквентни скупови и асоцијативна правила

• Асоцијативна правила АКО => ТАДА се рачунају из фреквентних скупова података.

• За разлику од фреквентних скупова података, они намећу релацију импликације => између подскупова.

• За претрагу асоцијативних правила дефинисане подршке, потребно је дефинисати и поузданост тј. P(ТАДА|АКО).

29

Page 30: Пословна интелигенција (ПИ)odlucivanje.fon.bg.ac.rs/.../uploads/07-oas-pi-vizualizacija.pdf · CRISP-DM Cross Industry Standard Process for Data Mining •Разумевање

Асоцијативна правила

30

Page 31: Пословна интелигенција (ПИ)odlucivanje.fon.bg.ac.rs/.../uploads/07-oas-pi-vizualizacija.pdf · CRISP-DM Cross Industry Standard Process for Data Mining •Разумевање

Да ли је асоцијативно правило заиста статистички значајно?

31

Page 32: Пословна интелигенција (ПИ)odlucivanje.fon.bg.ac.rs/.../uploads/07-oas-pi-vizualizacija.pdf · CRISP-DM Cross Industry Standard Process for Data Mining •Разумевање

Пословна интелигенција (ПИ)

Откривање законитости у подацима - завршна разматрања

Универзитет у Београду Факултет организационих наука