Upload
khirulnizam-abd-rahman
View
717
Download
0
Embed Size (px)
DESCRIPTION
Title: Algorithm Development of Bidirectional Agglomerative Hierarchical Clustering using AVL Tree with VisualizationBy: Hussain Muhammad Yousef Abu Dabouh2012Universiti Sains Islam Malaysia
Citation preview
I1
i i
i i i
: :
v
7
- 1
v i i
Co n t e n t s
A UT HOR DECL A RA T ION
BIOD A T A OF A UT HOR
A CKNOW L EDGEM ENT
A BST RA K
Pa ge
A B ST RA CT
M UL A K H K H A S A L BA HT H
CONT ENT PA GE
V 11
V l
L IST OF T A BL ESx i i i
L IST OF F IGURES x v i
A B BREV I A T ION x x i i
CH A PT E R I : I NT RO D UCT I ON
1 0 I n t r o du c t io n
1 1 Pr o b le m s ta t e m e n t
1 2 Re se a r c h qu e s t io n s 1 1
1 3 Obje c t iv e s
1 4 M o t i v a t i o n s
1 5 Sc o pe o f the r e se a r c h 12
1 6 Sign i f ic a n c e o f the r e se a r c h 13
1 7 O rga n iz a t io n o f the r e s e a r c h 14
1 8 Su m m a r y
C H A PT E R I I : L I T ERA T UR E REV I EW
2 0 I n t r o du c t io n17
2 1 A n o v e r v ie w o f da ta m in in g 172 2 D a t a m i n i n g m e tho ds
202 2 1 C la s s i f ic a t io n
20
2 2 I I C la s s if ic a t i o n A lgo r i thm s 20
2 2 2 Re g r e s s io n 23
2 2 3 C l u s te r in g 23
2 2 3 1 C l u s t e r i n g A lgo r i thm s 24
Vi i i
2 3 Da ta m in in g appl ic a t io n 25
2 3 ] M ed ic a l 26
2 3 2 En gin e e Dn g 27
2 3 3 Bu s i n e ss an d n n a n e c 29
2 3 4 Edu c a t io n a l 33
2 4 V is u a l iz a t io n 36
2 5 V is u a l iz a t io n tec hn iqu e s 38
2 6 V is u a l da ta m in in g 46
2 7 T r e e 49
2 7 1 So m e Te r m i n o lo g ie s abo u t the t r e e s 50
2 7 2 Bi n a r y Se a r c h T re e (B ST ) 5 1
2 7 2 I Ope r a t io n s o n B in a ry Se a r c h T r æ (B SD 52
2 7 2 I I Se a r c h in g 52
2 7 2 1 2 The M a x im u m a n d the M i n im u m 53
2 7 2 1 3 In se r t io n 54
2 7 2 1 4 The Su c c e ss o r a n d the Pr e de c e s so r 54
2 7 2 1 5 D e le t io n
2 7 3 T r a v e r s a i 56
2 7 4 Se l f - ba la n c in g bin a r y s e a r c h t r e e 57
2 7 4 1 A V L t r e e 57
2 7 4 1 1 Ope r a t io n s o n A V L tr e e 58
2 7 4 I 1 1 I n se r t io n 58
2 7 4 1 1 2 D e le t io n 6 ]
2 7 4 1 2 Ru n n in g T i m e s fo r A V L T r ee s 62
2 8 T r e e v is u a l iz a t io n 62
2 9 Su m m a ry 64
CH A PT ER 【11 : H I ERA RC H I CA L CL UST E RI NG A L GO RI T H M
3 0 In t r o du c t io n 65
3 1 C lu s te r in g a lgo r i thm s 66
3 2 H ie r a r c hic a l Clu s te r in g A lgo r i thm s 67
3 2 ] De v e lo pm e n t o f hie r ar c hic a l c lu s t e Dn g a lgo r i thm s 79
3 2 1 1 A gglo m e r a t i v e N e s t in g (A GNES) 80
M
3 2 1 2 Dv h ; vc A 11Ny s hi (D I A N A ) 80
3 2 1 3 Bn l : 1i1c c [ l hc m t i v c Rc du c in g i u l d C1u Stc > in g
u s in g l l ie i a r c hic s (B IRC I I) 8 ]
3 2 I 4 C l u s te r in g Us in g REp r e se n t : t t iv c s (C U RE) 83
3 2 I 5 C l IA M E I EO N 84
3 2 I 6 RObu s t C lu s tc t in g u s in g l in K s (ROC K ) 84
3 2 I 7 p c l IDr n l : i n e c gu a r a n t e e s o > h ic 1 : : i r c hic l l l cl ust erng 84
3 3 Co mple x i ty o r h ie l a >c hic a l c l u s te r in g 85
3 4 Su n i n i m y 89
C H A PT E R 1v : R ESE A RC I I M 1 (T 11O I ) O L O G Y
4 0 I n tm du c t io n 9 1
4 I Re s e a r c h p r o c e s s f r a m e w o r k
4 1 1 Pr o c e s s s t e ps o f r e s e a r c h pr o c e s s f r a m e w o r k 95
4 1 1 1 U n de r s ta n din g the pr o b le m 95
4 1 1 2 B id i r e c t io n a l a gg l o m e r a t iv e hie r a r c hic a l
c l u s te r in g a lgo r i thm 96
4 1 1 3 D a t a se t 96
4 1 1 4 D a t a m i n in g a lgo r i thm 97
4 1 1 5 Ev a l u a t io n 97
4 1 1 6 K n o w le dge 98
4 1 I 7 V i s u a l iz e the k n o w le dge 98
4 1 1 8 E v a l u a te the i n te g r a te d 98
4 2 Pr o po s e d c o n c e pt u a l f r a m e w o r k 99
4 3 O v e r a l l pha s e s a n d o bje c t i v e s w i th c o n c e p t u a l f r a m e w o r k 10 ]
4 4 Su m m a r y 103
C H A PT E R v : D E V EL O PM E NT O F B I D I R ECT I O N A L
A GG L O M E R A T I V E H I ER A RC H I C A L CL UST E R I N G A L G O R I T H M
5 0 I n tr o du c t io n 104
5 1 A gg lo m e r a t i v e hie r a r c h ic a l c l u s te r i n g u s i n g s in g l e l in k m e t ho d 104
5 1 1 A gg l o m e r a t i v e h ie r a r c hic a l c l u s t e r i n g u s in g s i n gl e l i n k m e tho d :
T he A lgo r i t hm 105
5 I 2 C o m ple x i ty o f a gg l o m c r a t i v c hic > a r c h ic a l c lu s te r i n g u s i n g s in g le
l in k m e tho d 106
5 I 2 I A n c x a n i p lc 107
5 2 B idi r e c t io n a l a gg lo m c r a t i v e hie r a r c hic a l c lu s te r in g u s in g s in g le l i n k
1Tre tho d 125
5 2 I B idi r c c t io n a l a gg lo m c r a t i v e h ie r a r c h ic a l c l u s te r in g u s i n g s i n g le
l i n k n l e tho d : t11c a lgo r i t hn i 126
5 2 2 Co m p le x i ty o f a gg lo m c r a t iv e hic e a r c h ic a l c lu s te r i n g u s in g s i n g le
l i n k m c tho d 127
5 2 2 I A n e x a m p le 129
5 3 D is c u s s i o n 137
5 4 Su m m a r y 138
C H A PT E R V 1 : 1AI D 1R E C T I O N A L A G G L O M E R A T I V E
H 1E R A R C I l l C A L C L UST E R 1N G A L G O R 1T H M P E R F O R M A N C E
E V A L I *A T I O N
6 0 I n t r o du c t io n 139
6 1 B idi r e c t io n a l o f A gg lo m e r a t i v e H ie r a r c hi c a l
C lu s te r in g A 1go r i th m Si m u l a t io n 139
6 1 1 M a i n Pr o to t ype Pa ge 140
6 1 2 L o a d D a t a Pa ge 14 1
6 1 3 Si m i l a r i ty M e a s u r e a n d C l u s te r i n g M e tho d Pa ge 143
6 1 4 E x e c u t io n o f A gg lo m e r a t i v e H ie r a r c h ic a l C l u s te r in g A lgo r i t hm
a n d B id i r e c t io n a l A gg l o m e r a t i v e H ie r a r c hic a l C l u s te r i n g A lgo r. It hm 145
6 2 B id i r e c t io n a ] A gglo m e r a t i v e H ie r a r c hic a l C l u s t e r i n g A lgo r i t hm
E v a l u a t io n 145
6 2 1 E x pe r i m e n ta l D a t a a n d E n v i r o n m e n t 146
6 2 2 E x pe r im e n t a l v a l ida t io n 149
6 2 2 1 Pe r f o r m a n c e Pa r a m e te r 149
6 2 2 I I E x e c u t io n T im e 150
6 2 2 1 2 N u m be r o f C l u s t e r 158
6 3 D i sc u s s i o n ] 72
6 4 Su m m a r y 180
x i
C H A PT E R V I I : EV A L UA T E V ISU A L B 1D I R E C T 1O N A L
A G G L O \ 1E R T I V E H I E R A RC H I C A L C L UST E R I NG A L G O R I T H M
W I T H A V L T R E E
7 0 I n tr o du c t io n 18 1
7 1 V i s u a l i z a t io n B id i r e c t io n a l o f A gg lo m e r a t i v e H ie r a r c hic a l C l u s te r i n g
A lgo r i thm 182
7 2 R e s u l t o f V i s u a l iz a t io n Pr o to ty pe E v a l u a t io n 188
7 2 1 Re s po n de n t Pr o f i le 189
7 2 2 U s ab i l i ty t e s t f o r V i s u a l iz a t i o n P r o t o ty pe o f B id i r e c t io n a l o f
A gg l o m e r a t i v e H ie r a r c hic a l Cl ust e i n g A lgo r i th m (B A H CA ) 189
7 2 3 D a t a a n a ly s i s 190
7 2 3 1 D e s c r i p t i v e a n a l y s i s 190
7 2 3 1 1 O v e r a l l Sa t i s f a c t io n 193
7 2 3 1 1 1 Pe r c e i v e d o f U s e f u l n e s s 193
7 2 3 1 1 2 Pe r c e i v e d Ea s e o f U s e 200
7 2 3 1 1 3 U s e r Sa ti s f a c t i o n 204
7 2 3 1 1 4 A t t r ibu t e o f U s a b i l i ty 209
7 3 D is c u s s i o n 2 13
7 4 Su m m a r y 2 14
C H A PT E R V I I I : C O N C L U SI O N
8 1 In t r o d u c t i o n 2 16
8 2 T he a c hie v e m e n t s o f the s t u dy'
s o bje c t i v e s 2 16
8 3 Co n s t r a i n ts a n d l im i t a t i o n s 2 18
8 4 C o n t r ibu t io n o f s t u dy 2 19
8 5 R e c o m m e n da t io n s f o r f u t u r e w o r k 2 19
8 5 1 A gg l o m e r a t i v e hie r a r c hi c a l c l u s t e r in g d a t a m i n i n g a l go r i th m 220
8 5 2 V i s u a l iz a t i o n 220
8 5 3 M e t ho do lo gy 22 ]
8 6 Su m m a r y 22 ]