26
CLUSE TV programi za razvrˇ canje v skupine priroˇ cnik Vladimir Batagelj Ljubljana 24. maj 2003

CLUSE TV - Vladimir Batageljvlado.fmf.uni-lj.si/vlado/podstat/Cluse/CluseTV.pdfC L U S E / TV – programi za razvrˇsˇcanje v skupine 2 Vladimir Batagelj CLUSE/TV – priroˇcnik

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: CLUSE TV - Vladimir Batageljvlado.fmf.uni-lj.si/vlado/podstat/Cluse/CluseTV.pdfC L U S E / TV – programi za razvrˇsˇcanje v skupine 2 Vladimir Batagelj CLUSE/TV – priroˇcnik

CLUSETV

programi za razvrscanje v skupine

prirocnik

Vladimir Batagelj

Ljubljana24. maj 2003

Page 2: CLUSE TV - Vladimir Batageljvlado.fmf.uni-lj.si/vlado/podstat/Cluse/CluseTV.pdfC L U S E / TV – programi za razvrˇsˇcanje v skupine 2 Vladimir Batagelj CLUSE/TV – priroˇcnik

C L U S E / TV – programi za razvrscanje v skupine 2

Vladimir BatageljCLUSE/TV – prirocnikc©1992 Vladimir Batagelj

CLUSE/TV se lahko namesca na uporabnikov(e) racunalnik(e) le, kakor je dogovorjeno v pogodbi.Prepovedano je razsirjanje paketa tretjim osebam. Prepovedano je tudi kopiranje paketa ali ses-tavnih programov ter njihovo spreminjanje s strani tretjih oseb.

Pri objavi rezultatov, dobljenih z uporabo paketa CLUSE/TV, je potrebno to omeniti.Paket CLUSE se na racunalnikih PC uporablja ze nekaj let in daje pravilne rezultate. Vendar

avtor ne prevzema nobene odgovornosti za morebitne napacne rezultate in njihove posledice.Pripravljen pa je v kakem programu iz paketa odkrito napako brezplacno odpraviti in narocnikudostaviti popravljeno verzijo programa.

BATAGELJ, VladimirCLUSE/TV, programi za razvrscanje v skupine.

Prirocnik / Vladimir Batagelj. – verzija, januar 1994. –Ljubljana, 1994.

Prirocnik je bil pripravljen v emTEXu, avtor Eberhard Mattes, na racunalniku PC AT in izpisan sprogramom DVIPS na laserskem tiskalniku.

Page 3: CLUSE TV - Vladimir Batageljvlado.fmf.uni-lj.si/vlado/podstat/Cluse/CluseTV.pdfC L U S E / TV – programi za razvrˇsˇcanje v skupine 2 Vladimir Batagelj CLUSE/TV – priroˇcnik

KAZALO 3

Kazalo

1. Uvod 51.1 Programi za pripravo podatkov . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51.2 Programi za razvrscanje: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61.3 Programi za prikaz in analizo razvrstitev . . . . . . . . . . . . . . . . . . . . . . . 6

2. Datoteke paketa CLUSE 7

3. Osnovni program 103.1 Skupina ≡ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

3.1.1 Moznost About . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103.1.2 Moznost User . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103.1.3 Moznost Calendar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103.1.4 Moznost Calculator . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

3.2 Skupina Environment . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113.2.1 Moznost View . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113.2.2 Moznost Change dir... . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113.2.3 Moznost Load ENV file... . . . . . . . . . . . . . . . . . . . . . . . . . . 113.2.4 Moznost Save ENV file... . . . . . . . . . . . . . . . . . . . . . . . . . . 113.2.5 Moznost Select files . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113.2.6 Moznost Parameters . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113.2.7 Moznost DOS shell . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113.2.8 Moznost Exit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

3.3 Skupina Matrices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113.3.1 Moznost Select . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113.3.2 Moznost Transpose . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123.3.3 Moznost Normalize . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123.3.4 Moznost Real data dissimilarity . . . . . . . . . . . . . . . . . . . . . 123.3.5 Moznost Binary data dissimilarity . . . . . . . . . . . . . . . . . . . 123.3.6 Moznost Transform . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153.3.7 Moznost Copy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

3.4 MAKENAMS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

4. Programi za razvrscanje 174.1 HICLUS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 174.2 UNITRA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 174.3 LEADER . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 174.4 PARETRA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 184.5 HICLOR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

5. Pregledovanje in analiza razvrstitev 195.1 OUTNAM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 195.2 VARANA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 195.3 CLOUNT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 195.4 STABLE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 195.5 DENTEX . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 195.6 MATEX . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

Page 4: CLUSE TV - Vladimir Batageljvlado.fmf.uni-lj.si/vlado/podstat/Cluse/CluseTV.pdfC L U S E / TV – programi za razvrˇsˇcanje v skupine 2 Vladimir Batagelj CLUSE/TV – priroˇcnik

KAZALO 4

A Namestitev paketa CLUSE/TV na disk 22

B Primer obdelave 22

Page 5: CLUSE TV - Vladimir Batageljvlado.fmf.uni-lj.si/vlado/podstat/Cluse/CluseTV.pdfC L U S E / TV – programi za razvrˇsˇcanje v skupine 2 Vladimir Batagelj CLUSE/TV – priroˇcnik

1. UVOD 5

1. Uvod

CLUSE je zbirka programov za razvrscanje v skupine. Prve programe sem napisal v letih1976-77 v STRUCTRANu (strukturiranem fortranu) za racunalnik CYBER. Okrog leta 1980je CLUSE pokrival osnovne postopke razvrscanja in ze vseboval nekaj posebnosti (relacijskaomejitev). Ko je RCU dobil racunalnik DEC 10, sem programe prenesel tudi nanj. Leta 1986sem zacel prenasati programe na osebni racunalnik ATARI ST. Zaradi nekaterih pomanjkljivostiATARIjevega fortrana sem programe prepisal v pascal. Na ATARIju se je CLUSE razsiril sprogramom za graficne prikaze vecrazseznih podatkov (zvezde, Andrewsove krivulje in obrazi),programom za razvrscanje casovnih vrst in programi za veckriterijsko razvrscanje. Leta 1988sem zacel prenasati CLUSE z ATARIja na racunalnik (IBM) PC. Napisal sem tudi nekaj novihprogramov.

Za novoletne praznike 1991/92 sem zacel s povezovanjem programov v paket CLUSE/TV, pricemer sem za uporabniski vmesnik izbral Borlandov Turbo Vision. Prenos programov in pove-zovanje se ni zakljuceno. Vendar kljub temu CLUSE/TV vsebuje vecino programov iz prejsnjihizvedb, poleg tega pa je dodanih vec novih storitev, ki precej olajsujejo pripravo podatkov.CLUSE/TV pozna tri stopnje povezanosti programov:

• vgrajenost v osnovni program;

• osnovni program pripravi podatke in sprozi loceni program;

• v osnovnem programu pripravimo podatke in v DOS Shellu zahtevamo izvajanje programa.

V naslednjih izvedbah bom poskrbel za vecjo povezanost in razsiril zmogljivosti paketa.V naslednjem seznamu so zbrani programi iz dosedanjih izvedb paketa CLUSE. Oznake za

imeni programov pomenijo:

CYB – program je napisan za CYBER;DEC – program je napisan/prirejen za DEC 10;ST – program je napisan/prirejen za ATARI ST;PC – program je napisan/prirejen za PC;TV – program je vgrajen v CLUSE/TV;BAT – program je dograjen k CLUSE/TV;DOS – program je dosegljiv iz CLUSE/TV;• – program bo vkljucen v eno naslednjih izvedb CLUSE/TV.

1.1 Programi za pripravo podatkov

STANDA TV normalizacija realnih (realna stevila) surovih podatkov;TRANS DOS transpozicija realnih matrik;CLDISS TV razlicnosti med realnimi podatki;CLASCO TV podobnosti med dvojiskimi podatki;CLUCON DEC • razlicnosti med imenskimi podatki;CLOPY TV transformacije matrik razlicnosti;COPYDIS TV prepis matrik razlicnosti v izbrano obliko;NAMSCL ST imena enot iz datoteke surovih podatkov;MAKENAMS DOS priprava datoteke imen enot ali spremenljivk;CLUSEL DOS izbor spremenljivk iz datoteke realnih podatkov.

Page 6: CLUSE TV - Vladimir Batageljvlado.fmf.uni-lj.si/vlado/podstat/Cluse/CluseTV.pdfC L U S E / TV – programi za razvrˇsˇcanje v skupine 2 Vladimir Batagelj CLUSE/TV – priroˇcnik

1. UVOD 6

1.2 Programi za razvrscanje:

PRECLA PC • razvrscanje s polnim preborom;HICLUS BAT postopki zdruzevanja;CLADD • postopki dodajanja;UNITRA BAT razvrscanje v k skupin z lokalno optimizacijo;LEADER BAT metoda voditeljev za velika realna podatkovja;LEADIH CYB metoda voditeljev za dvojiske podatke;MODANA DEC • razvrscanje z iskanjem zgoscisc;FISHER PC • razvrscanje z dinamicnim programiranjem –

omejitev: linearna urejenost enot;TRIADS • razvrscanje triad;CLUGRA DEC • grafovske metode razvrscanja;HICLUR PC • postopki zdruzevanja za relacijsko omejitev;CLUVAR DEC razvrscanje z lokalno optimizacijo za relacijsko omejitev

in/ali omejitev na vrednost spremenljivke;CLUDKA ST razvrscanje casovnih vrst z lokalno optimizacijo;PARETO ST veckriterijsko razvrscanje s polnim preborom;PAREHI ST veckriterijsko razvrscanje z zdruzevanjem;PARETRA DOS veckriterijsko razvrscanje z lokalno optimizacijo;HICLOR DOS veckriterijsko razvrscanje z zdruzevanjem

z uporabo odlocitvenih pravil.

1.3 Programi za prikaz in analizo razvrstitev

OUTNAM DOS izpis razvrstitev z imeni enot;VARANA DOS analiza realnih surovih podatkov po skupinah;CLOUNT DOS analiza usklajenosti razvrstitev;STABLE DOS trdne skupine v razvrstitvah;LISTVA DEC izpis spremenljivk;DISPLAY ST • graficne predstavitve vecrazseznih realnih podatkov;

2D, dinamicni 3D, zvezde, obrazi, Andrewsove krivulje;DENTEX DOS opis drevesa razvrstitve v LATEXu;MATEX DOS opis matrike v LATEXu.

Paket CLUSE/TV vsebuje programe z oznakami TV, BAT in DOS.Paket CLUSE/TV obstaja v treh izvedbah, ki se locijo predvsem po tem, kako velike so

lahko matrike razlicnosti:

demo izvedba do 12 enot;studijska izvedba do 30 enot;raziskovalna izvedba do 100 enot.

Page 7: CLUSE TV - Vladimir Batageljvlado.fmf.uni-lj.si/vlado/podstat/Cluse/CluseTV.pdfC L U S E / TV – programi za razvrˇsˇcanje v skupine 2 Vladimir Batagelj CLUSE/TV – priroˇcnik

2. DATOTEKE PAKETA CLUSE 7

2. Datoteke paketa CLUSE

CLUSE/TV uporablja pri svojem delu vec vrst datotek. Priporocljivo je, da za analizo posame-znega podatkovja ustvarimo posebno podrocje na disku – tako, da ne pride do zmesnjave. Tekoconastavitev vrednosti parametrov in datotek si CLUSE/TV shrani v datoteko z opisom okoljaCLUSE.ENV.

Za to, da bodo programi paketa CLUSE/TV dosegljivi z vsakega podrocja, dodajte obnamestitvi paketa v ukaz PATH v datoteki AUTOEXEC.BAT ustrezno pot. Lahko pa namesto tega,za to poskrbite vsakic posebej pred zacetkom dela s paketom z zahtevo oblike

c:\cluse\clusepath c:

Ce je CLUSE/TV namescen na disku d, zamenjajte v tej zahtevi oba c: z d: . Pozor ! Tazahteva nima zelenega ucinka, ce je narejena znotraj NORTONa – zato pred zahtevo s tipko F10zapustite NORTON.

��

��ANA, LDN, LDR

��

��ENV, LST, TEX

��

��DAT, DIS

��

��DES, RAW

NAM, VAR

?

?

6�

��+

��3

���

��

@@I

@@R ?

QQkQ

QQs

@@R

@@I

��

���

PRIPRAVAPODATKOV

RAZVRSCANJE PRIKAZIANALIZE

Slika 1: Datoteke programov CLUSE/TV

Zelo priporocljivo je tudi, da uporabljate naslednje podaljske za posamezne vrste CLUSEovihdatotek:

ENV datoteka z opisom okolja;RAW surovi podatki;DES opis podatkov in datotek;DAT normalizirani podatki;NAM imena enot;VAR imena spremenljivk;DIS matrika razlicnosti;REL relacijska omejitev;LST izpisi programov;ANA rezultati analiz;TEX opis drevesa razvrscanja v LATEXu;

Page 8: CLUSE TV - Vladimir Batageljvlado.fmf.uni-lj.si/vlado/podstat/Cluse/CluseTV.pdfC L U S E / TV – programi za razvrˇsˇcanje v skupine 2 Vladimir Batagelj CLUSE/TV – priroˇcnik

2. DATOTEKE PAKETA CLUSE 8

LDR stari voditelji;LDN novi voditelji

Vsi programi paketa CLUSE/TV pricakujejo na datoteki CLUSE.ENV pravilno pripravljenookolje. Tega pripravimo, vnesemo z datoteke ali shranimo na datoteko v osnovnem programu.

Podatkovne datoteke praviloma pripravljamo z urejevalniki za znakovne datoteke, ki v da-toteko ne vkljucujejo dodatnih znakov za oblikovanje besedila. Na primer, ce uporabljamoprogram WordStar, pripravljamo podatke v nacinu N (nondocument).

Ceprav ni obvezno, je priporocljivo, da za posamezno skupino podatkov pripravimo njen opisna datoteki *.DES.

Imena na datotekah *.NAM in *.VAR so zapisana po 7 v vrstico. Vsako ime je dolgo po 10znakov. Pri pripravi datotek *.NAM in *.VAR je potrebno poskrbeti, da urejevalnik na zamenjazaporednih presledkov s predelcniki (tabulatorji). V primeru tezav, nadomestite presledke skakim zapolnjevalnim znakom, kot so _, . in - .

Tako za podatke o clanstvu ZKJ in ZZBNOV v letu 1978 pripravimo naslednje datoteke:

datoteka ZBZK.DES :

CLANI ZKJ IN ZZBNOV V LETU 1978

Za vsako od 8 enot (republike in pokrajini SFRJ) sta podanaodstotek clanov ZKJ in ZZBNOV v celotnem prebivalstvu za leto 1978.

Datoteke:ZBZK.DES ta datotekaZBZK.ENV okolica CLUSE_TVZBZK.RAW surovi podatkiZBZK.NAM imena republik in pokrajinZBZK.VAR imeni organizacij

Vir:Statisti~ni koledar Jugoslavije, 1980.

Literatura:Ferligoj A.: Razvr{~anje v skupine. Metodolo{ki zvezki 4.

Ljubljana 1989.------------------------------------------------------------------------verzija 1: 8. okt 1988 ZBZK.RAW, ZBZH.NAM, ZBZK.VARverzija 2: 23. feb 1992 ZBZK.DES, ZBZK.ENV

datoteka ZBZK.NAM :

B i H Crna Gora Hrvatska MakedonijaSlovenija OzjaSrbijaKosovoVojvodina

datoteka ZBZK.VAR :

Z K J ZZBNOV

Surove podatke pripravimo na datoteki *.RAW (ali *.DAT).Ce so enote realni vektorji so zapisane po vrsticah. Vsaka enota zacne v novi vrstici.

Posamezni podatki so loceni vsaj z enim presledkom. Pri dvojiskih podatkih pa so podatki

Page 9: CLUSE TV - Vladimir Batageljvlado.fmf.uni-lj.si/vlado/podstat/Cluse/CluseTV.pdfC L U S E / TV – programi za razvrˇsˇcanje v skupine 2 Vladimir Batagelj CLUSE/TV – priroˇcnik

2. DATOTEKE PAKETA CLUSE 9

napisani strnjeno. Vsaki enoti pripada en stolpec.

datoteka ZBZK.RAW :

7.09 2.8311.00 6.016.67 5.776.48 3.656.07 6.849.13 5.645.17 2.889.59 4.85

CLUSE dela z matrikami razlicnosti, ki so na datotekah *.DIS podane kot zgornji trikotnikz diagonalo. Oblika zapisa je prosta – zaporedna podatka sta locena vsaj z enim presledkom.

Do matrik razlicnosti pridemo s programi za izracun razlicnosti, z njihovo transformacijo alipa jo vnesemo sami:

datoteka POLIT1.DIS :

0 2 7 8 5 9 2 6 8 8 8 90 8 8 8 9 1 7 9 9 9 9

0 3 5 8 7 2 8 3 5 60 8 7 7 3 8 2 3 8

0 7 7 5 6 7 9 50 9 7 7 4 7 5

0 5 9 8 8 90 6 5 6 5

0 8 8 60 4 6

0 80

Relacijsko omejitev podamo tako, da opisemo graf relacije.

datoteka SOMETY.REL :

-2 1 4-3 1 2 5 6-4 8-5 7-6 4 5 7-7 10-8 6 9 10-9 4-10 7

Pri tem negativno stevilo pove tocko, naslednja pozitivna stevila pa podajajo njene neposrednenaslednike.

Na podpodrocju DATA so ze pripravljena naslednja podatkovja:

Page 10: CLUSE TV - Vladimir Batageljvlado.fmf.uni-lj.si/vlado/podstat/Cluse/CluseTV.pdfC L U S E / TV – programi za razvrˇsˇcanje v skupine 2 Vladimir Batagelj CLUSE/TV – priroˇcnik

3. OSNOVNI PROGRAM 10

ZBZK clanstvo ZKJ in ZZBNOV v letu 1978 po republikah;EUROPE Evropske drzave;IRIS Fisherjevi podatki o irisih;RELCON podatki iz clanka Some types ...”POLIT Everittovi podatki o politikih druge svetovne vojne;KINSHIP Kim in Rosenbergovi podatki o sorodstvenih terminih.

3. Osnovni program

Osnovni program pozenemo z zahtevo

CLUSE_TV

Trenutno omogoca dolocitev in spreminjanje okolja, pripravo podatkov, izracun in transformacijematrik razlicnosti ter dostop do osnovnih postopkov razvrscanja.

Ko pozenemo program se znajdemo v osnovnem oknu. Ce imamo misko, je delo s programomzelo enostavno – postavimo se na izbrano moznost in kliknemo. Seveda pa lahko shajamo tudisamo s tipkovnico. V glavno izbiro v vrhnji vrstici pridemo s pritiskom na funkcijsko tipko F10.S hkratnim pritiskom na tipki Alt in X, kar zapisemo Alt-X, zapustimo program. Programskopomoc dobimo s pritiskom na tipko F1.

Glavno izbiro sestavljajo naslednje skupine moznosti: ≡, Environment, Matrices, Clustering,Analysis, Windows in Options.

Po glavni izbiri se sprehajamo s smernima tipkama levo← in desno→. V posamezno skupinovstopimo tako, da se postavimo nanjo in pritisnemo tipko Enter ali pa tipko dol ↓. V skupinolahko vstopimo tudi tako, da hkrati pritisnemo tipko Alt in poudarjeni znak v imenu skupine.Tako nas zahteva Alt-W prestavi v skupino Windows.

S smernima tipkama gor ↑ in dol ↓ se sprehajamo po moznostih; s tipko Enter izberemotekoco moznost; s smernima tipkama levo ← in desno → se premikamo po skupinah. S tipkoEsc lahko (skoraj) vselej preklicemo zadnjo izbiro.

V nekaterih moznostih (npr. Files, Parameters, . . . ) lahko spreminjamo vrednosti vposameznih poljih. Po poljih se premikamo s tipkama Tab (naprej) in Shift-Tab (nazaj).Vrednosti potrdimo in zapustimo moznosti pripadajoce okno tako, da se postavimo na moznostOk in pritisnemo na tipko Enter ali kliknemo na Ok.

Poglejmo si sedaj posamezne skupine.

3.1 Skupina ≡

3.1.1 Moznost About

Podatki o izvedbi paketa CLUSE/TV.

3.1.2 Moznost User

Podatki o uporabniku paketa CLUSE/TV.

3.1.3 Moznost Calendar

Koledarcek. Na zacetku prikazuje tekoci koledarski mesec. S tipkama gor in dol pa se lahkopremikamo skozi druge mesece. Koledarcek zapustimo tako, da z misko kliknemo na kvadratekna vrhu okvirja, ali pa z zahtevo Alt-F3.

Page 11: CLUSE TV - Vladimir Batageljvlado.fmf.uni-lj.si/vlado/podstat/Cluse/CluseTV.pdfC L U S E / TV – programi za razvrˇsˇcanje v skupine 2 Vladimir Batagelj CLUSE/TV – priroˇcnik

3. OSNOVNI PROGRAM 11

3.1.4 Moznost Calculator

Racunalo z osnovnimi racunskimi operacijami.

Koledarcek in racunalo sta standardna dodatka – primera okolja Turbo Vision.

3.2 Skupina Environment

3.2.1 Moznost View

Omogoca pregledovanje znakovnih datotek. Glej se skupino moznosti Windows.

3.2.2 Moznost Change dir...

Prestavimo se na nov imenik (podrocje na disku).

3.2.3 Moznost Load ENV file...

Vnesemo shranjeno CLUSE-okolje z datoteke.

3.2.4 Moznost Save ENV file...

Shranimo tekoce CLUSE-okolje na datoteko.

3.2.5 Moznost Select files

Dolocimo datoteke tekocega CLUSE-okolja.

3.2.6 Moznost Parameters

Dolocimo parametre podatkov in tekocega CLUSE-okolja.

3.2.7 Moznost DOS shell

Zacasno se prestavimo nazaj v DOS, kjer lahko uporabljamo obicajne DOSove ukaze, na primerDIR, lahko pa zahtevamo tudi izvajanje programov paketa CLUSE/TV, ki se niso povezani zosnovnim programom. Za take programe moramo pred tem pripraviti ustrezno okolje.

DOS shell zapustimo z ukazom EXIT. Vrnemo se nazaj v osnovni program.

3.2.8 Moznost Exit

Zapustimo osnovni program in se vrnemo v DOS.

3.3 Skupina Matrices

3.3.1 Moznost Select

Izbira spremenljivk.DOS shell CLUSEL

datoteke:EXT – stara RAWMIX – stara VAR

Page 12: CLUSE TV - Vladimir Batageljvlado.fmf.uni-lj.si/vlado/podstat/Cluse/CluseTV.pdfC L U S E / TV – programi za razvrˇsˇcanje v skupine 2 Vladimir Batagelj CLUSE/TV – priroˇcnik

3. OSNOVNI PROGRAM 12

RAW – nova RAWVAR – nova VAR

3.3.2 Moznost Transpose

Transpozicija realne ali celostevilske matrike.DOS shell TRANS

datoteke:MIX – vhodna matrikaEXT – izhodna, transponirana matrika

3.3.3 Moznost Normalize

V prejsnjih izvedbah je tej moznosti ustrezal program STANDA. Moznost omogoca normalizacijo(standardizacijo) stolpcev (spremenljivk) realne matrike, ki je podana v prostem zapisu (vsakaenota je zaporedje realnih stevil locenih vsaj z enim presledkom) na vhodni datoteki name.RAW.Normalizirana matrika se shrani na izhodno datoteko name.DAT.

Izbiramo lahko med naslednjimi moznostmi:

z =x−mX

sX

z =x−minX

max X −minX

z =x

max X, x > 0

z =x

mX, x > 0

3.3.4 Moznost Real data dissimilarity

V prejsnjih izvedbah je tej moznosti ustrezal program CLDISS. Za na vhodni datoteki name.RAWali name.DAT podane realne podatke izracuna matriko izbrane mere razlicnosti. Njen zgornjitrikotnik z diagonalo shrani izpisan po vrsticah na izhodno datoteko name.DIS.

Na voljo so mere razlicnosti podane v tabeli 3.3.4.

3.3.5 Moznost Binary data dissimilarity

V prejsnjih izvedbah je tej moznosti ustrezal program CLASCO. Za na vhodni datoteki name.RAWpodane dvojiske podatke (POZOR: stolpci so enote, vrstice pa spremenljivke; podatki so napisanistrnjeno) izracuna matriko izbrane dvojiske mere razlicnosti. Njen zgornji trikotnik z diagonaloshrani izpisan po vrsticah na izhodno datoteko name.DIS. Ce je izbrana mera podobnost, jepotrebno pred uporabo postopkov razvrscanja te matrike se predelati v matrike razlicnosti.

Za vsak par enot (dvojiskih vektorjev) X, Y ∈ E lahko vpeljemo stevce:

a = XY – stevilo lastnosti skupnih enotama X in Y ,b = XY – stevilo lastnosti, ki jih enota X ima, enota Y pa nima,c = XY – stevilo lastnosti, ki jih enota Y ima, enota X pa nima,d = XY – stevilo lastnosti, ki jih nima nobena od enot X in Y .

Page 13: CLUSE TV - Vladimir Batageljvlado.fmf.uni-lj.si/vlado/podstat/Cluse/CluseTV.pdfC L U S E / TV – programi za razvrˇsˇcanje v skupine 2 Vladimir Batagelj CLUSE/TV – priroˇcnik

3. OSNOVNI PROGRAM 13

Tabela 1: Mere razlicnosti med realnimi vektorji

n mera obrazec obseg razred

1 Evklidska r.

√√√√ n∑i=1

(xi − yi)2 [0,∞) M(2)

2 Evklidska2 r.n∑

i=1

(xi − yi)2 [0,∞) M(2)2

3 r. Manhattann∑

i=1

|xi − yi| [0,∞) M(1)

4 trdnjavska r.n

maxi=1|xi − yi| [0,∞) M(∞)

5 r. Minkowskega p

√√√√ n∑i=1

(xi − yi)p [0,∞) M(p)

6 Canberran∑

i=1

|xi − yi||xi + yi|

[0,∞)

7 Heincke

√√√√ n∑i=1

(|xi − yi||xi + yi|

)2 [0,∞)

8 Samouravnotezenan∑

i=1

|xi − yi|max(xi, yi)

[0,∞)

9 Lance-Williams∑n

i=1 |xi − yi|∑ni=1 xi + yi

[0,∞)

10 korelacijski k.cov(X, Y )√

var(X)var(Y )[1,−1]

Velja a+ b+ c+d = m. S temi stevci lahko definiramo celo vrsto mer razlicnosti med dvojiskimienotami. Pri tem predpostavimo, da so vse lastnosti enako pomembne.

V paketu CLUSE/TV so na voljo dvojiske mere razlicnosti podane v tabeli 3.3.5). Koeficientep1, p2, p3, p4, q1, q2, q3, q4 pri meri General doloci uporabnik.

V nekaterih primerih so obrazci za posamezno mero nedoloceni (izrazi oblike 00). V paketu

CLUSE/TV je problem nedolocenosti razresen tako, da so ustrezno dodefinirane vrednosti v tehprimerih.

Jaccardovo podobnost definiramo s predpisom

s4 =

{1 d = m

aa+b+c sicer

Tako zagotovimo, da je s4(X, X) = 1.Da ohranimo monotono povezanost med Kulczynskijevo in Jaccardovo mero T = 1

s4− 1

postavimo

s−13 = T =

0 a = 0, d = m∞ a = 0, d < mb+ca sicer

OznacimoKx =

a

a + xK ′

x =d

d + x

Page 14: CLUSE TV - Vladimir Batageljvlado.fmf.uni-lj.si/vlado/podstat/Cluse/CluseTV.pdfC L U S E / TV – programi za razvrˇsˇcanje v skupine 2 Vladimir Batagelj CLUSE/TV – priroˇcnik

3. OSNOVNI PROGRAM 14

Tabela 2: Dvojiske mere razlicnosti

n mera obrazec obseg razred1 Russel and Rao (1940) a

n [1, 0]

2 Kendall, Sokal-Michener (1958) a+dn [1, 0] S

3 Kulczynski (1927), T−1 b+ca [∞, 0] T

4 Jaccard (1908) aa+b+c [1, 0] T

5 Kulczynski 12( a

a+b + aa+c) [1, 0]

6 Sokal & Sneath (1963), un414( a

a+b + aa+c + d

d+b + dd+c) [1, 0]

7 Driver & Kroeber (1932), Ochiai (1957) a√(a+b)(a+c)

[1, 0]

8 Sokal & Sneath (1963), un5ad√

(a+b)(a+c)(d+b)(d+c)[1, 0]

9 Q0bcad [0,∞] Q

10 Yule (1927), Q ad−bcad+bc [1,−1] Q

11 Pearson, φ ad−bc√(a+b)(a+c)(d+b)(d+c)

[1,−1]

12 – bc – 4bcn2 [0, 1]

13 Baroni-Urbani, Buser (1976), S∗∗ a+√

ada+b+c+

√ad

[1, 0]

14 Braun-Blanquet (1932) amax(a+b,a+c) [1, 0]

15 Simpson (1943) amin(a+b,a+c) [1, 0]

16 Michael (1920) 4(ad−bc)(a+d)2+(b+c)2

[1,−1]

17 General p1a+p2b+p3c+p4d

q1a+q2b+q3c+q4d

in postavimob = 0⇒ Kb = K ′

b = 1

c = 0⇒ Kc = K ′c = 1

S temi kolicinami lahko zapisemo

s5 =12(Kb + Kc)

s6 =14(Kb + Kc + K ′

b + K ′c)

s7 =√

KbKc

s8 =√

KbKcK ′bK

′c

s11 = φ =

{s8 bc = 0

ad−bc√(a+b)(a+c)(d+b)(d+c)

sicer

Za mere vrste Q postavimo

s9 = Q0 =

{1 ad = bcbcad sicer

Page 15: CLUSE TV - Vladimir Batageljvlado.fmf.uni-lj.si/vlado/podstat/Cluse/CluseTV.pdfC L U S E / TV – programi za razvrˇsˇcanje v skupine 2 Vladimir Batagelj CLUSE/TV – priroˇcnik

3. OSNOVNI PROGRAM 15

od koder po enakovrednosti glede na urejenost izhaja s10 = 0 for ad = bc.Za Baroni-Urbanijevo in Braun-Blanquetovo mero postavimo s13 = s14 = 1, ce je b + c = 0;

ter za Simpsonovo mero s15 = 1, za bc = 0.

3.3.6 Moznost Transform

V prejsnjih izvedbah je bila ta moznost vgrajena v posamezne programe za izracun razlicnosti /podobnosti. V paketu CLUSE/TV so te moznosti zbrane skupaj in precej razsirjene. Delujejonad datotekami DIS.

Na voljo imamo:

Copy Di ← Dj

Add d Di ← Di + Dj

Diag a diagDi ← diaga

Abs d di ← |dj |Max (a, d) di ← max(a, dj)Linear ad + b di ← a · dj + b

Power da di ← daj

Trans d/(a− d) di ← dj/(a− dj)

3.3.7 Moznost Copy

Prepisivanje matrik razlicnosti v izbrane oblike – povezava paketa CLUSE/TV z drugimi pro-grami za analizo podatkov.

DOS shell COPYDISProgram deluje na datotekah DIS. Tiste, ki jih zelimo uporabiti morajo biti definirane v

okolju.Program COPYDIS najprej prepise matriko(i) z ene ali dveh vhodnih datotek v pomnilnik,

kjer lahko posamezni del matrike se zapolnimo z izbrano konstanto, in nato izpise v izbraniobliki na izhodno datoteko.

Program pozna naslednje oblike matrik:

sq – kvadratna matrika;up – zgornje trikotna matrika;low – spodnje trikotna matrika;up+d – zgornje trikotna matrika z diagonalo;low+d – spodnje trikotna matrika z diagonalo.

ki se nanasajo tako na obliko zapisa na vhodni datoteki, nacin vnosa matrike v pomnilnik(matrix allocation) in na obliko izpisa na izhodno datoteko. Za vse oblike matrik programpricakuje, da so na datoteki zapisane po vrsticah.

Program tudi omogoca, da preskocimo nekaj vrstic (header lines) na zacetku vhodne da-toteke oziroma, da jih dopisemo na zacetku in/ali koncu (footer lines) izhodne datoteke.Dolocilo lines=1 pove/zahteva, da se podatki za vsako vrstico zacenjajo v novi vrstici. Priizpisu matrike lahko s spaces=1 zahtevamo, da sta zaporedna podatka v vrstici zagotovo locenaz vsaj enim presledkom.

Page 16: CLUSE TV - Vladimir Batageljvlado.fmf.uni-lj.si/vlado/podstat/Cluse/CluseTV.pdfC L U S E / TV – programi za razvrˇsˇcanje v skupine 2 Vladimir Batagelj CLUSE/TV – priroˇcnik

3. OSNOVNI PROGRAM 16

3.4 MAKENAMS

Priprava datotek z imeni enot ali spremenljivk. Program je dosegljiv iz DOS Shella.

vhodne datoteke:izhodne datoteke: NAM ali VAR

Page 17: CLUSE TV - Vladimir Batageljvlado.fmf.uni-lj.si/vlado/podstat/Cluse/CluseTV.pdfC L U S E / TV – programi za razvrˇsˇcanje v skupine 2 Vladimir Batagelj CLUSE/TV – priroˇcnik

4. PROGRAMI ZA RAZVRSCANJE 17

4. Programi za razvrscanje

Programi se niso predelani za okolje Turbo Vision – bodo pa v naslednji verziji. Zato njihovopis vsebuje le najnujnejsa dejstva.

4.1 HICLUS

Postopki zdruzevanja. Vgrajen v CLUSE/TV.

vhodne datoteke: DIS, NAMizhodne datoteke: LST, ANA

Ukazi

general minimum maximum average ward ward2endrun names titledendro table reorder clusters matrix shadowhelp comment save params plotmode-d mode-p

4.2 UNITRA

Razvrscanje z lokalno optimizacijo. Vgrajen v CLUSE/TV.

vhodne datoteke: DIS, NAMizhodne datoteke: LST, ANA

4.3 LEADER

Metoda voditeljev za obsezna realna podatkovja. Vgrajen v CLUSE/TV.

vhodne datoteke: RAW ali DAT, MIX/LDR – zacetni voditeljiizhodne datoteke: LST, ANA, EXT/LDN – novi voditelji

leng nvmaxdemo 200 12student 600 30research 9000 200

ldrmax =leng

2nvmax + 3deltai = D(Lold

i , Lnewi )

error =∑

deltai

Pc =∑{p(Ci) : Ci je sprejeta}

Pt =∑{p(Ci) : Ci je zavrnjena}

Pe =∑{d(X, Lx) : X ni razvrscena}

Ce stevilo voditeljev ne presega 10, se na zaslon izpisujejo tudi osnovni podatki o pripadajocihskupinah; sicer pa le splosni podatki o poteku razvrscanja.

Page 18: CLUSE TV - Vladimir Batageljvlado.fmf.uni-lj.si/vlado/podstat/Cluse/CluseTV.pdfC L U S E / TV – programi za razvrˇsˇcanje v skupine 2 Vladimir Batagelj CLUSE/TV – priroˇcnik

4. PROGRAMI ZA RAZVRSCANJE 18

4.4 PARETRA

Veckriterijsko razvrscanje z lokalno optimizacijo. Program je dosegljiv iz DOS Shella.

vhodne datoteke: DIS1 .. DISn, n < 10, NAM, ANAizhodne datoteke: LST, ANA

4.5 HICLOR

Veckriterijsko razvrscanje z uporabo odlocitvenih pravil. Program je dosegljiv iz DOS Shella.

vhodne datoteke: DIS1 .. DISn, n < 10, NAM, ANAizhodne datoteke: LST, ANA

Page 19: CLUSE TV - Vladimir Batageljvlado.fmf.uni-lj.si/vlado/podstat/Cluse/CluseTV.pdfC L U S E / TV – programi za razvrˇsˇcanje v skupine 2 Vladimir Batagelj CLUSE/TV – priroˇcnik

5. PREGLEDOVANJE IN ANALIZA RAZVRSTITEV 19

5. Pregledovanje in analiza razvrstitev

5.1 OUTNAM

Izpis razvrstitev. Program je dosegljiv iz DOS Shella.

vhodne datoteke: NAM, ANAizhodne datoteke: LST

5.2 VARANA

Analiza surovih realnih podatkov glede na razvrstitve. Program je dosegljiv iz DOS Shella.

vhodne datoteke: RAW ali DAT, VAR, ANAizhodne datoteke: LST

5.3 CLOUNT

Dolocitev matrike pripadnosti enot isti skupini v danih razvrstitvah. Program je dosegljiv izDOS Shella.

vhodne datoteke: NAM, ANAizhodne datoteke: LST, DIS1 (jo pokvari)

5.4 STABLE

Dolocitev trdnih skupin v danih razvrstitvah. Program je dosegljiv iz DOS Shella.

vhodne datoteke: NAM, ANAizhodne datoteke: LST, ANA

5.5 DENTEX

Podatke za program DENTEX pripravimo v programih HICLUS in HICLOR z ukazom PLOT. Zapisejose na datoteko *.ANA.

Ustvari opis drevesa zdruzevanja v LATEXu. Program je dosegljiv iz DOS Shella.

vhodne datoteke: ANAizhodne datoteke: LST, EXT/TEX

Za uporabo tega programa moramo imeti na voljo TEX z LATEXom. Preprost ’program’v LATEXu za izpis dreves je na datoteki DENDRO.TEX. Seveda, pa lahko drevesa vkljucujetetudi v svoja besedila opisana v LATEXu. V tem primeru morate dodati dolocilo cluse v ukazdocumentstyle.

Slika drevesa razvrstitve je dolocena z vec parametri (glej sliko 2). Vsi parametri so merjeniv pikah pt (1 cm ∼ 27 pt).

• step – razdalja med zaporednima vrsticama drevesa;

• h – visina imen enot; h < step ; (h < 12 – \small, h < 16 – \normalsize, h > 15 –\large );

• y0 – zacetek listov drevesa;

• w – sirina imen enot; w < y0;

Page 20: CLUSE TV - Vladimir Batageljvlado.fmf.uni-lj.si/vlado/podstat/Cluse/CluseTV.pdfC L U S E / TV – programi za razvrˇsˇcanje v skupine 2 Vladimir Batagelj CLUSE/TV – priroˇcnik

5. PREGLEDOVANJE IN ANALIZA RAZVRSTITEV 20

Aaaaaaaa 75

Bbbbbbbb 38

Cccccccc 41

w

y0

width

step

h

Slika 2: Parametri programa DENTEX

• char – najvecje stevilo znakov v imenu enote;

• width – sirina drevesa;

• dmin, dmax – izrez drevesa.

Tako je bilo na primer drevo s slike 3 pripravljeno z naslednjimi vrednostmi parametrov:

step = 16, h = 12, y0 = 90, w = 85

char = 10, width = 440, dmin = 0, dmax = 1.7

5.6 MATEX

Program ustvari opis kvadratne matrike razlicnosti v LATEXu. Matrike razlicnosti lahko v zahte-vano obliko pretvorimo s programom COPYDIS.

Program je dosegljiv iz DOS Shella.

vhodne datoteke: NAM, MIX/DISizhodne datoteke: EXT/TEX

Za uporabo tega programa moramo imeti na voljo TEX z LATEXom. Preprost ’program’ vLATEXu za izpis matrik je na datoteki MATRIX.TEX.

Tako na primer najprej s programom COPYDIS zdruzimo matriki o politikih (pri tem jepotrebno dodati spredaj vrstico z naslovom). Nato pa s programom MATEX pripravimo opistabele v LATEXu.

Page 21: CLUSE TV - Vladimir Batageljvlado.fmf.uni-lj.si/vlado/podstat/Cluse/CluseTV.pdfC L U S E / TV – programi za razvrˇsˇcanje v skupine 2 Vladimir Batagelj CLUSE/TV – priroˇcnik

5. PREGLEDOVANJE IN ANALIZA RAZVRSTITEV 21

CLUSE – ward [0.00, 0.69] Jan-10-1991Sampson data - stacked 8 binary networks

Boniface 15

Albert 16

Winfrid 12

Hugh 14

Mark 7

John Bosco 1

Gregory 2

Elias 17

Simplicius 18

Basil 3

Bonaventur 5

Ambrose 9

Romuald 10

Louis 11

Berthold 6

Victor 8

Peter 4

Amand 13

Slika 3: Sampson data – liking

1 2 3 4 5 6 7 8 9 10 11 12Hitler 1 0 2 7 8 5 9 2 6 8 8 8 9Mussolini 2 3 0 8 8 8 9 1 7 9 9 9 9Churchill 3 4 6 0 3 5 8 7 2 8 3 5 6Eisenhower 4 7 8 4 0 8 7 7 3 8 2 3 8Stalin 5 3 5 6 8 0 7 7 5 6 7 9 5Attlee 6 8 9 3 9 8 0 9 7 7 4 7 5Franco 7 3 2 5 7 6 7 0 5 9 8 8 9De Gaulle 8 4 4 3 5 6 5 4 0 6 5 6 5MaoTseTung 9 8 9 8 9 6 9 8 7 0 8 8 6Truman 10 9 9 5 4 7 8 8 4 4 0 4 6Chamberlai 11 4 5 5 4 7 2 2 5 9 5 0 8Tito 12 7 8 2 4 7 8 3 2 4 5 7 0

Tabela 3: Politiki

Page 22: CLUSE TV - Vladimir Batageljvlado.fmf.uni-lj.si/vlado/podstat/Cluse/CluseTV.pdfC L U S E / TV – programi za razvrˇsˇcanje v skupine 2 Vladimir Batagelj CLUSE/TV – priroˇcnik

A NAMESTITEV PAKETA CLUSE/TV NA DISK 22

A Namestitev paketa CLUSE/TV na disk

Recimo, da zelimo CLUSE/TV namestiti z diskete v enoti b: na disk d:. Tedaj vstavimo disketov disketnik b: in se postavimo na to enoto z ukazom b:. Nato z install b: d: zahtevamo, dase CLUSE/TV namesti z diskete b: na disk d:.

Za to, da bodo programi paketa CLUSE/TV dosegljivi z vsakega podrocja, dodajte obnamestitvi paketa v ukaz PATH v datoteki AUTOEXEC.BAT ustrezno pot. Lahko pa namesto tega,za to poskrbite vsakic posebej pred zacetkom dela s paketom z zahtevo oblike

d:\cluse\clusepath d:

Ce je CLUSE/TV namescen na disku c, zamenjajte v tej zahtevi oba d: s c: . Pozor ! Tazahteva nima zelenega ucinka, ce je narejena znotraj NORTONa – zato pred zahtevo s tipko F10zapustite NORTON.

B Primer obdelave

podrocje xdatoteke x.RAW, x.NAM, x.VAR, x.DESCLUSE_TVenv/files x.RAW, x.NAM, x.VAR, x.DAT, x.LST, x.ANA, x.DISenv/param nunits, nvars, titleenv/save x.ENVmatrix/norm standard x.DATenv/view x.RAW, x.DAT, windows/tilematrix/real euclid x.DIScluster/hierar matrix, max, dendro, cluster, save, ward, dendro, cluster, save, endruncluster/locoptDOS-Shell varana ... EXITexit

Page 23: CLUSE TV - Vladimir Batageljvlado.fmf.uni-lj.si/vlado/podstat/Cluse/CluseTV.pdfC L U S E / TV – programi za razvrˇsˇcanje v skupine 2 Vladimir Batagelj CLUSE/TV – priroˇcnik

LITERATURA 23

Literatura

[1] Anderberg M.R.: Cluster analysis for applications. Probability and mathematical statistics, vol.19.Academic Press, New York, 1973.

[2] Arabie P., Carroll J.D., and DeSarbo W.S: Three-way Scaling and Clustering. Sage, Newbury Park,CA 1978.

[3] Basak S.C., Magnuson V.R., Niemi G.J., Regal R.R.: Determining structural similarity of chemicalsusing graph-theoretic indices. Discrete applied mathematics 19(1988)1-3, 17-44.

[4] Batagelj V.: Razvrscanje v skupine - osnovni pojmi. Seminar za numericno in racunalnisko matem-atiko - 156. DMFA SRS, Ljubljana 1979.

[5] Batagelj V.: Note on ultrametric hierarchical clustering algorithms. Psyhometrika 46(1981)3, 351-352. MR83m:62099; RZM1982,11V1174; RZM1982,6V266

[6] Batagelj V.: Agglomerative methods in clustering with constraints. Preprint Series Dept. Math.Univ. Ljubljana, 22(1984)102, 5-19.

[7] Batagelj V.: CLUSE - programi za razvrscanje v skupine. Prirocnik za DEC-10. 1. seminar sekcijeza uporabno matematiko, DMFA SRS, Ljubljana 1984, 13-20.

[8] Batagelj V.: Notes on the dynamic clusters method. IV conference on applied mathematics, Split,May 28-30, 1984. University of Split, Split 1985, 139-146. ZBL559.62050; RZM1985,11G4

[9] Batagelj V.: Algorithmic aspects of clustering problem. (invited talk) Proceedings of the 7 th Inter-national Symposium Computer at the University”, Cavtat 27-29.5.1985, SRCE, Zagreb 1985, 502 1- 15.

[10] Batagelj V.: On the adding clustering algorithms. COMPSTAT 86, short communications, Dipar-timento di Statistica Probabilita e Statistiche Applicate, Universita ”La Sapienza”, Roma, 1986,29-30.

[11] Batagelj V.: Generalized Ward and related clustering problems. (H.H. Bock, ed.: Classification andrelated methods of data analysis, Proceedings of the First Conference of the IFCS, Aachen, 29 June- 1 July, 1987), North-Holland, Amsterdam, 1988, p. 67-74.

[12] Batagelj V.: Similarity measures between structured objects. MATH/CHEM/COMP 88, Proceed-ings of International Course and Conference on the Interfaces between Mathematics, Chemistryand Computer Science, Dubrovnik, 20-25 June 1988, A. Graovac (Ed.). Studies in Physical andTheoretical Chemistry, Vol. 63; Elsevier/Noth-Holland, Amsterdam, 1989, p. 25-40.

[13] Batagelj V., Pisanski T., Simoes-Pereira J.M.S.: An algorithm for tree-realizability of distancematrices. International Journal of Computer Mathematics, 34(1990), 171-176.

[14] Batagelj V., Ferligoj A.: Agglomerative Hierarchical Multicriteria Clustering Using Decision Rules.9th Symposium COMPSTAT, Dubrovnikm September 1990, K. Momirovic, V. Mildner (Eds.), Pro-ceedings in Computational Statistics, Physica-Verlag, Heidelberg, 1990, p. 15-20.

[15] Batagelj V.: Dissimilarities Between Structured Objects – Fragments. Invited lecture. (E. Diday,Y. Lechevallier ed.: Proceedings of the Conference Symbolic-numeric Data Analysis and Learning,Versailles, France, September 18-20, 1991) Nova Science Publishers, New York 1991, 255-262.

[16] Batagelj V., Pisanski T., Kerzic D.: Automatic Clustering of Languages. In print, ComputationalLinguistics.

[17] Batagelj V., Klavzar S., Korenjak-Cerne S.: Dynamic programming and convex clusterings. In print,Algorithmica, 1992.

[18] Batagelj V., Bren M.: Comparing similarity measures. Accepted, Journal of Classification.

[19] Baulieu F.B.: A classification of presence/absence based dissimilarity coefficients. Journal of Classi-fication, 6(1989), 233-246.

Page 24: CLUSE TV - Vladimir Batageljvlado.fmf.uni-lj.si/vlado/podstat/Cluse/CluseTV.pdfC L U S E / TV – programi za razvrˇsˇcanje v skupine 2 Vladimir Batagelj CLUSE/TV – priroˇcnik

LITERATURA 24

[20] Bertrand P., Diday E.: A visual representation of the compatibility between an order and a dissim-ilarity index: the pyramids, Comp. Stat. Quarterly, 2 (1985), 31-42.

[21] Bouroche J-M., Saporta G.: L’analyse des donnes. Que sais-je?, Presses Universitaires de France,Paris 1980.

[22] Brucker P.: On the complexity of clustering problems, in Lecture Notes in Economics and Mathe-matical Systems 175 (R. Henn, B. Korte and W. Oettli, eds.), Springer-Verlag, Berlin, 1978.

[23] Cormack R.M.: A review of classification. J.R. Statist. Soc., A 134(1971), 321-367.

[24] E. Diday, &, Optimisation en classification automatique, Tome 1.,2.. INRIA, Rocquencourt, 1979(in French)

[25] Diday E.: Inversions en classification hierarchique: application a la construction adaptive d’indicesd’agregation, Revue de Statistique Appliquee, 31(1983), 45-62.

[26] Dubes R., Jain A.K.: Clustering Methodologies in Exploratory Data Analysis. Advances in Com-puters, Vol.19, 113-228. Academic Press, New York, 1980.

[27] Everitt B.: Cluster Analysis. Heinemann Educational Books LTD., London 1974.

[28] Everitt B.: Cluster Analysis. Heinemann Educational Books LTD. London 1974.

[29] Fabic-Petrac I., Jerman-Blazic B., Batagelj V.: Study of Computation, Relatedness and ActivityPrediction of Topological Indices. Journal of Mathematical Chemistry 8(1991), 121-134.

[30] Ferligoj A.: Clustering with constraining variable. Journal of mathematical sociology, 1986.

[31] Ferligoj A.: Razvrscanje v skupine. Metodoloski zvezki 4, Ljubljana, 1989.

[32] Ferligoj A., Batagelj V.: Clustering with relational constraint. Psychometrika, 47(1982)4, 413-426.MR84e:62099; RZM1982,8V246; RZM1983,8V1049

[33] Ferligoj A., Batagelj V.: Some types of clustering with relational constraints. Psychometrika,48(1983)4, 541-552. MR85m:62129; ZBL532.62038; RZM1984,7V509

[34] Ferligoj A., Batagelj V.: Metoda prestavljanj za veckriterijsko razvrscanje v skupine. Statistickarevija, 38(1988), 140-154.

[35] Ferligoj A., Batagelj V.: Direct Multicriteria Clustering Algorithms. Journal of Classification9(1992)1, 43-61.

[36] Ferligoj A., Batagelj V., Doreian P.: On connecting network analysis and cluster analysis. In: G.H.Fischer and D. Laming (Eds.): Contributions to Mathematical Psychology, Psychometrics, andMethodology. In print, Springer Verlag, New York 1994, p. 323-338.

[37] Ferligoj A., Lapajne Z.: Razvrscanje srednjesolskih programov, Sodobna pedagogika, 38(1987), 27-37.

[38] Fisher L., Van Ness J.W.: Admissible clustering procedures. Biometrika 58(1971), 91-104.

[39] Fisher W.D.: On grouping for maximum homogeneity, Journal of the American Statistical Associa-tion, 53 (1958), 789-798.

[40] Garey M.R., Johnson D.S.: Computer and intractability. Freeman, San Francisco 1979.

[41] Gernert D.: Advanced definitions of similarity and their use in classification and related fields.(Classification as a tool of research, Proceedings, W. Gaul, M. Schader (Eds.), Elsevier, Amsterdam,1985), 177-183.

[42] Gordon A.D.: Classification. Monographs on Applied probability and statistics. Chapman and Hall,London, 1981.

[43] Gower J.C., Legendre P.: Metric and Euclidean properties of dissimilarity coefficients. Journal ofClassification, 3(1986),5-48.

Page 25: CLUSE TV - Vladimir Batageljvlado.fmf.uni-lj.si/vlado/podstat/Cluse/CluseTV.pdfC L U S E / TV – programi za razvrˇsˇcanje v skupine 2 Vladimir Batagelj CLUSE/TV – priroˇcnik

LITERATURA 25

[44] Gower J.C.: A general coefficient of similarity and some of its properties. Biometrics 27(1971),857-871.

[45] Gregson A.M.R.: Psychometrics of Similarity. Academic Press, New York 1975.

[46] Hanani U.: Multicriteria Dynamic Clustering, Rapport de Recherche No. 358, IRIA, Rocquencourt1979.

[47] Hand D.J.: Branch and bound in statistical data analysis, (manuscript) 1981.

[48] Hartigan J.A.: Clustering Algorithms. John-Wiley, New York, 1975.

[49] Hubalek Z.: Coefficients of association and similarity, based on binary (presence-absence) data: anevaluation. Biological Review57(1982), 669-689.

[50] Jambu M., and Lebeaux M-O.: Cluster Analysis and Data Analysis. North-Holland, Amsterdam1983.

[51] Jardin N., Sibson R.: Mathematical taxonomy. John Wiley, London 1971.

[52] Jensen R.E.: A dynamic programming algorihm for cluster analysis. Operational research, (1969)7,1034-1057.

[53] Johnson M.: Relating metrics, lines and variables defined on graphs to problems in medicinal chem-istry. (Graph theory with applications to algorithms and computer science, Proceedings, Y. Alavi,G. Chartrand, L. Lesniak, D.R. Lick, C.E. Wall (Eds.), John Wiley and Sons, New York, 1985),457-470.

[54] Joly S., Le Calve G.: Etude des puissances d’une distance. Statistique et Analyse des Donnees,11(1986)3, 30-50.

[55] Journal of Classification, 1986, 2 (Special issue on consensus classifications)

[56] Kashyap R.L., Oommen B.J.: A common basis for similarity measures involving two strings. Inter-national Journal of Computer Mathematics 13(1983), 17-40.

[57] Kashyap R.L., Oommen B.J.: Similarity measures for sets of strings. International Journal of Com-puter Mathematics 13(1983), 95-104.

[58] Kashyap R.L., Oommen B.J.: Similarity measures for sets of strings. International Journal of Com-puter Mathematics 13(1983), 95-104.

[59] Klauer K.C., and Carroll J.D. (1989): A mathematical programming approach to fitting generalgraphs. Journal of Classification, 6, 247-270.

[60] Kosmelj K., Batagelj V.: Cross-sectional approach for clustering time varying data. Journal ofClassification 7(1990), pp. 99-109.

[61] Krantz D.H., Luce R.D., Suppes P., Tversky A.: Foundations of Measurement, Vol. I. AcademicPress, New York, 1971.

[62] Kruskal J.B.: An overview of sequence comparison: time warps, string edits and macromolecules.SIAM Review 25(1983)2, 201-237.

[63] Lerman I.C.: Indice de similarite et preordonnance associee. Ordres. Travaux du seminaire sur lesordres totaux finis, Aix-en-Provence, 1967; Mouton, Paris, La Haye 1971.

[64] Levenshtein V.I.: Binary codes capable of correcting deletions, insertions, and reversals. SovietPhysics - Doklady, 10(1966), 707-710.

[65] Lefkovitch L.P.: Multi-Criteria Clustering in Genotype Environment Interaction Problems. Theo-retical and Applied Genetics, 7091985), 585-589.

[66] Liebetrau A.M.: Measures of association. Sage University Paper series on Quantitative Applicationsin the Social Sciences - 32, Sage Publications, Beverly Hills, 1983.

Page 26: CLUSE TV - Vladimir Batageljvlado.fmf.uni-lj.si/vlado/podstat/Cluse/CluseTV.pdfC L U S E / TV – programi za razvrˇsˇcanje v skupine 2 Vladimir Batagelj CLUSE/TV – priroˇcnik

LITERATURA 26

[67] Matula D.W.: Graph theoretic techniques for cluster analysis algorithms. Van Ryzin J. (ed.): Clas-sification and clustering. Academic Press, New York 1977, 95-127.

[68] Mirkin B.G.: Problema gruppovogo vybora. Nauka, Moskva, 1974.

[69] Mirkin B.G.: Analiz kacestvenyh priznakov i struktur. Statistika, Moskva, 1980.

[70] Orlowska E., Pawlak Z.: Measurement and Indiscernibility. Bulletin of the Polish Academy of sci-ences, mathematics 32(1984)9-10, 617-624.

[71] Pfanzagl J.: Theory of measurement. Physica-Verlag, Wurzburg - Wien 1971.

[72] Podinovskij V.V., Nogin V.D.: Pareto-optimalnije resenija mnogokriterialnih zadac. Nauka, Moskva1982.

[73] Rao M.R.: Cluster analysis and mathematical programming, Journal of the American StatisticalAssociation, 66 (1971), 622-626.

[74] Reynolds H.T.: Analysis of nominal data. Sage University Paper series on Quantitative Applicationsin the Social Sciences - 7, Sage Publications, Beverly Hills, 1984.

[75] Roberts F.S.: Discrete Mathematical Models. Prentice-Hall, Englewood Cliffs, New Jersey, 1971.

[76] Romesburg H.C.: Cluster Analysis for Researchers. Lifetime Learning Publications, Belmont, Cali-fornia, 1984.

[77] Rosenberg S., Kim M.P.: The method of sorting as a data-gathering procedure in multivariateresearch. Multivariate Behaviour, 10(1975), 489-502.

[78] Rouvray D.H.: Should we have designs on topological indices ? (Chemical applications of topol-ogy and graph theory, Collection of papers, R.B. King (Ed.), Studies in physical and theoreticalchemistry, 28, Elsevier, Amsterdam, 1983), 159-177.

[79] Shamos M.I.: Geometry and statistics: Problems at the interface. v J.F. Traub (Ed.): Algorithmsand Complexity (New directions and recent results). Academic Press, New York 1976, 251-288.

[80] Sneath P.H.A., Sokal R.R.: Numerical taxonomy. W.H. Freeman and Company, San Francisco 1973.

[81] Spath H.: Cluster Analyse Algorithmen zur Objekt-Klassifizierung und Datenreduction. R. Olden-bourg, Munchen 1977.

[82] Van Ryzin J. (ed.): Classification and clustering. Academic Press, New York 1977, 95-127.

[83] Ward J.H.: Hierarchical Grouping to Optimize an Objective Function, Journal of the AmericanStatistical Association, 58(1963), 236-244.

[84] Winkler P.M.: Correlation among partial orders. SIAM Journal of Algebraic and Discrete Mathe-matics 4(1983), 1-7.