15
1 1. Upute o registraciji i pristupanju SAS-u za članove akademske zajednice (SAS On Demand For Academics) Potrebno se prvo registrirati na stranici https://odamid.oda.sas.com/SASODARegistration/ Prilikom registracije treba odabrati SAS Studio koji omogućava online korištenje SAS-a (engl. Statistical Analysis System) BEZ instalacije na računalo (ako želite imati SAS i kad internetska veza nije dostupna, odaberite i instalirajte SAS Enterprise Miner) Sustav će vam putem e-maila dodijeliti korisničko ime userid Prilikom registracije potrebno je kreirati i SAS profile lozinku Registracija bi trebala voditi na Control Centar https://odamid.oda.sas.com/SASODAControlCenter Pomoću Control Centra pristupa se SAS-u (korisno je staviti u Bookmarks) Prvi prozor je kontrolna ploča Dashboard, približno sljedećeg izgleda: Izravno se pristupa SAS-u klikom na SAS Studio u dijelu Applications

1. Upute o registraciji i pristupanju SAS-u za članove ... o pristupanju SAS-u... · 6 U radnom direktoriju WORK nalaze se svi vaši radni dataset-ovi. Prilikom zatvaranja SAS Studia

  • Upload
    others

  • View
    5

  • Download
    0

Embed Size (px)

Citation preview

Page 1: 1. Upute o registraciji i pristupanju SAS-u za članove ... o pristupanju SAS-u... · 6 U radnom direktoriju WORK nalaze se svi vaši radni dataset-ovi. Prilikom zatvaranja SAS Studia

1

1. Upute o registraciji i pristupanju SAS-u za članove akademske zajednice

(SAS On Demand For Academics)

Potrebno se prvo registrirati na stranici https://odamid.oda.sas.com/SASODARegistration/

Prilikom registracije treba odabrati SAS Studio koji omogućava online korištenje SAS-a (engl.

Statistical Analysis System) BEZ instalacije na računalo (ako želite imati SAS i kad internetska veza

nije dostupna, odaberite i instalirajte SAS Enterprise Miner)

Sustav će vam putem e-maila dodijeliti korisničko ime userid

Prilikom registracije potrebno je kreirati i SAS profile lozinku

Registracija bi trebala voditi na Control Centar https://odamid.oda.sas.com/SASODAControlCenter

Pomoću Control Centra pristupa se SAS-u (korisno je staviti u Bookmarks)

Prvi prozor je kontrolna ploča Dashboard, približno sljedećeg izgleda:

Izravno se pristupa SAS-u klikom na SAS Studio u dijelu Applications

Page 2: 1. Upute o registraciji i pristupanju SAS-u za članove ... o pristupanju SAS-u... · 6 U radnom direktoriju WORK nalaze se svi vaši radni dataset-ovi. Prilikom zatvaranja SAS Studia

2

Nakon što se klikne na SAS Studio pojavljuje se sljedeći sadržaj:

S lijeve strane se nalazi Explorer Window s popisom direktorija koje imate unutar SAS Studia (slično

kao npr. My Documents na vašem računalu). Explorer Window je dio koji prikazuje sadržaj SAS

okruženja te pomoću kojeg možete importirati matricu podataka. Matrica podataka može se

jednostavno importirati npr. iz Excel datoteke pomoću ikone Upload nakon što ste izabrali

direktoriji u koji želite spremiti podatke kao npr. sasuser.v94.

S desne strane se nalaze prozori programske konzole Program1 unutar kojih se upisuju naredbe za

statističku analizu podataka, ispisuju poruke upozorenja i slično.

Programska konzola sastoji se od tri prozora: CODE, LOG i RESULTS.

Prozor CODE služi za upisivanje naredbi i pokretanje programskih procedura. Svaka procedura

započinje naredbom proc i završava naredbom run. Jedna procedura sadrži više naredbenih redaka

koji se odnose na statements (izjave) i options (opcije), pri tome svaka izjava završava s točkom-

zarez (;)

Da bi se željena procedura izvršila potrebno je mišem označiti naredbene retke te izabrati Run, tj.

znak .

Page 3: 1. Upute o registraciji i pristupanju SAS-u za članove ... o pristupanju SAS-u... · 6 U radnom direktoriju WORK nalaze se svi vaši radni dataset-ovi. Prilikom zatvaranja SAS Studia

3

U sljedećoj tablici dan je popis procedura koje se najčešće koriste u statističkoj analizi:

Procedura Opis

HTTP Preuzimanje datoteke, dostupne na Internetu, pomoću URL adrese veze

IMPORT Importiranje matrice podataka iz preuzete datoteke

FREQ Distribucija frekvencija (statističke tablice: jednostavna, kombinirana, itd. )

UNIVARIATE Deskriptivno statistička analiza jedne varijable (momenti, kvantili, mjere

disperzije, netipična opažanja, itd. )

SQPLOT Grafičko prikazivanje (histogram, Box-Plot, dijagram rasipanja, itd. )

TTEST Testiranje parametara jedne populacije i odnosa parametara dviju populacija

CORR Korelacijska analiza (koeficijent linearne korelacije, korelacijska matrica, itd. )

REG Regresijska analiza (procjene parametara, značajnost parametara, tablica

ANOVA, pokazatelji kakvoće regresije, itd. )

Prozor LOG je prozor u kojem se ispisuju poruke o uspješnosti i pogreškama pokrenutih procedura.

Primjerice, ispisuju se poruke jesu li podaci uspješno učitani i ako je prilikom izvođenja procedure

došlo do pogreške (pogrešna upotreba naredbi, nedostaje neki znak i slično).

Prozor RESULTS je prozor u kojem se prikazuju svi rezultati pokrenutih procedura.

Podaci koji su dostupni na Internet stranicama mogu se izravno preuzeti i importirati u program

SAS. Najčešće se radi o povijesnim podacima koji su organizirani u obliku matrice te su dostupni u

xlsx ili csv formatu. Datoteka CSV formata (engl. Comma Separated Values) je tekstualna datoteka s

vrijednostima odvojenim zarezom u kojima znak zareza (,) obično razdvaja polja. Tekstualne

datoteke CSV formata pogodne su jer ne zauzimaju puno memorije.

Izravan način preuzimanja datoteka s Interneta je kopiranje adrese veze datoteke koja se nalazi na

određenom poslužitelju (ili upisivanje točne URL adrese). Yahoo Finance i Google Finance

poslužitelji korisni su sekundarni izvor financijskih podataka jer sadrže, primjerice, povijesne

podatke o kretanju cijena dionica, burzovnih indeksa, tečajeva valuta, kamatnih stopa, financijskih

derivata, sirove nafte, zlata, itd.

Page 4: 1. Upute o registraciji i pristupanju SAS-u za članove ... o pristupanju SAS-u... · 6 U radnom direktoriju WORK nalaze se svi vaši radni dataset-ovi. Prilikom zatvaranja SAS Studia

4

2. Upute o preuzimanju podataka pomoću URL adrese veze

U nastavku je opisan postupak preuzimanja i importiranja podataka pomoću URL adrese veze u

program SAS Studio. Na primjer, mogu se importirati podaci o kretanju cijena otvaranja, najviših,

najnižih i zaključnih cijena američke računalne tvrtke Apple Inc. u razdoblju od 16.02.2017. do

16.02.2018. (ukupno 253 trgovinskih dana). Budući da je datoteka xlsx formata već preuzeta s Yahoo

Finance poslužitelja i spremljena na poslužitelj EFZG s poveznicom

http://www.efzg.hr/userdocsimages/sta/jarneric/BAZA.xlsx,

potrebno je u prozor CODE upisati sljedećih 10 naredbenih redaka:

filename datoteka temp; proc http url="http://www.efzg.hr/userdocsimages/sta/jarneric/BAZA.xlsx" method="GET" out=datoteka; run; proc import datafile=datoteka out=WORK.moji_podaci dbms=xlsx replace; sheet="AAPL"; getnames=YES; run;

Sve naredbe se selektiraju mišem (svih 10 redaka) i klikne se Run . U SAS to izgleda ovako:

Page 5: 1. Upute o registraciji i pristupanju SAS-u za članove ... o pristupanju SAS-u... · 6 U radnom direktoriju WORK nalaze se svi vaši radni dataset-ovi. Prilikom zatvaranja SAS Studia

5

Zbog jednostavnosti preporuča se kopirati svih 10 naredbenih redaka, koji su uokvireni na sredini

prethodne stranice, i „zalijepiti“ u prozor CODE te izvršiti klikom na .

Rezultat izvršenih naredbi može se vidjeti u novom prozoru OUTPUT DATA. U prozoru OUTPUT

DATA vidljivi su podaci koje smo uspješno importirali (cijena otvaranja, najviša, najniža i zaključna

cijena dionice tvrtke Apple za svaki dan trgovanja u promatranom razdoblju).

Promjenom naziva radnog lista sheet="AAPL" mogu se preuzeti neki drugi podaci budući da je

svaki radni list iste Excel datoteke imenovan prema oznaci tickera. Na primjer, promjenom naziva

tickera mijenja se vrsta financijske imovine. U konkretnom slučaju primjene naziv je tickera AAPL.

Matrica podataka (253 redaka i 5 stupaca) sačuvana je u radnom direktoriju WORK pod nazivom

MOJI_PODACI. To se može provjeriti tako da se klikne na Libraries (donji lijevi ugao prozora). Zatim

se ekspandira direktorij My Libraries klikom na bijeli trokutić lijevo od naziva te se ekspandira i

direktorij Work klikom na bijeli trokutić lijevo od WORK .

Page 6: 1. Upute o registraciji i pristupanju SAS-u za članove ... o pristupanju SAS-u... · 6 U radnom direktoriju WORK nalaze se svi vaši radni dataset-ovi. Prilikom zatvaranja SAS Studia

6

U radnom direktoriju WORK nalaze se svi vaši radni dataset-ovi. Prilikom zatvaranja SAS Studia sve

što se nalazi u mapi WORK bit će obrisano pa ako želite zadržati dataset potrebno ga je spremiti.

Također, korisno je spremiti i programski kod kojeg možete pokrenuti svaki put kada se ulogirate u

SAS Studio. Na taj način ne morate ponovno upisivati ručno programski kod.

Klikom na Save As ikonu birate direktorij u kojem će programski kod biti spremljen, npr.

poddirektorij sasuser.v94, koji je vidljiv unutar Server Files and Folders te upisujete ime vašeg

programskog koda. Vaš programski kod će biti sačuvan u SAS formatu s odgovarajućim imenom

(primjerice Demonstrature.sas)

Page 7: 1. Upute o registraciji i pristupanju SAS-u za članove ... o pristupanju SAS-u... · 6 U radnom direktoriju WORK nalaze se svi vaši radni dataset-ovi. Prilikom zatvaranja SAS Studia

7

3. Obveze studenata

Nakon izvršene registracije, svaki je student obvezan samostalno riješiti dvije grupe zadataka A i B

pomoću SAS Studia. Prilikom rješavanja zadataka svaki student analizira cijene dionice koja mu je

dodijeljena (vidi poveznicu: http://www.efzg.hr/UserDocsImages/sta/jarneric/Oznake_tickera.xls )

Samostalne zadatke student je obvezan izraditi kod kuće pomoću računala. Prethodno je potrebno

preuzeti i importirati podatke pomoću URL adrese veze (opisano na stranici 4).

Svaki student treba preuzeti grupe zadataka A i B (dostupne na Google Classroom), isprintati i

popuniti rezultatima dobivenim u SAS-u te pravovremeno predati predmetnom nastavniku.

Riješene grupe zadataka svaki student predaje predmetnom nastavniku predavačke grupe kojoj

pripada. Mjesto i vrijeme u kojem je student dužan predati riješene grupe zadataka A i B utvrdit će

predmetni nastavnik i o tome obavijestiti studente.

Samostalni zadaci koje student treba riješiti pomoću računala su podijeljeni u dvije grupe: A i B.

Dio A se odnosi na gradivo prvog kolokvija, dok se B dio odnosi na gradivo drugog kolokvija.

U nastavku se daje ogledni primjer kako riješiti dvije grupe zadataka A i B (str. 8-15), analizirajući

cijene američke računalne tvrtke Apple u razdoblju od 16.02.2017. do 16.02.2018.

VAŽNO!

Cijeli programski kod u nastavku, koji se odnosi na dvije grupe zadataka A i B, može se kopirati i „zalijepiti“ u prozor CODE programa SAS. Programski kod je dostupan na sljedećoj poveznici:

http://www.efzg.hr/UserDocsImages/sta/jarneric/programski%20kod%20u%20SAS-u.txt

Svaki će student navedene kodove i procedure u SAS-u prilagoditi svojim podacima, ovisno o tome

koja dionica mu je dodijeljena!!!

Page 8: 1. Upute o registraciji i pristupanju SAS-u za članove ... o pristupanju SAS-u... · 6 U radnom direktoriju WORK nalaze se svi vaši radni dataset-ovi. Prilikom zatvaranja SAS Studia

8

3.1. Zadaci za vježbu u SAS-u (grupa zadataka A)

1. Provedite deskriptivno-statističku analizu zaključnih cijena američke računalne tvrtke Apple u

promatranom razdoblju. Interpretirajte rezultate za kategorije „Moments“, „Basic Statistical

Measures“, „Quantiles“ i „Extreme Observations“

U prozoru CODE upišite programski kod s tri naredbena retka (pazite da nakon naredbe var

napišete close):

proc univariate data=moji_podaci; var close; title "Deskriptivna statistika zakljucnih cijena"; run;

Nakon zapisa cijele procedure označite mišem 4 naredbena retka i kliknite Run. Rezultati u ispisu

(prozor RESULTS) izgledaju ovako:

Page 9: 1. Upute o registraciji i pristupanju SAS-u za članove ... o pristupanju SAS-u... · 6 U radnom direktoriju WORK nalaze se svi vaši radni dataset-ovi. Prilikom zatvaranja SAS Studia

9

2. Grupirajte zaključne cijene po danima trgovanja u 5 razreda jednakih veličina. Ako raspon varijacije

podijelimo s 5 dobiva se veličina razreda od 8,784. Stoga bi najjednostavnije bilo početi s donjom

granicom prvog razreda od 130 i završiti s gornjom granicom posljednjeg razreda od 180 dok bi

veličinu razreda zaokružili na 10.

U prozoru CODE upišite programski kod sa sljedećim naredbama:

proc format; value close 130-140="130-140" 140-150="140-150" 150-160="150-160" 160-170="160-170" 170-180="170-180"; proc freq data=moji_podaci; tables close; format close close.; title "Distribucija frekvencija zakljucnih cijena"; run;

Page 10: 1. Upute o registraciji i pristupanju SAS-u za članove ... o pristupanju SAS-u... · 6 U radnom direktoriju WORK nalaze se svi vaši radni dataset-ovi. Prilikom zatvaranja SAS Studia

10

Nakon zapisa cijele procedure označite mišem cijeli zapis i kliknite Run.

3. Distribuciju relativnih frekvencija zaključnih cijena prikažite histogramom. Na histogramu ucrtajte

normalnu distribuciju.

U prozoru CODE upišite programski kod sa sljedećim naredbama:

proc sgplot data=moji_podaci; histogram close / binstart=135 nbins=5; density close / type=normal; run;

Nakon zapisa cijele procedure označite mišem cijeli zapis i kliknite Run.

Page 11: 1. Upute o registraciji i pristupanju SAS-u za članove ... o pristupanju SAS-u... · 6 U radnom direktoriju WORK nalaze se svi vaši radni dataset-ovi. Prilikom zatvaranja SAS Studia

11

4. Zaključne cijene američke računalne tvrtke Apple prikažite pomoću Box-Plot dijagrama.

U prozoru CODE upišite programski kod sa sljedećim naredbama:

proc sgplot data=moji_podaci; hbox close / extreme; title "B-P dijagram"; run;

Nakon zapisa cijele procedure označite mišem cijeli zapis i kliknite Run.

3.2. Zadaci za vježbu u SAS-u (grupa zadataka B)

1. Pod pretpostavkom da su zaključne cijene američke računalne tvrtke Apple normalno distribuirane

testirajte hipotezu da je prosječna zaključna cijena jednaka medijanu, tj. u konkretnom slučaju

primjene H0: µ=155,47 i H1: µ≠155,47. Zaključak donesite na temelju p-vrijednosti ako je teorijska razina

značajnosti 050, . U prozoru CODE upišite programski kod sa sljedećim naredbama:

proc ttest data=moji_podaci h0=155.47 sides=2 alpha=0.05 plots=none; var close; title "Dvosmjerni test hipoteze o pretpostavljenoj vrijednosti sredine populacije"; run;

Page 12: 1. Upute o registraciji i pristupanju SAS-u za članove ... o pristupanju SAS-u... · 6 U radnom direktoriju WORK nalaze se svi vaši radni dataset-ovi. Prilikom zatvaranja SAS Studia

12

Nakon zapisa cijele procedure označite mišem cijeli zapis i kliknite Run.

2. Pod pretpostavkom da su zaključne cijene američke računalne tvrtke Apple normalno distribuirane

testirajte hipotezu da je prosječna zaključna cijena veća od medijana, tj. u konkretnom slučaju

primjene H0: µ=155,47 i H1: µ>155,47. Zaključak donesite na temelju p-vrijednosti ako je teorijska razina

značajnosti 050, . U prozoru CODE upišite programski kod sa sljedećim naredbama:

proc ttest data=moji_podaci h0=155.47 sides=u alpha=0.02 plots=none; var close; title "Jednosmjerni test hipoteze o pretpostavljenoj vrijednosti sredine populacije"; run;

Nakon zapisa cijele procedure označite mišem cijeli zapis i kliknite Run.

Page 13: 1. Upute o registraciji i pristupanju SAS-u za članove ... o pristupanju SAS-u... · 6 U radnom direktoriju WORK nalaze se svi vaši radni dataset-ovi. Prilikom zatvaranja SAS Studia

13

3. Izračunajte Pearsonov koeficijent linearne korelacije između zaključnih cijena i najviših cijena. Parove

vrijednosti prikažite dijagramom rasipanja te na istom ucrtajte regresijski pravac.

U prozoru CODE upišite programski kod sa sljedećim naredbama:

proc corr data=moji_podaci; var close high; title "Korelacijska matrica"; run;

Nakon zapisa cijele procedure označite mišem cijeli zapis i kliknite Run.

Nadalje, u prozoru CODE upišite programski kod s sljedećim naredbama:

proc sgplot data=moji_podaci; reg x=close y=high / degree=1; title "Dijagram rasipanja i regresijski pravac"; run;

Nakon zapisa cijele procedure označite mišem cijeli zapis i kliknite Run.

Page 14: 1. Upute o registraciji i pristupanju SAS-u za članove ... o pristupanju SAS-u... · 6 U radnom direktoriju WORK nalaze se svi vaši radni dataset-ovi. Prilikom zatvaranja SAS Studia

14

4. Procijenite parametre višestruke linearne regresije koja pokazuje ovisnost zaključnih cijena o

najvišim i najnižim cijenama. Kako glasi dobivena regresijska jednadžba? Što pokazuje regresijski

koeficijent 2̂ ? Jesu li procijenjeni parametri statistički značajni i pri kojim razinama signifikantnosti?

Intervalom procijenite regresijske parametre na razini pouzdanosti 95%. Provedite analizu varijance

(ANOVA); koliko iznosi empirijski F-omjer? Postavite hipoteze F-testa i donesite zaključak na temelju

p-vrijednosti. Protumačite značenje koeficijenta determinacije konkretno! Koliko iznosi korigirani

koeficijent determinacije? Koliko iznosi standardna pogreška regresije (interpretirajte dobiveni

rezultat). Izračunajte i objasnite značenje koeficijenta varijacije regresije!

U prozoru CODE upišite programski kod sa sljedećim naredbama:

proc reg data=moji_podaci plots=none; model close=high low / clb alpha=0.05; title "Multipla regresija"; run;

Nakon zapisa cijele procedure označite mišem cijeli zapis i kliknite Run.

Page 15: 1. Upute o registraciji i pristupanju SAS-u za članove ... o pristupanju SAS-u... · 6 U radnom direktoriju WORK nalaze se svi vaši radni dataset-ovi. Prilikom zatvaranja SAS Studia

15