23
Vytautas Maniušis (2016-02-09). www.mif.vu.lt/~vtas/stat/ STATISTIKA SU KOMPIUTERIU 1p.-1. Literatūra ir įvadas 7p.-2. R komandų įvadas 8p.-3. Vektoriai ir matricos 11p.-4. Duomenys ir bylos 13p.-5. R grafika 15p.-6. Statistika ir grafika 17p.-7. R programavimas 21p.-8. Statistika ir programavimas (* pažengusiems, papildomai, + mokama, - nebūtina) 1 SKYRIUS: LITERATŪRA IR ĮVADAS I. Šaltinių citavimas i) Osvaldas Janonis (2005). Bibliografinių nuorodų ir jų sąrašų sudarymo studijų bei mokslo darbuose metodika. Vilniaus universiteto leidykla, Vilnius. www.biblioteka.vpu.lt/file/Janonis.pdf https://web.archive.org/web/20110608005118/http://www.mb.vu.lt/ELBI/janonis.pdf ii) Informacinis raštingumas. www.ir.mb.vu.lt/buk-etiskas *iii) Kauno technologijos universiteto biblioteka. Bibliografijos leidiniai. http://internet.unib.ktu.lt/www/bibliografija.htm II. Žodynai II.1. STATISTIKOS i) Jonas Kubilius (red.) (1994). Matematikos terminų žodynas. Mokslo ir enciklopedijų leidykla, Vilnius. (galima rasti bibliotekoje) ii) Matematikos ir informatikos instituto lietuvių kalbos terminų bazė (Lietuvių kalbos terminynas). (matematikos ir kitų mokslų terminų žodynai internete) www.terminynas.lt iii) Statistika ir jos taikymai. (maži, bet labai geri žodynėliai Čekanavičiaus ir Murausko knygų gale, senoje versijoje naudingos nuorodos, statistikų folkloras) www.statistika.mif.vu.lt https://web.archive.org/w eb/20050906190522/http://is.vu.lt/pls/sandai/stat.navigac https://web.archive.org/web/20070415000000*/http://www.ts.vu.lt -iv) Antanas Buračas (2009). Lietuvos statistikos terminijos formavimasis. Lietuvos statistikos darbai, 48. http://www.statisticsjournal.lt/index.php/statisticsjournal/article/view/34 http://193.219.12.232/uploads/docs/A_Buracas_Liet_stat_term.pdf -v) Antanas Buračas (2008). Statistikos terminai: anglų-lietuvių-prancūzų-rusų-vokiečių kalbos). Mykolo Romerio universiteto Leidybos centras, Vilnius. (galima rasti biliotekoje, beprotiškai brangus, ~ 200 Lt.) -vi) The ISI glossary of statistical terms. http://isi.cbs.nl/glossary/ -II.2. STATISTIKOS STANDARTAI i) Lietuvos standartizacijos departamentas. Terminų duomenų bazė. www.lsd.lt (statistikos kažkodėl nėra) ii) Lietuvos standartizacijos departamentas (2007). LST ISO 3534-1:2007. Statistika. Aiškinamasis žodynas ir simboliai. 1 dalis. Bendrieji statistikos terminai ir tikimybių terminai. http://www.mif.vu.lt/~rlapinskas/Terminai/(Terminai%20-%20diskusijos%202012.02.29.docx http://www.mif.vu.lt/~rlapinskas/Terminai/ISO%203534-1%20LST%20liet.terminai.doc iii) Lietuvos standartizacijos departamentas. LST ISO 3534-2. Statistika. Terminai, apibrėžtys ir simboliai. 2 dalis. Statistinė kokybės kontrolė. iv) Lietuvos standartizacijos departamentas (2008). LST ISO 3534-3:2008. Statistika. Aiškinamasis žodynas ir simboliai. 3 dalis: Eksperimentų planavimas. II.3. BENDRI i) Alkonas. http://anglonas.fotonija.lt/ (turėtų būti instaliuotas kompiuterių tinkle) ii) LED anglų - lietuvių - vokiečių kalbų žodynas internete. http://led.ot.lt iii) OpenDict. http://opendict.sf.net (nemokami LED žodynai) iv) Kzod. www.dict.lt , http://forum.lrytas.lt/topic_show.pl?tid=163398 (galima susikurti savo žodyną) v) Anglų Lietuvių žodynas. www.anglu-lietuviu.com vi) Wikiled. www.wikiled.com vii) Google Translate. http://translate.google.com -viii) www.lt-en.lt žodynas internete 1-23

STATISTIKA SU KOMPIUTERIU 11p.-4. Duomenys ir bylos 13p.-5. …vtas/stat/konspektas20160209.pdf · 2017-11-13 · STATISTIKOS i) Jonas Kubilius (red.) (1994). Matematikos terminų

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

Page 1: STATISTIKA SU KOMPIUTERIU 11p.-4. Duomenys ir bylos 13p.-5. …vtas/stat/konspektas20160209.pdf · 2017-11-13 · STATISTIKOS i) Jonas Kubilius (red.) (1994). Matematikos terminų

Vytautas Maniušis (2016-02-09). www.mif.vu.lt/~vtas/stat/

STATISTIKA SU KOMPIUTERIU

1p.-1. Literatūra ir įvadas 7p.-2. R komandų įvadas 8p.-3. Vektoriai ir matricos11p.-4. Duomenys ir bylos13p.-5. R grafika15p.-6. Statistika ir grafika17p.-7. R programavimas21p.-8. Statistika ir programavimas

(* pažengusiems, papildomai, + mokama, - nebūtina)1 SKYRIUS: LITERATŪRA IR ĮVADAS I. Šaltinių citavimasi) Osvaldas Janonis (2005). Bibliografinių nuorodų ir jų sąrašų sudarymo studijų bei mokslo darbuosemetodika. Vilniaus universiteto leidykla, Vilnius.www.biblioteka.vpu.lt/file/Janonis.pdf https://web.archive.org/web/20110608005118/http://www.mb.vu.lt/ELBI/janonis.pdf ii) Informacinis raštingumas. www.ir.mb.vu.lt/buk-etiskas *iii) Kauno technologijos universiteto biblioteka. Bibliografijos leidiniai.http://internet.unib.ktu.lt/www/bibliografija.htm II. Žodynai II.1. STATISTIKOSi) Jonas Kubilius (red.) (1994). Matematikos terminų žodynas. Mokslo ir enciklopedijų leidykla, Vilnius.(galima rasti bibliotekoje)ii) Matematikos ir informatikos instituto lietuvių kalbos terminų bazė (Lietuvių kalbos terminynas).(matematikos ir kitų mokslų terminų žodynai internete) www.terminynas.lt iii) Statistika ir jos taikymai. (maži, bet labai geri žodynėliai Čekanavičiaus ir Murausko knygų gale,senoje versijoje naudingos nuorodos, statistikų folkloras)www.statistika.mif.vu.lt https://web.archive.org/w eb/20050906190522/http://is.vu.lt/pls/sandai/stat.navigac https://web.archive.org/web/20070415000000*/http://www.ts.vu.lt -iv) Antanas Buračas (2009). Lietuvos statistikos terminijos formavimasis. Lietuvos statistikos darbai, 48.http://www.statisticsjournal.lt/index.php/statisticsjournal/article/view/34 http://193.219.12.232/uploads/docs/A_Buracas_Liet_stat_term.pdf -v) Antanas Buračas (2008). Statistikos terminai: anglų-lietuvių-prancūzų-rusų-vokiečių kalbos). MykoloRomerio universiteto Leidybos centras, Vilnius. (galima rasti biliotekoje, beprotiškai brangus, ~ 200 Lt.) -vi) The ISI glossary of statistical terms. http://isi.cbs.nl/glossary/ -II.2. STATISTIKOS STANDARTAIi) Lietuvos standartizacijos departamentas. Terminų duomenų bazė. www.lsd.lt (statistikos kažkodėl nėra)ii) Lietuvos standartizacijos departamentas (2007). LST ISO 3534-1:2007. Statistika. Aiškinamasisžodynas ir simboliai. 1 dalis. Bendrieji statistikos terminai ir tikimybių terminai.http://www.mif.vu.lt/~rlapinskas/Terminai/(Terminai%20-%20diskusijos%202012.02.29.docx http://www.mif.vu.lt/~rlapinskas/Terminai/ISO%203534-1%20LST%20liet.terminai.doc iii) Lietuvos standartizacijos departamentas. LST ISO 3534-2. Statistika. Terminai, apibrėžtys irsimboliai. 2 dalis. Statistinė kokybės kontrolė.iv) Lietuvos standartizacijos departamentas (2008). LST ISO 3534-3:2008. Statistika. Aiškinamasisžodynas ir simboliai. 3 dalis: Eksperimentų planavimas.II.3. BENDRIi) Alkonas. http://anglonas.fotonija.lt/ (turėtų būti instaliuotas kompiuterių tinkle)ii) LED anglų - lietuvių - vokiečių kalbų žodynas internete. http://led.ot.lt iii) OpenDict. http://opendict.sf.net (nemokami LED žodynai)iv) Kzod. www.dict.lt , http://forum.lrytas.lt/topic_show.pl?tid=163398 (galima susikurti savo žodyną)v) Anglų Lietuvių žodynas. www.anglu-lietuviu.com vi) Wikiled. www.wikiled.com vii) Google Translate. http://translate.google.com -viii) www.lt-en.lt žodynas internete

1-23

Page 2: STATISTIKA SU KOMPIUTERIU 11p.-4. Duomenys ir bylos 13p.-5. …vtas/stat/konspektas20160209.pdf · 2017-11-13 · STATISTIKOS i) Jonas Kubilius (red.) (1994). Matematikos terminų

III. Literatūra III.1. STATISTIKOS KNYGOS IR KONSPEKTAI III.1.1. Lietuvių kalbai) Vilijandas Bagdonavičius, Julius Kruopis (2007). Matematinė statistika, I. Vaistų žinios, Vilnius.ii) Jonas Kubilius (1996). Tikimybių teorija ir matematinė statistika. Vilniaus universiteto leidykla, Vilnius. (2-as leidimas, 1-as leidimas 1980, Mokslas, Vilnius)http://www.mif.vu.lt/katedros/ttsk/bylos/ku/files/ttms.html iii) Vydas Čekanavičius, Gediminas Murauskas (2000, 2002, 2009). Statistika ir jos taikymai, I-III.TEV, Vilnius. www.statistika.mif.vu.lt (papildomi konspektai ir informacija)http://stat.vadoveliai.lt (yra ir III dalis)iv) Julius Kruopis (1993). Matematinė statistika. Mokslo ir enciklopedijų leidykla, Vilnius. (2-as leidimas, 1-as leidimas 1977, Mokslas, Vilnius)-v) Rūta Levulienė (2009). Statistikos taikymai naudojant SAS. VU leidykla, Vilnius. (SAS)-vi) Stanislovas Algimantas Martišius, Vytautas Kėdaitis (2003, 2010). Statistika 1: Statistinės analizės teorija ir metodai. VU leidykla, Vilnius.Stanislovas Algimantas Martišius, Vytautas Kėdaitis (2004, 2011). Statistika 2: Statistikos išvados ir sprendimai. VU leidykla, Vilnius. (ekonomistams)-III.1.2. Anglų kalba (atnaujinti!)i) Metzger, W. J. (2001). Statistical Methods in Data Analysis. Katholieke Universiteit Nijmegen.http://www.hef.kun.nl/~wes/stat_course/statist.ps ii) D. S. G. Pollock. Lectures in Mathematical Statistics.http://webspace.qmul.ac.uk/dsgpollock/public_html/dirindex.html *III.1.3. Nuorodosi) Lietuviškų knygų sąrašas. (ir daug statistikos ir ekonometrijos konspektų!) http://www.statistika.mif.vu.lt/lietuvisku-vadoveliu-sarasas/ ii) Buvęs ekonometrijos studentų tinklalapis (2009)https://web.archive.org/web/*/ekonometrija.mokslo.info https://web.archive.org/web/*/www.beberis.puslapiai.lt III.2. ŽINYNAIi) Resa Corporation. Xycoon. (skirstinių savybės) http://www.xycoon.com ii) Michael P. McLaughlin (2001). Regress+ Appendix A. A Compendium of Common Probability Distributions. (120 p., skirstinių savybės) http://www.causascientia.org/math_stat/Dists/Compendium.pdf http://www.causascientia.org/math_stat/Dists/Compendium.html http://www.causascientia.org/software/Regress_plus.html iii) Christian Walck (11 November, 2000). Hand-book on Statistical Distributions for Experimentalists. Internal Note SUF-PFY/96-01, Particle Physics Group, Fysikum, Stockholm University, 11 December 1996. (204 p., skirstinių savybės) http://www.physto.se/~walck/suf9601.ps.gz http://www3.tsl.uu.se/~ingelman/graduate_school/courses/montecarlo/distributions.ps iv) Wikipedia. www.wikipedia.org (pvz., Probability distribution – skirstinių savybės)v) WolframMathWorld. http://mathworld.wolfram.com , WolframAlpha. www.wolframalpha.com vi) NIST/SEMATECH e-Handbook of Statistical Methods. http://www.itl.nist.gov/div898/handbook/ III.3. VISATEKSTĖS BAZĖS III.3.1 Prenumeruojamos (pridėti žurnalų lentelę priede?)i) Vilniaus universiteto biblioteka. www.mb.vu.lt , http://vu.lvb.lt (ieškoti elektroniniai ištekliai, prenumeruojamos duomenų bazės: Ebrary, ScienceDirect, SpringerLink, JSTOR, EBSCO ir kt., tik per VU tinklą, pasikeitė sąsaja ir vienas kelias neveikia!)(Blackwell Synergy, Project Euclid? www.projecteuclid.org )ii) Google Books. http://books.google.com (kaip “iškrapštyti” png paveiksliukus firefox, chrome, IE?)III.3.2. Nemokamos?III.3.3. Statistikos mokymo žurnalaii) American Statistician (JSTOR, EBSCO?)ii) Teaching StatisticsIII.4. LITERATŪROS PAIEŠKAi) Google Search. www.google.com (+,-,““, užklausos formulavimas: mean – per plati užklausa, how touse google search, „Google“ kopija ▼)ii) Google Scholar. http://scholar.google.com iii) Interneto archyvas. www.archive.org

2-23

Page 3: STATISTIKA SU KOMPIUTERIU 11p.-4. Duomenys ir bylos 13p.-5. …vtas/stat/konspektas20160209.pdf · 2017-11-13 · STATISTIKOS i) Jonas Kubilius (red.) (1994). Matematikos terminų

III.5. DUOMENŲ BAZĖSi) Statistikos departamentas. www.stat.gov.lt ii) Lietuvos statistikos metraštis. (Statistikos departamento skaitykloje) iii) Eurostat. www.eurostat.com iv) Lietuvos bankas. www.lbank.lt v) Dataverse Network. http://thedata.org/home vi) Journal of Applied Econometrics Data Archive. http://qed.econ.queensu.ca/jae/ vii) Global Market Information Database (GMID). www.mb.vu.lt (tik iš VU tinklo, Euromonitor)?viii) Yahoo Finance (fImport pavyzdys su USD/EUR kursu turbut I 3A paskaita)?ix) Economagic (valiutų kursai)?x) Naftos kainos, US Energy Administrationxi) VĮ Žemės ūkio informacijos ir kaimo verslo tarnyb. Žemės ūkio ir maisto produktų rinkos informacinėsistema. https://www.vic.lt/?mid=352http://www.produktukainos.lt/ IV. Kompiuterio programos IV.1. STATISTIKOS IR MATEMATIKOSi) R. www.r-project.org *ii) Julia. http://julialang.org (greitis, greitis, greitis..., Julia Studio, Juno)*iii) +SAS, +SPSS, +Stata*iv) Python, NumPy/SciPy, Python(x,y)*IV.1.1. R Android (nebėra)i) R Console Free. www.appsembedded.com https://play.google.com/store/apps/details?id=com.appsopensource.R ii) R on Android. www.r-ohjelmointi.org/?p=1434 *IV.1.2. Ekonometrijai) gretl. http://gretl.sf.net (geras pagalbos skyrius ekonometrams, gali dirbti su R ir Octave duomenimis)ii) +Eviews. www.eviews.com (geras pagalbos skyrius ekonometrams)*IV.1.3 Skaičiavimo metodai (+Matlab, R)i) Octave. www.octave.org ii))GNU Octave for Android. https://play.google.com/store/apps/details?id=com.octave iii) Michael Creel (November 2015) Econometrics.https://github.com/mcreel/Econometrics/blob/master/econometrics.pdf https://github.com/mcreel/Econometrics , http://pareto.uab.es/mcreel/Econometrics/ http://octave.sourceforge.net/econometrics/ , iv) Dirk Eddelbüttel (November 1999). Econometrics with Octave. (nuoroda?)v) Scilab, Euler Math Toolboxvi) Numerical analysis. Wikipedia. https://en.wikipedia.org/wiki/Numerical_analysis (Skaičiavimo metodai)*IV.1.3 Simboliniai skaičiavimai (+Maple)i)wxMaxima. http://wxmaxima.sf.net , Maxima. http://maxima.sf.net ii) Maxima on Android. https://play.google.com/store/apps/details?id=jp.yhonda iii) Yacas, ryacas paketasiv) Computer algebra system. Wikipedia. https://en.wikipedia.org/wiki/Computer_algebra_system IV.2. DOKUMENTŲ RODYMOi) Universalios: Sumatra, Calibre, STDU Viewer, Evince, Okularii) Online viewer for PDF, PostScript and Word. http://view.samurajdata.se/ iii) WinDjView. (djvu bylos) http://sourceforge.net/projects/windjview iv) DjView. (djvu bylos) http://djvulibre.djvuzone.org/ -v) Ghostscript, Gsview. (ps bylos) http://pages.cs.wisc.edu/~ghost/ IV.3. DOKUMENTŲ REDAGAVIMOi) +MS Word (pageidautina doc, bet ne docx)ii) OpenOffice, LibreOffice (pageidautina pdf)iii) Kingsoft Office (ypatingai geras doc bylų palaikymas, yra Android versija)

3-23

Page 4: STATISTIKA SU KOMPIUTERIU 11p.-4. Duomenys ir bylos 13p.-5. …vtas/stat/konspektas20160209.pdf · 2017-11-13 · STATISTIKOS i) Jonas Kubilius (red.) (1994). Matematikos terminų

IV.3.1. LaTeXi) LaTeX. www.miktex.org , http://uosis.mif.vu.lt/~zemlys/latex/ ii) Tipiškas LaTeX dokumentas. http://amath.colorado.edu/documentation/LaTeX/basics/example.html iii) Texmaker, TeXnicCenter, MeWa, WinShell, LEd Standard Edition (LaTex redaktoriai)iv) DVI. http://en.wikipedia.org/wiki/DVI_%28TeX%29 (dvi bylos)V. R tinkle V.1. R TINKLALAPISi) R-project. www.r-project.org (Mailing Lists, Search, Documentation, CRAN)ii) CRAN. http://cran.at.r-project.org/ (Task Views, Search, Software, Documentation, gražiausios formulės pagalbos bylose pdf formatu, pvz., paketo e1071 skewness komandos pagalbos puslapis)iii) Instaliavimas: naujausia versija R 2.15 iš CRAN>Austria>Windows>basearba http://cran.at.r-project.org/bin/windows/base/ V.2. R PAKETAIi) Paketai: CRAN>Austria>Windows>contributedarba http://cran.r-project.org/src/contrib/PACKAGES.htmlarba http://cran.at.r-project.org/bin/windows/contrib/ ii) Paketų vinjetės (aprašymai)http://cran.r-project.org/doc/vignettes/ iii) R standartiniai paketai. (paketai base(cars, iris, islands, sunspots,women), boot, grid, KernSmooth, nnet, splines, stepfun (ECDF), ts (lynx, Nile, Seatbelts, sunspot); kartu su R) http://stat.ethz.ch/R-manual/R-devel/doc/html/packages.htmliv) Naudingi paketai: (!!!atnaujinti sąrašą!!!); Recommended packages?adapt (daugiamatis integravimas),amap (daugiamatė analizė),Davies (useful functions for the Davies quantile function and the Generalized Lambda distribution),Devore5, Devore6 (Data sets and sample analyses from Jay L. Devore (2000, 2003)),Design (logistic regression),dse (daugiamatės laiko eilutės),effects (Effect Displays for Linear and Generalized Linear Models), exactRankTests (Exact Distributions for Rank and Permutation Tests), fracdiff (Fractionally differenced ARIMA (p,d,q) models),gld (Basic functions for the generalised (Tukey) lambda distribution),grasper (Generalized Regression Analysis and Spatial Predictions for R, http://sourceforge.net/projects/grasper )Hmisc (Harrell Miscellaneous, ECDF)ineq (Lorenco kreivės),lmtest (Testing Linear Regression Models ),locfit (Local Regression, Likelihood and Density Estimation, Old Faithful Geyser Dataset),Matrix (Classes and methods for numerical linear algebra using Lapack),multcomp (Multiple Tests and Simultaneous Confidence Intervals)mvtnorm (Multivariate Normal and T Distribution),Normix (Normal Mixture Models),Rcmdr (A Basic-Statistics GUI for R),odesolve (Solvers for Ordinary Differential Equations),Quadprog ( Functions to solve Quadratic Programming Problems),scatterplot3d (3D Scatter Plot),sm (kernel smoothing methods),sn (The skew-normal and skew-t distributions),strucchange (Testing for Structural Change),tseries (finansinės laiko eilutės, runs.test)v) Nestandartiniai R paketai. (R-(D)COM, stable)http://cr an.r-project.org/other-software.html vi) Jim Ramsay. Ecmet package.http://www.psych.mcgill.ca/faculty/ramsay/ramsay.html www.econ.utah.edu/ehrbar/ecmet.zip vii) J. Verzani. Simple package. (simple.median.test – ženklų kriterijus)http://www.math.csi.cuny.edu/Statistics/R/simpleR/index.html

4-23

Page 5: STATISTIKA SU KOMPIUTERIU 11p.-4. Duomenys ir bylos 13p.-5. …vtas/stat/konspektas20160209.pdf · 2017-11-13 · STATISTIKOS i) Jonas Kubilius (red.) (1994). Matematikos terminų

V.3. R KNYGOSi) Books related to R. http://www.r-project.org/doc/bib/R-books.html (R tinklalapis > Documentation > Books)ii) W. N. Venables, B. D. Ripley (2002). Modern Applied Statistics in S. Springer. (4th edition, MASS paketas)http://www.massey.ac.nz/~pscowper/pub/161330/MASS.pdf http://www.stats.ox.ac.uk/pub/MASS4/ iii) Gareth James, Daniela Witten, Trevor Hastie, Robert Tibshirani (2013). An Introduction to Statistical Learning with Applications in R. Springer. (nemokama, geras įvadas į statistinius metodus, geros skaidrės)http://www-bcf.usc.edu/~gareth/ISL/ iv) Florian Heiss (February 2016). Using R for Introductory Econometrics. (Ekonometrija, R įvadas)http://www.urfie.net/ V.4. R KONSPEKTAI. V.4.1. Lietuvių kalbai) Remigijus Lapinskas (2005 rugsėjis). Įvadas į statistiką su R.http://www.mif.vu.lt/~rlapinskas/VISKAS%20-%20ALL%20IN%20ONE/%c1vadas%20%e1%20statistik%e0%20su%20R.pdf http://www.statistika.mif.vu.lt/wp-content/uploads/2014/05/Ivadas-i-statistika-su-R-2012xi30_t.pdf http://www.mif.vu.lt/~rlapinskas/ http://web.archive.org/web/20150922173352/http://www.statistika.mif.vu.lt/wp-content/uploads/2014/05/Ivadas-i-statistika-su-R-2012xi30_t.pdf http://www.mif.vu.lt/~rlapinskas/2012-2013/Ivadas%20i%20statistika%20su%20R/IntroStatR%20-%202012xi30.pdf ii) Remigijus Lapinskas (2010.01). Pats trumpiausias taikomosios statistikos kursas su R. http://www.mif.vu.lt/~rlapinskas/VISKAS%20-%20ALL%20IN%20ONE/Pats%20trumpiausias%20taikomosios%20statistikos%20kursas%20su%20R.pdf http://web.vu.lt/mif/a.reklaite/files/2013/02/2010.01-Pats-trumpiausias-su-R.pdf iii) Tomas Rekašius. R konspektas. (dar žr. Dėstymas>Ekonometrija, Duomenų analizė)http://fmf.vgtu.lt/~trekasius/stat/ https://github.com/trekasius/Rkonspektas V.4.2. Anglų kalbai) W. N. Venables, D. M. Smith and the R Core Team. An Introduction to R. http://cran.r-project.org/doc/manuals/R-intro.pdf (R tinklalapis>Documentation>Manuals ir kartu su R)ii) John Verzani (2002). SimpleR - Using R for Introductory Statistics. The College of Staten Island, Department of Mathematics. http://cran.r-project.org/doc/contrib/Verzani-SimpleR.pdf http://www.math.csi.cuny.edu/Statistics/R/simpleR/index.html iii) Jason Owen (2007). R Guide. http://cran.at.r-project.org/other-docs.html iv) Julian Faraway (2002). Practical Regression and Anova using R. (labai geras regresijos įvadas) http://cran.r-project.org/doc/contrib/Faraway-PRA.pdf http://citeseer.ist.psu.edu/642417.html v) Grant V. Farnsworth (October 26, 2008). Econometrics in R. (ekonometrija) http://cran.at.r-project.org/doc/contrib/Farnsworth-EconometricsInR.pdf V.5. R PROGRAMAVIMASi) Hyon-Jung Kim (2002). Introduction to R. http://cc.oulu.fi/~hyon/r.html Toliau žymėsim [Kim]ii) R Core Team. R Language Definition. (R tinklalapis>Documentation>Manuals)http://cran.r-project.org/doc/manuals/R-lang.pdf iii) Gareth Roberts (November 6, 2002). Computer Intensive Methods.http://www.maths.lancs.ac.uk/~robertgo/cim.html iii) Norman Matloff (December 4, 2008). R for beginners/R for Programmers?iv) Ton Dieker (April 2002). Simulation of fractional Brownian motion. Master Thesis, Vrije Universiteit Amsterdam. http://homepages.cwi.nl/~ton/mastersthesis/ (C kodo prijungimas)

5-23

Page 6: STATISTIKA SU KOMPIUTERIU 11p.-4. Duomenys ir bylos 13p.-5. …vtas/stat/konspektas20160209.pdf · 2017-11-13 · STATISTIKOS i) Jonas Kubilius (red.) (1994). Matematikos terminų

V.6. R STRAIPSNIAIi) R Journal (anksčiau vadinosi R News). http://cran.r-project.org/doc/Rnews/ ii) UseR. http://www.r-project.org/conferences.html (Distributed Statistical Computing 2003. http://www.ci.tuwien.ac.at/Conferences/DSC-2003/ )iii) Journal of Statistical Software, http://www.jstatsoft.org iv) RSS Matters. http://web3.unt.edu/benchmarks/ , http://www.unt.edu/rss/rssmattersindex.htm V.7. R ŽINYNAIi) R Manuals.http://cran.r-project.org/doc/manuals/ (ir kartu su R, yra skirtumų)ii) R paketų vartotojų vadovai. http://cran.at.r-project.org/ (ir kartu su R C:\Program Files\R\R-2.6.1\library\e1071\, bet ne pdf formatu)iii) R FAQ, R Windows FAQ.http://cran.r-project.org/faqs.html (ir kartu su R)iv) Tom Short. R Reference Card. www.rpad.org/Rpad/R-refcard.pdf (skirstinių funkcijų sąrašas)v) Jonathan Baron (2001). R reference card. www.psych.upenn.edu/~baron/refcard.pdf , refcard.tex vi) Marc Vandemeulebroecke (July 14, 2003). The R language - a short companion.http://cran.r-project.org/doc/contrib/R_language.pdfvii) A. I. McLeod (2000). R Lexicon.www.stats.uwo.ca/computing/R/mcleod/default.htmviii) Paul Johnson (2012). Rtips. http://pj.freefaculty.org/R/Rtips.html V.8. R TINKLARAŠČIAIi) Google Search: R bloggersii) http://www.r-bloggers.com/ iii) http://www.r-statistics.com/ , http://www.r-statistics.com/tag/r-bloggers/ iv) http://novicemetrics.blogspot.com/2011/04/r-bloggers.html v) http://theaverageinvestor.wordpress.com/2011/06/07/computing-daily-returns-and-the-r-bloggers-portal/ vi) http://theaverageinvestor.wordpress.com/2011/06/08/arma-models-for-trading-part-v/V.9. R NAUJIENŲ GRUPĖSi) R Mailing Lists: r-announce, r-help, r-devel. www.r-project.org/mail.htmlii) R Help 2001 [R] Econometrics. https://stat.ethz.ch/pipermail/r-help/2001-October/015820.html iii) S-News Mailing List Archives. http://www.biostat.wustl.edu/archives/html/s-news/ V.10. R PAIEŠKAi) R Site Searchhttp://cran.r-project.org/search.html Google Search: raktiniai žodžiai site:www.r-project.org http://finzi.psych.upenn.edu/search.html ii) S-Plus/R Function Finder. http://biostat.mc.vanderbilt.edu/s/finder/finder.html iii) Rseek.org www.rseek.org iv) Crantastic. http://crantastic.org

6-23

Page 7: STATISTIKA SU KOMPIUTERIU 11p.-4. Duomenys ir bylos 13p.-5. …vtas/stat/konspektas20160209.pdf · 2017-11-13 · STATISTIKOS i) Jonas Kubilius (red.) (1994). Matematikos terminų

2 SKYRIUS: R KOMANDŲ ĮVADAS I. Pagalbos komandoshelp(help)?mean #arba help(mean)?'for' #rezervuotiems žodeliams?Syntax (?Arithmetic, ?Control, ?Extract ir tt.)# R svarbu didžiosios ir mažosios raidės??mean #arba help.search('mean') arba "mean", bet ne ”mean”help.start() #jei nenurodom argumentų, be skliaustų išvestų funkcijos R kodą?demo, ?exampleII. Pagalbinės komandoskomanda1;komanda #komentarasgetwd()ls()?strII.1. PAKETŲ KOMANDOSinstalled.packages() #instaliuoti paketai, arba RGui meniu: Packages>Load package...library() #instaliuoti paketai su aprašymaislibrary(MASS) #arba library('MASS'), arba RGui meniu: Packages>Load package...?requireinstall.packages('e1071', dependency=T) #galima naudoti parametrą ,lib.loc='nurodyti kelią'#arba RGui meniu: Packages>Install package(s)...#arba iš CRAN parsisiųsti paketo zip bylą ir#RGui meniu: Packages>Install Package(s) from local zip files...library(e1071)?skewness #negražios formulės, kaip pažiūrėti gražias?II.1.2. Paketų pagalbos komandoslibrary(help='MASS') #paketo pagalbavignette()browseVignettes()tools::getVignetteInfo()III. R vartotojo sąsajosi) File>New ScriptKaip pakeisti RGui komandų lango (konsolės) eilučių ir stulpelių skaičių?ii) RStudio. www.r-studio.com (dirba ir su sweave, yra neinstaliuojama (portable) versija kartu su R)iii) gretl*iv) SciTE, notepad++, synWrite, Komodo edit, E.M.P.U.*v) Tinn-R*vi) vim, Geany,*vii) Emacs ESS*viii) RKWard*ix) Eclipse StatET plug-in*x) R GUI Projects. http://www.sciviews.org/_rgui/

7-23

Page 8: STATISTIKA SU KOMPIUTERIU 11p.-4. Duomenys ir bylos 13p.-5. …vtas/stat/konspektas20160209.pdf · 2017-11-13 · STATISTIKOS i) Jonas Kubilius (red.) (1994). Matematikos terminų

3 SKYRIUS: VEKTORIAI IR MATRICOS (pagal [Kim] Lecture 1) I. Skaičiaia<-1 arba a=1, bet ne a_1a #skaičius saugo kaip vienmatį vektoriųb='mama'c=sqrt(2)Inf, pi*I.1. KOMPLEKSINIAI SKAIČIAI?complexz=1+2iz*zabs(z)log(z)sqrt(-1+0i)exp(1+2i)exp(1)*(cos(2)+1i*sin(2))I.2. FUNKCIJOS?Math, ?Arithmetic, ?SpecialOperatoriai: +, -, *, /, 4^2 arba 4**2Funkcijos: abs, signsqrt, exp, log ,gammasin, cos, tan, asin, acos, atan10%/%3 #sveikoji dalyba, div Paskalyje10%%3 #sveikosios dalybos liekana, mod PaskalyjeI.3. APVALINIMASround(1.5) #pagal IEC 60559 standartą 5 apvalina link lyginio skaitmensround(1.5)+round(2.5) #deja round(1.5)+round(3.5)trunc(1.5)II. Vektoriai II.1. KŪRIMASx=c(4,1,3,2,2)c(1,x,1)y=1:5 #seq(1,5) sutrumpintas variantasseq(1,5,0.5)seq(1,5,,9) #arba seq(1,5,length=9)seq_along(12:18) #seq(along=12:18) -”sunumeruoja” vektoriaus koordinatesrep(1:3,3)rep(1:3,1:3)rep(1:3,each=4)II.2. FUNKCIJOSsin(x) #vienmatės R funkcijos argumentų vektoriui grąžina atitinkamų funkcijos reikšmių vektoriųlength(x)sum(x)cumsum(y) #analogiškai ?prod, ?cumproddiff(x)II.2.1. Rūšiavimassort(x)order(x) #kuris elementas yra pirmas, antras,...rank(x)rank(x,ties.method='first')II.2.2. Ekstremumai?min(x) #analogiškai ?max, ?range?cummin(x) #?cummax?pmin(x,y) #minimumas pakoordinačiui, palyginti su min(x,y), analogiškai ?pmaxpmin(1:10,10:1) #palyginti su min(1:10,10:1)?optimize #vienmatis optimizavimasoptimize(cos,c(0,pi))?optim #plačiau žr. pavyzdį R programavimo skyrelyje?uniroot #vienmačių lygčių sprendimas

8-23

Page 9: STATISTIKA SU KOMPIUTERIU 11p.-4. Duomenys ir bylos 13p.-5. …vtas/stat/konspektas20160209.pdf · 2017-11-13 · STATISTIKOS i) Jonas Kubilius (red.) (1994). Matematikos terminų

II.2.3. which komandawhich(x==10) #nepainioti su priskyrimo sakiniu x=10!which(x<10)?which.min #which.maxII.3. APRAŠOMOJI STATISTIKAx=rnorm(25)II.3.1. Padėties empirinės charakteristikossummary(x)mean(x) #ir “nupjautas” empirinis vidurkismedian(x)#bet ne mode(x)Central Tendency. Wikipedia. http://en.wikipedia.org/wiki/Central_tendency II.3.2. Sklaidos empirinės charakteristikosvar(x); sd(x)IQR(x) #tarpkvartilinis atstumas (tarp 1 ir 3 kvartilių)diff(range(x)) #duomenų aibės plotisII.3.3 Kitos?quantile #empiriniai kvantiliaiy=rnorm(25)cov(x,y)cor(x,y)II.4. POAIBIAI?Extractugis=c(176,160,182)ugis[2]ugis[c(2,1,2)]ugis[-3]ugis[ugis>175]names(ugis)=NULLII.4.1. Pavadinimaivardas=c('Mikas','Agne','Benas')names(ugis)=vardasnames(ugis)ugisugis['Agne'] #arba ugis[2]*II.5. AUTOMATINIS VEKTORIŲ ILGIO KEITIMASs=0 #vietoj s=numeric(3)s[3]=7III. Matricos III.1. KŪRIMASa=c(65,26,76,28,53,65)A=matrix(a,2 ) #dvi eilutės, pagal nutylėjimą surašo pagal stulpeliusB=matrix(a,ncol=2,byrow=T)III.1.1. rbind, cbind komandosx=c(1,2,4)y=7:9rbind(x,y)cbind(1,x,y,B),III.2. POAIBIAIB[1,2]B[1,]B[,2]Užduotis. Kuris matricos B elementas lygus 65?which(B==65)which(B==65,arr.ind=T)

9-23

Page 10: STATISTIKA SU KOMPIUTERIU 11p.-4. Duomenys ir bylos 13p.-5. …vtas/stat/konspektas20160209.pdf · 2017-11-13 · STATISTIKOS i) Jonas Kubilius (red.) (1994). Matematikos terminų

III.3. FUNKCIJOSdim(B)sum(B)III.3.1. diag komandadiag(5)diag(1:3)diag(B)III.3.2. Algebrinės operacijost(B) #transponavimasA%*%B #bet ne A*B?crossprod; ?outerouter(1:9,1:9) #arba (1:9)%*%t(1:9) – išorinė sandauga (daugybos lentelė)outer(1:4,5:8,'+') #arba bet kokia dviejų argumentų funkcija (pavadinimas)?svd; ?qr; ?chol?eigen; ?detqr(B)$ranksum(diag(B)) #matricos pėdsakasIII.3.3. Solve komandasolve(A)Užduotis. Išspręskite sistemą:3*x1+2*x2+6*x3=445*x1-3*x2+4*x3=186*x1+3*x2-2*x3=14#Ax=b – užrašome sistemą matriciniu pavidalusolve(A,b)Pavyzdys, kai blogai veikia x=A-1b – analogija dalybai iš mažo skaičiausIII.4. APRAŠOMOJI STATISTIKAmean(A)colMeans(A) #rowMeansrowSums(A) #colSums?rowsumsummary(A)cov(A) #arba var(A)cor(A)IV. Sąrašais=list(x=1:3,y=c('a','b'))s; s$x; s[['y']]; s[[2]]c(s,z=7)#w=... jei norim išsaugoti, s=... jei norim papildyti s

10-23

Page 11: STATISTIKA SU KOMPIUTERIU 11p.-4. Duomenys ir bylos 13p.-5. …vtas/stat/konspektas20160209.pdf · 2017-11-13 · STATISTIKOS i) Jonas Kubilius (red.) (1994). Matematikos terminų

4 SKYRIUS: DUOMENYS IR BYLOS (FAILAI) I. Duomenų lentelės (Data frame)(daugiau žr. [Kim] Lecture 2) ?data.frame #duomenų lentelėsx1=c('A','B','C')x2=c(9,7,3)xxx=data.frame(x1,x2)xxx$x1 #arba xxx[['x1']]xxx$x2[2]?data?attach#nebereikia nurodyti duomenų šaltinio pavadinimoI.1. DUOMENŲ TRANSFORMACIJOS?subset?transform?reshapelibrary(reshape)*I.1.1. R-bloggersSelect operations on R data frames. http://www.r-bloggers.com/select-operations-on-r-data-frames/ A speed test comparison of plyr, data.table, and dplyr.http://www.r-bloggers.com/a-speed-test-comparison-of-plyr-data-table-and-dplyr/ II. read.table komandaComma-separated values. Wikipedia. http://en.wikipedia.org/wiki/Comma-separated_values Sukurkime tekstinę bylą mano.txt (MS Windows pagal nutylėjimą slepia bylos išplėtimą, todel nesukurkite mano.txt.txt, nepamirškite enter paskutinės eilutės gale):a,b,c1,2,34.5,100,8.9Nuskaitome su komanda ?read.table, tiksliau jos variantu (atkreipkite dėmesį – pasvirasis brūkšnys / arba //, o ne \):x=read.csv('U:/.../mano.txt') #,dec='.' ,sep=',' #nuskaitoduomenis iš bylos į duomenų lentelęx$b[2]=6.7?write.tablewrite.csv(x,'U:/.../tavo.txt',row.names=F,quote=F)Kai MS Windows regioniniai nustatymai lietuviški:y=read.csv2(...) #,dec=',' sep=';'write.csv2(y,...)III. Užduotis. Importuokite į R Lietuvos BVP duomenis III.1. BVP duomenys ir grafikasOficialiosios statistikos portalas. www.osp.stat.gov.lt , www.stat.gov.lt Rodiklių duomenų bazė > Ūkis ir finansai (makroekonomika) > Nacionalinės sąskaitos > Bendrasis vidaus produktas (BVP) > BVP to meto kainomis > BVP > BVP, to meto kainomisPasirenkame matavimo vienetus, datas; pasirinkti, rodytiYra papildoma galimybė gauti duomenis automatiškai; paspaudus „dantratį“ galima pakeisti nustatymusEksportuojame kabliataškiu atribota (*.csv)Atidarome arba išsaugome ir atidarome, paredaguojame stulpelių pavadinimus su normaliu tekstiniu redaktoriumi (WordPad, Notepad++, bet ne standartiniu Notepad) arba MS Excel.xxx=read.csv('U:/.../bvp.txt')plot(xxx);lines(xxx)III.2. BVP grafikas 2xxx=read.csv('U:/.../bvp.txt',as.is=T) #as.is=T!, jei xxx$data nuskaito kaip faktoriųzzz=seq(along=xxx$data)names(zzz)=xxx$dataplot(zzz,xxx$bvp)III.3. BVP grafikas 3plot(...,axes=F)?axisIII.4. BVP grafikas 4ttt=ts(xxx$bvp,frequency=4,start =c(1993,1)) #ketvirtiniams duomenims, kaip metiniams?

11-23

Page 12: STATISTIKA SU KOMPIUTERIU 11p.-4. Duomenys ir bylos 13p.-5. …vtas/stat/konspektas20160209.pdf · 2017-11-13 · STATISTIKOS i) Jonas Kubilius (red.) (1994). Matematikos terminų

plot(ttt,at=1:length(ttt))

IV. Kitos komandoslibrary(foreign)library(xlsReadWrite)library(fImport)?scan #nuskaito duomenis iš komandinės eilutės arba bylos?sourceV. Faktoriai (kategoriniai kintamieji)Dažnai R iš bylos nuskaito duomenis kaip faktorius (ypač jei yra praleistų reikšmių), padės pvz. as.numeric(as.character(y$B))a=c('vyras','moteris')x=c(1,1,2,2,1,1,2)z=factor(x,labels=a) #sutrumpintas prastesnis variantas as.factor(x)summary(z)V.1. GRUPAVIMO KOMANDOSsummary(z)table(z)table(x) #tinka ir vektoriamstt=cut(-10:10,c(-Inf,-3,0,3,Inf))table(tt)findInterval(2:4,c(-Inf,-3,0,3,Inf))split(1:10,1:2)#antrą faktorių argumentą pailgina iki duomenų vektoriaus (pirmo argumento) ilgiorle(x) #skaičiuoja serijas (reikšmių pasikartojimus iš eilės)Daugiau apie faktorius [Kim] Lecture 2

12-23

Page 13: STATISTIKA SU KOMPIUTERIU 11p.-4. Duomenys ir bylos 13p.-5. …vtas/stat/konspektas20160209.pdf · 2017-11-13 · STATISTIKOS i) Jonas Kubilius (red.) (1994). Matematikos terminų

5 SKYRIUS: R GRAFIKA (pagal [Kim] Lecture 3) I. plot komandax=-10:10y=x^2plot(x,y)plot(x,y,type='l')I.1. GRAFINIAI PARAMETRAISvarbiausi plot komandos parametrai (plačiau žr. grafinių parametrų nustatymo procedūros ?par pagalbą),main='eilute' #pagrindinė antraštė viršuje,sub='eilute' #paantraštė grafiko apačioje,xlab='eilute' #x ašies antraštė (analogiškai ylab),add=T #nedokumentuotas, naudoja ankstesnį brėžinį, yra ?curve,xlim=c(1,max(7,x,y)) #x ašies rėžiai, analogiškai ,ylim,axes=F #nebrėžti ašių, jei reikia galima nubrėžti vėliau,log='xy' #logaritminės skalės,col=2 #spalvos numeris arba pavadinimas 'red', plačiau žr. ?par,lty=2 #linijos tipas, smulkiau žr. ?par,lwd #linijos storis,pch=2 #taško tipas arba simbolis, plačiau žr. ?points,type='l' #linijos, 'p' – taškai, 'b' – linijos ir taškai, 'o' – linija per taškus, 'h' – stulpeliai, smulkiau žr. ?plotplot(c(1,9), 1:2, type='n') #tuščia koordinačių sistema,lab #ašių žymų skaičiusplot(x,y,type='l',main='Ištisinė linija') #galima rašyti lietuviškai, jei neveikia, nustatyti LT klaviatūrąII. Bazinės komandosplot(x,y,type='l') #sudėtinė komanda, apjungianti bazines komandastitle('Ištisinė linija') #bazinė komandapoints(x,y,pch=2)lines(x,y,lty=2)II.1. Užduotis. Nubrėžkite x^2 ir -x^2 grafikus viename brėžinyje.z=-x^2plot(x,y,type='l',ylim=c(min(y,z),max(y,z)))lines(x,z)matplot(x,cbind(x^2,-x^2),type='l') #sudėtinė komandaII.2 DAUGIAU BAZINIŲ KOMANDŲabline(1,10)segments(0,0,5,50) #atkarpos, laužtės,?arrows su rodyklepolygon(c(0,5,10),c(0,50,0),col=2) #daugiakampistext(5,10,'SVEIKINU!',srt=130) # srt - kampasexample(mtext) #tekstas paraštėse, spausti ENTER/RETURN ir pele ant brėžinioexample(box) #grafiko rėmelisexample(legend)example(title)example(axis)example(grid)III. Funkcijų grafikaix=seq(-pi,4*pi,,100)y=sin(x)plot(x,y,type='l')curve(sin,-pi,4*pi) #tą patį duos plot(sin,-pi,4*pi) kai pirmas argumentas ne vektorius, o R funkcijos pavadinimascurve(sin(2*x),-pi,4*pi) #funkcija pateikiama kaip reiškinys, žr. Reiškiniai, sudėtinė komandacurve(x^3,-1,2) #pabandykite gauti tą patį su plot!

13-23

Page 14: STATISTIKA SU KOMPIUTERIU 11p.-4. Duomenys ir bylos 13p.-5. …vtas/stat/konspektas20160209.pdf · 2017-11-13 · STATISTIKOS i) Jonas Kubilius (red.) (1994). Matematikos terminų

IV. Reiškiniai (Expression)?expression?eval?substituteD(expression(sin(x)),'x')*IV.1. SKAITINIS DIFERENCIJAVIMAS?numericDerivlibrary(numDeriv)*Wikipedia: Automatic DifferentiationV. Interaktyvi grafikax=-10:10y=x*xplot(x, y)identify(x, y, labels=y) #sustabdoma naudojantis meniu, dešiniu pelės klavišu arba ESClocator(type="l") #nuskaito taškų koordinates ir papildomai sujungia linijomisx=c(rnorm(25),5)boxplot(x)locator()library(iplots) #interaktyvios grafikos paketasVI. Grafikos patarimai (kai kas neveikia su R Studio) VI.1. NAUJAS LANGASdev.new() #naujas grafinis langasplot.new() #tuščias lapas, galima naudoti bazines komandas be plotVI.2. GRAFIKŲ ISTORIJAHistory>Recording v – esant aktyviam grafiniam langui išsaugo brėžinius atmintyje, PgUp/PgDnVI.3. KELI GRAFIKAI#grafiniai parametrai, veikiantys tik su par komanda,ask=T #laukia patvirtinimo prieš brėžiant kitą brėžinį,new=F #naudoja esamą brėžinį, analogiškas ,add=Top=par(mfrow=c(2,3))…# 6 grafikaipar(op)VI.4. GRAFIKŲ PERKĖLIMAS Į DOKUMENTUSĮ Word ir OpenOffice geriausia kopijuoti vektoriniu Windows metafile formatu, o ne rastrinį bitmapVI.4.1 pdf formatas?pdf #kaip išsaugoti grafikus kaip pdf bylas ir diskusija apie vektorinius/rastrinius (taškinius) brėžiniuspdf(file='brezinys.pdf') #devSVG(file='brezinys.svg'), png(filename='Rplot%03d.png')plot(1:10)dev.off() #baigiama rašyti į bylągetwd() #jei nerandam failo, arba pdf komandai nurodom pilną kelią, pvz., ,file='U:/Desktop/brezinys.pdf'VI.4.2 LietuvybėSys.setlocale(locale='lithuanian') # Plačiau apie R grafiką LaTeX dokumentuose galima rasti:#V. Zemlys (2007-11-20). Grafikos naudojimas LaTeX. www.mif.vu.lt/~zemlys/download/pdf/graphtut.pdf VII. Grafikos galimybėsdemo(plotmath) #formulės grafikuosedemo(persp) #dviejų argumentų funkcijų grafikai (paviršiai)library(rgl) #jei neinstaliuotas, instaliuoti RGui meniu pagalba arba install.packages('rgl',dependency=T)demo(rgl) #interaktyvi trimatė R grafikalibrary(ggplot2) #“gražesni“ grafikailibrary(lattice) #daugiau grafinių galimybių, statistinė grafika, library(grid)

14-23

Page 15: STATISTIKA SU KOMPIUTERIU 11p.-4. Duomenys ir bylos 13p.-5. …vtas/stat/konspektas20160209.pdf · 2017-11-13 · STATISTIKOS i) Jonas Kubilius (red.) (1994). Matematikos terminų

6 SKYRIUS: STATISTIKA IR GRAFIKA (pagal [Kim] Lecture 3)I. Skirstinių funkcijos („teorinės“)plot(dnorm,-3,3)plot(pnorm,-3,3)I.1. „3 SIGMA“ TAISYKLĖpnorm(3)-pnorm(-3) #daugiau nei 99% normaliojo a. d. reikšmių patenka į (mu-3*sigma,mu+3*sigma)2*pnorm(3)-12*pnorm(2)-1 #daugiau nei 95% normaliojo a. d. reikšmių patenka į (mu-2*sigma,mu+2*sigma)qnorm(0.995) #arba (1+0.99)/2, analogiškai qnorm(0.975)Užduotis. „Gražiai“ nubrėžkite normaliojo a.d. su vidurkiu 7 ir standartiniu nuokrypiu 3 tankio funkcijos grafiką (pasinaudokite “3 sigma” taisykle arba kvantiliais)curve(dnorm(x,7,3),7-3*3,7+3*3,lwd=3)curve(dnorm(x,7,3),qnorm(0.005,7,3),qnorm(0.995,7,3),add=T,col=3,lwd=3)Imtims yra empirinė, Čebyševo taisyklės (žr. Čekanavičiaus, Murausko I d.)I.2. KITI SKIRSTINIAI?Distributions, CRAN>Task Viewsd – tankio funkcija (density)p – pasiskirstymo funkcija (probability)q – kvantilių funkcija (quantile)r – atsitiktinių dydžių generavimas (random)I.2.1. Tolydūs skirstiniainorm – normalusis a. d.unif – tolygus a. d.chisq – chi kvadrato a. d.t – Stjudento a. d.f – Fišerio a. d.cauchy – Koši a. d.exp – eksponentinis a. d.curve(dexp(x),0,qexp(0.99)) #arba tiesiog exp(-x)I.2.2. Diskretūs skirstiniaipois – Puasono a. d.binom – binominis a. d.geom – geometrinis a. d.x=1:15y=dpois(x,5)plot(x,y,type='h',lwd=5)barplot(y,names=x) #apie stulpelines diagramas bus vėliaucurve(ppois(x,5),0,15) #vietoj 15 pasirinkimo „iš lempos“ galim apskaičiuot qpois(0.99,5)II. Imčių funkcijos (empirinės) II.1. SAMPLE KOMANDAsample(1:10)sample(1:6,1) #lošimo kauliuko modeliavimassample(1:6,10,rep=T)sample(0:1,10,rep=T,prob=c(0.2,0.8)) #arba rbinom(10,1,0.8)II.2. KOMBINATORIKAchoose(3,2) #keliais būdais galima parinkti du elementus is trijų,be pasikartojimų, tvarka nesvarbicombn(1:3,2) #išvardija visus galimus variantus)factorial(10)II.3. VERSLO GRAFIKAexample(barplot) #stulpelinė diagramaexample(pie) #skritulinė diagramalibrary(plotrix)#jei neinstaliuotas instaliuoti RGui meniu pagalba arba install.packages('plotrix',dependency=T)example(pie3D) #tačiau pasiskaitykite http://en.wikipedia.org/wiki/Pie_chart

15-23

Page 16: STATISTIKA SU KOMPIUTERIU 11p.-4. Duomenys ir bylos 13p.-5. …vtas/stat/konspektas20160209.pdf · 2017-11-13 · STATISTIKOS i) Jonas Kubilius (red.) (1994). Matematikos terminų

II.4. DOTCHART KOMANDAexample(dotchart) #taškinė diagrama, stulpelinės diagramos alternatyva kategoriniams kintamiesiemspazymiai=c(10,6,8,9,10,7,7,9,7,10,9,10)dalykai=factor(c(1,1,1,1,2,2,2,2,3,3,3,3),labels=c('Lietuviu','Matematika','Muzika')) #rep(1:3,each=4)mokiniai=factor(rep(1:4,3),labels=c('Jonaitis','Petraitis','Kalvaitis','Kalnietis'))data.frame(pazymiai,dalykai,mokiniai) #duomenų lentelėi1=order(mokiniai)data.frame(mokiniai,dalykai,pazymiai)[i1,] #duomenų lentelė išrūšiuota pagal mokiniusdotchart(pazymiai,group=dalykai)dotchart(pazymiai,group=mokiniai)II.5. BOXPLOT KOMANDAexample(boxplot) #stačiakampė diagrama, empiriniai kvartiliai, ūsai – pusantro tarpkvartilinio atstumopar(mfrow=c(2,1),ask=T)boxplot(pazymiai~dalykai,main='Dalykai')tapply(pazymiai,dalykai,mean)aggregate(pazymiai~dalykai,FUN=median) #arba, netiks rūšiavimuii2=rank(tapply(pazymiai,dalykai,median))boxplot(pazymiai~dalykai,at=i2)boxplot(pazymiai~mokiniai,main='Mokiniai')tapply(pazymiai,mokiniai,mean)i3=rank(tapply(pazymiai,mokiniai,median))boxplot(pazymiai~mokiniai,at=i3)II.6. KVANTILIŲ DIAGRAMOSexample(qqline)?qqnorm;?qqplotlibrary(lattice)x=rnorm(50)qqmath(~x,distribution=function(p) qt(p,df=10)) #variantas be linijosqqmath(~x,distribution=function(p) qt(p,df=10),panel=function(x, ...) { panel.qqmathline(x, ...);panel.qqmath(x, ...)}) #variantas su linijaII.7. EMPIRINIS TANKISexample(hist) #histograma, empirinis tankisexample(stem) #tekstinis variantas, galima atkurti duomenisexample(density) #suglodinta histogramax<-rnorm(25) #sugeneruojame standartinio normaliojo skirstinio imtį iš 25 nariųhist(x,freq=F)plot(density(x))II.8. EMPIRINĖ PASISKIRSTYMO FUNKCIJAexample(ecdf) #empirinė pasiskirstymo funkcijaplot(ecdf(x))III. Užduotys III.1. UŽDUOTIS. Viename brėžinyje nubrėžkite histogramą ir teorinę tankio funkcijąNaudokite grafinį parametrą ,add=TIII.2. UŽDUOTIS. Viename brėžinyje nubrėžkite empirinę (tolydų tankio funkcijos įvertį) ir teorinę tankio funkcijasIII.3. UŽDUOTIS. Viename brėžinyje nubrėžkite empirinę ir teorinę pasiskirstymo funkcijasx<-rnorm(25)plot(dnorm,-3,3)#”teisingiau” būtų curve(dnorm(x),qnorm(0.005),qnorm(0.995))hist(x,freq=F,add=T) #freq=F – kad brėžtų tikimybes, o ne dažnius#jei antras grafikas „nusipjauna“, pirmame galima panaudoti parametrą ,ylim=c(0,0.5)plot(density(x))plot(dnorm,-3,3,add=T,lty=2)curve(pnorm(x),-3,3)plot(ecdf(x),add=T,verticals=T,pch=NA)library(ggplot2)library(lattice)

16-23

Page 17: STATISTIKA SU KOMPIUTERIU 11p.-4. Duomenys ir bylos 13p.-5. …vtas/stat/konspektas20160209.pdf · 2017-11-13 · STATISTIKOS i) Jonas Kubilius (red.) (1994). Matematikos terminų

7 SKYRIUS: R PROGRAMAVIMAS?SyntaxI. Loginiai reiškiniai?Comparisonx=2x>=2 #== - lygu, != - nelygu, ! - neiginys#priskyrimas= ir sąlyga== - galima apsirikti!y=1:3y>xsum(y>x) #R TRUE koduoja kaip 1, o FALSE – kaip 0(x>=1)&&(x<=3) # && -ir, || - arba, skaliariniams dydžiams, skaičiuoja greičiau(y>1)|(y<3) # & -ir, | - arba, vektoriams, skaičiuoja viskąany(y>2) #sąlyga tenkinama bent kartąall(y>2) #sąlyga patenkinta visais atvejais*II. AibėsA=c(1,2,2,5,2)B=c(2,3,4)unique(A) #panaikina pasikartojančius elementusunion(A,B) #aibių sąjungaintersect(A,B) #aibių sankirtasetdiff(A,B) #aibių skirtumassetdiff(B,A) setdiff(union(A,B),intersect(a,b)) #simetrinis aibių skirtumassetequal(A,B) #aibių lygybėis.element(2,A) #2 %in% A - is.element alternatyva, match komandos variantassets paketasIII. Sąlyginiai sakiniai?Control #arba ?'if', ?'for' ar panašiai#if( salyga ) reiskinys #reiškinys gali būti grupė komandų, apskliaustų {}#if( salyga ) reiskinys1 else reiskinys2x=2if (x > 0) log(x)if (x > 0){ y=exp(x);log(y)} else{ print('x<=0') z=exp(-x) log(z)}?switchIV. Ciklai IV.1. FOR CIKLAS#for( indeksas in reiksmes) reiskinyss=0for(i in c(2,4,6)) s=s+isy=0for(i in 1:10){ print(i) #ciklo viduje parašius vien reiškinį, R į ekraną neišveda y[i]=i*i}y*IV.2. OBJEKTAI CIKLEz=pifor ( f in c(sin,cos, tan)) cat(deparse(f),'(',z,')=',f(z),'\n',sep='')#apie cat ir deparse funkcijas žr. Eilutės tipo kintamieji

17-23

Page 18: STATISTIKA SU KOMPIUTERIU 11p.-4. Duomenys ir bylos 13p.-5. …vtas/stat/konspektas20160209.pdf · 2017-11-13 · STATISTIKOS i) Jonas Kubilius (red.) (1994). Matematikos terminų

IV.3. WHILE CIKLAS?while (salyga) reiskinys #jei sąlyga netenkinama, reiškinys nevykdomas nė kartox=2;i=0while(x*2<100) # tokia sąlyga, kad x būtų < 100, o ne x<100{ x=x*2 i=i+1}x;iIV.4. REPEAT CIKLASx=2;i=0repeat{ i=i+1 x=x*2 if(x*2>1000000) break}x;iIV.5. R CIKLŲ KONTROLĖGalima nuimti varnelę nuo Misc>Buffered outputSustabdyti skaičiavimus Misc>Stop computationsV. Simbolių eilutės tipo kintamieji V.1. EILUČIŲ FUNKCIJOSx=paste('Abė','cėlė',sep='') #eilučių apjungimo komanda?catsubstr(x,2,4) #pradzia-pabaigasubstr(pi,2,5) #veikia ir su skaičiaisy=strsplit(x,'') #suskaido eilutęstrsplit(x,'ė')y[[1]]unlist(y)match('ė',unlist(y)) #randa eilutės fragmentąpmatch(c('ė','ė','ė'),unlist(y))V.2. DAUGIAU EILUČIŲ FUNKCIJŲhelp.search(keyword = "character") #daugiau eilučių funkcijųstringr paketas*V.3. REGULIARIOSIOS IŠRAIŠKOS (REGULAR EXPRESSIONS)?regex #lyg ir pagalbos tema?grep #ir susijusios funkcijos, pvz. gregexpr?regmatches?Quotes #specialūs simboliai*V.4. DEPARSE KOMANDA?deparsedeparse(args(rnorm)) #pateikia informaciją apie R objektą kaip eilutęx=deparse(sin)V.4.1. I variantasm=gregexpr('\"',x)regmatches(y,m) #nebūtina, tik pasižiūrim, ką suradomm=m[[1]]substr(x,mm[1]+1,mm[2]-1)V.4.2. II variantasm1=regexpr('\"',x) #suranda pirmas kabutesm2=regexpr('\\)',x) #suranda antras kabutessubstr(x,m1+1,m2-2)V.4.3. III variantasunlist(strsplit(x,'\"'))[2]

18-23

Page 19: STATISTIKA SU KOMPIUTERIU 11p.-4. Duomenys ir bylos 13p.-5. …vtas/stat/konspektas20160209.pdf · 2017-11-13 · STATISTIKOS i) Jonas Kubilius (red.) (1994). Matematikos terminų

VI. Duomenų tipų konvertavimas VI.1. SKAIČIŲ FORMATAVIMAS?format2^31-1format(2^31-1)format(2^31-1,scientific=TRUE)format(0.0123,digits=1,nsmall=1)#nsmall - minimalus skaitenų po kablelio skaičiusformat(0.123,digits=1,nsmall=1)?sprintfVI.2. DUOMENŲ TIPŲ FUNKCIJOS#jau turėjom skaičių apvalinimą = iš realių darom sveikus, ?round, ?truncas.numeric('1.23') #eilutė kaip skaičiusas.character(1.23) #skaičius kaip eilutė?as.integer #elgiasi kaip trunc,buvo as.factor, daugiau funkcijų paketo base indekse:help(,base) #ir ieškom as...?is.numeric #is.character, is.factor, is.matrix,..., yra netgi is.function, indekse ieškom is...?is.integer #is.integer(1) elgiasi keistokai, skaitom pagalbą ir ieškom prie pavyzdžių is.wholenumberVII. Vartotojo funkcijos#pavadinimas=function(kintamasis1,kintamasis2=reiksme_pagal_nutylejima,...) reiskinysVII.1. PAVYZDYSf=function(x,y=1) x^yf(2)f(2,3)VII.2. PAVYZDYSg=function(x,y=1) list(x=x,y=y,g=x^y)g(2)g(2,3)g(2,3)$g #arba g(2,3)[[3]]VII.3. Užduotis. Parašykite funkciją g(x,n), kuri grąžintų visus x laipsnius nuo 1-ojo iki n-tojo.x=2n=10a=x^(1:n)names(a)=paste(x,'^',1:n,sep='')VIII. Kodo vektorizavimasx=1:10x^2sin(x)VIII.1. APPLY KOMANDOSM=cbind(1:3,4:6)mean(M) #visų matricos elementų vidurkiscolMeans(M) #rowMeans, rowSums, colSums - jau buvo prie matricų funkcijųapply(M,2,mean) #skaičiuoja matricos M vidurkį: 1 -eilučių; 2 – stulpeliųapply(M,2,median)apply(M,2,sin) #nelabai prasminga, nes tą patį duoda sin(M)apply(M,2,cumsum) #jau buvo prie vektorių funkcijųpazymiai=c(10,6,8,9,10,7,7,9,7,10,9,10)dalykai=factor(c(1,1,1,1,2,2,2,2,3,3,3,3),labels=c('Lietuviu','Matematika','Muzika')) #rep(1:3,each=4)mokiniai=factor(rep(1:4,3),labels=c('Jonaitis','Petraitis','Kalvaitis','Kalnietis'))data.frame(pazymiai,dalykai,mokiniai) #duomenų lentelėtapply(pazymiai,dalykai,mean)tapply(pazymiai,mokiniai,mean)#?lapply, ?sapply, ?mapplyPapildomos informacijos ieškokite [Kim] R. Lecture 2VIII.2. VEKTORINIS IF?ifelse(salyga,reiskinys1,reiskinys2)x=1:10ifelse(x<5,x^2,x)

19-23

Page 20: STATISTIKA SU KOMPIUTERIU 11p.-4. Duomenys ir bylos 13p.-5. …vtas/stat/konspektas20160209.pdf · 2017-11-13 · STATISTIKOS i) Jonas Kubilius (red.) (1994). Matematikos terminų

VIII.3. FUNKCIJŲ VEKTORIZAVIMASVectorize(sum)(x) #gali blogai veikti su standartinėmis funkcijomissum(x)f=function(x) sum(x)Vectorize(f)(x)mapply(sum,x)IX. (Daugiamatis) optimizavimasfw=function(x) 10*sin(0.3*x)*sin(1.3*x^2)+0.00001*x^4+0.2*x+80plot(fw,-50,50,n=1000,main="optim() minimising 'wild function'")res1=optimize(fw,c(-50,50))#vienamatis optimizavimas „aukso pjūvio“ metodures1points(res1$minimum,res1$objective,pch=8,col="red",cex=2)res2=optim(50,fw,control=list(maxit=20000,temp=20,parscale=20))res2points(res2$par,res2$value,pch=8,col="blue",cex=2)res3=optim(50,fw,method="SANN",control=list(maxit=20000,temp=20,parscale=20))res3points(res3$par,res3$value,pch=8,col="green",cex=2)example(optim)*X. Funkcijos kodas#parašius funkcijos pavadinimą be skliaustų, išveda funkcijos programinį kodąVectorize #randame, kad remiasi mapply komandahelpoutermean #nieko įdomaus neduodaplotmethods(mean) #parodo visus bendros komandos variantusmean.default #deja, randame .Internalmethods(plot)?plot.default?plot.functionmethods(class='default')#kaip rasti visas bendras funkcijas, pvz. medianmedian.default?getS3method("mean","default")

20-23

Page 21: STATISTIKA SU KOMPIUTERIU 11p.-4. Duomenys ir bylos 13p.-5. …vtas/stat/konspektas20160209.pdf · 2017-11-13 · STATISTIKOS i) Jonas Kubilius (red.) (1994). Matematikos terminų

8 SKYRIUS: STATISTIKA IR PROGRAMAVIMAS I. Monte Karlo metodasI.1. NAUDOJANT CIKLĄn=10000s=0for (i in 1:n){ x=runif(1) y=runif(1) if(x^2+y^2<1) s=s+1}4*s/n #skaičiaus π įvertisI.2. VEKTORIŠKAIx=runif(n)y=runif(n)i=x^2+y^2<14*sum(i)/nplot(x[i],y[i],pch='.',col=3)points(x[!i],y[!i],pch='.',col=2)plot(4*cumsum(i)/1:n,type='l')abline(h=pi,col=2)I.3. VYKDYMO LAIKO ĮVERTINIMASn=1000000f1=function(n){ s=0for (i in 1:n){ x=runif(1) y=runif(1) if(x^2+y^2<1) s=s+1}4*s/n}f2=function(n){ x=runif(n) y=runif(n) 4*sum(x^2+y^2<1)/n}system.time(f1(n))system.time(f2(n))t1=Sys.time();#kodast2=Sys.time()t2-t1#alternatyvus būdas įvertinti pusprogramio („skripto“) vykdymo trukmęI.4. SISTEMOS KOMANDOS?system.time #ir ?Sys.time susijusios komandos?system #daugiau operacinės sistemos komandųhelp(,base) #base paketo indekse ieškoti funkcijų prasidedančių Sys arba sys ir pan.*I.5. KOMPILIAVIMASlibrary(compiler)f1c=cmpfun(f1)f2c=cmpfun(f2)n=1000000system.time(f1(n))system.time(f1c(n))system.time(f2(n))system.time(f2c(n))

21-23

Page 22: STATISTIKA SU KOMPIUTERIU 11p.-4. Duomenys ir bylos 13p.-5. …vtas/stat/konspektas20160209.pdf · 2017-11-13 · STATISTIKOS i) Jonas Kubilius (red.) (1994). Matematikos terminų

II. Vartotojo funkcijos II.1. Užduotis. Parašykite funkciją h(n), kuri suskaičiuotų, kiek kartu pasikartoja 2 laipsnių nuo 1 iki n pirmieji skaitmenysn=100x=2^(1:n)a=substr(x,1,1)table(a)barplot(table(a))#matom, kad pasiskirstymas netolygus#pavyzdžiui, tik 2^46 duoda 7, tik 2^53 duoda 9 (randam su which)library(gmp) #laipsniai gali būti milžiniški skaičiaibarplot(table(substr(pow.bigz(2,1:1000),1,1)))sprintf('%.20f',2^93)#palyginkite supow.bigz(2,93)II.2. Užduotis. Parašykite funkciją, kuri nubrėžtų funkcijos grafiką, jei argumentas - tankio funkcija ir tolydžią empirinę tankio funkciją, jei argumentas – imtisII.3. Užduotis. Parašykite vektorizuotą tolygiojo intervale [0;1] a.d. tankio funkciją ir nubrėžkite jos grafiką.f=function(x) if((x>=0)&&(x<=1)) 1 else 0f(0.5);f(2)f(c(0.5,2))#nesąmonėsg=function(x) ifelse((x>=0)&(x<=1),1,0)g(c(0.5,2))curve(f,-1,2) #neveikiacurve(g,-1,2)plot(Vectorize(f),-1,2)#alternatyva su Vectorize arba curve(Vectorize(f)(x),-1,2)x=c(0.5,2)Vectorize(f)(x)mapply(f,x)

22-23

Page 23: STATISTIKA SU KOMPIUTERIU 11p.-4. Duomenys ir bylos 13p.-5. …vtas/stat/konspektas20160209.pdf · 2017-11-13 · STATISTIKOS i) Jonas Kubilius (red.) (1994). Matematikos terminų

23-23