Upload
noipana
View
214
Download
2
Embed Size (px)
DESCRIPTION
aciklama
Citation preview
SD Orman Fakltesi Dergisi SDU Faculty of Forestry Journal 2012, 13: 1-4 Aratrma makalesi/Research article Snflandrma ve regresyon aac teknii (SRAT) ile ekolojik verinin modellenmesi Krad zkan Sleyman Demirel niversitesi, Orman Fakltesi, Isparta letiim yazar/Corresponding author: [email protected] , Geli tarihi/Received: 07.07.2011, Kabul tarihi/Accepted: 08.02.2012 zet:Ormanekosistemlerindehedeftrlerinyetimeortamzelliklerinegremodellenmesiileilgiliparametrikolmayan yntemlerinkullanmgngetikeartmaktadr.Parametrikolmayanyntemlerdenbiridesnflandrmaveregresyonaac tekniidir(SRAT).Buyntemkullanlarakhemkategorik(snflandrmaaac)hemdesrekli(regresyonaac)baml deikenlermodellenebilmektedir.BundandolaySRAThayvanvebitkitrlerinindalmmodellemeleriiinidealbir yntemdir.Bu derlemede SRAT hakknda bilgi vermek amalanmtr.Anahtar kelimeler: Parametrik olmayan yntemler, Tr dalm, Tr eitlilii, Corafi modelleme, Potansiyel dalm Modelling ecological data using classification and regression tree technique (CART) Abstract:Nonparametric methodshave been increasinglyused in orderto model thedistribution of target species in the forest ecosystems by means of environmental factors in recent years. One of the nonparametric methods is classification and regression tree tecnique (CART). By using CART, both categorical and continuous dependent variables can be modeled. That is why CART is a suitable tecnique for the distribution, productivity and diversity models of animal and plant species. This review was written to give information about CART. Keywords: Nonparametric methods, Species distribution model, Species diversity, Spatial modeling, Potantial distribution 1. Giri Ormanekosistemlerindemodellemealmalargenelde hedeftrlerinyetimeortamnauygunluuna,verimliliine vetreitliliineodaklanmtr.Bumodelleme almalarndaeitlianalitikyntemlerebavurulmaktadr. Gelenekselveyadorusalyntemlerolaraktrdalmnda lojistikregresyonanaliziveverimlilik/treitlilii dalmndaokluregresyonanaliziilgigruplartarafndan enfazlabilinenlerdir.Buyntemleruzunyllarboyunca ekolojialanndaalanaratrmaclartarafndan kullanlmtr.Bununlabirliktezelliklesonyllarda parametrikvedorusalolmayan,hiyerarikve/veyakural tabanlyntemlerinkullanmndahzlbirartvardr. Ekolojikverideerlendirmevemodellemealmalarnda gelenekselolmayanyntemlerinseimindeverininyaps bykroloynamaktadr.Ekolojikverigeneldekarktr, dengesizdir,eksiktir,aykrve/veyauzakgzlem ierebilmektedir.Ekolojikilikilerbirokyerdedorusal deildirvemuhatapdeikenlerinbirounormaldalm gstermeyebilir.Dahasdorusalmodellerkullanldnda, bamszdeikenlerstndenbirbamldeikenin varyasyonuyksekderecedeaklansadahi,zellikle ekolojikaratrmalardasklklakarlalanbamsz deienlerarasndakiyksekkorelasyondandoanoklu balant problemi modelleri geersiz klmaktadr.Ekolojikaratrmalardagelenekselolmayanyntemlere olantalepartnnbirdiernemlisebebi,buyntemlere ynelikbirokyazlmnyaplmvekullanmasunulmu olmasdr.BubalamdaS-PLUSveDTREGpaket programlar en fazla tercih edilenlerdir. Gelenekselolmayanyntemlerdenenfazlatercih edilenlerindenbirisnflandrmaveregresyonaacteknii (SRAT)olarakisimlendirilmektedir.BuderlemeSRAT hakknda bilgi vermek amacyla yazlmtr. 2. Snflandrma ve regresyon aac teknii SRATparametrikolmayankuraltabanlbirtekniktir. SRATntemelamacbamldeikenegreanaveri matrisini(bamszdeikenlermatrisi)homojenalt gruplaraayrmaktr.Altgruplarnoluturulmasndaveri dallananbiraaeklindehiyerarikbirdzendesunulur. Aaekiliindekiaradmlerdeeniyiayrmyapm olanbamldeikenlergsterilir.Budmlerin dallarndaayrcbamldeikenlerinkritikdeeriverilir. Yapraklarbamldeikenindeerlerinigsterir.Kk dm(ilkdmnoktas)noktasndanitibarenyapraklara kadar(ensondm)hatlarbulunmaktadr.Buhatlar boyuncasnflararasayrmnmaksimizeedildiiveher snfniindekivaryasyonunminimizeedildiiayrmlarn kurallargsterilmektedir.Buyaklamkullanlarakhem kategorikhemdesreklibamldeikenler modellenebilmektedir.Eerbamldeikenkategorikise yntemin ad snflandrma aac (SA), srekli ise regresyon aac(RT)isminialr(Chuvd.,2009;McKennyvePedlar, 2003;NavarrateveEspinosa,2011;Breimanvd.,1984; zkan ve Mert 2010; Death ve Fabricius 2000).SD Orman Fakltesi Dergisi / SDU Faculty of Forestry Journal2012, 13: 1-42 2.1. Snflandrma aac Bitkivehayvanekolojisindehedeftrlerindalm modellenmesi en nemli konulardan biridir ve snflandrma aacgeneldetrlerindalmmodellemesiiin kullanlmaktadrBusebeptenbamldeikenvar-yok eklindeikikategoriyiiermektedir(Breimanvd.,1984; Death ve Fabricius, 2000). Snflandrma aac ynteminde ikili baml deikenin saflnakararverilirkenGinikatklklmn kullanmaktadr.Birtdmiin,Ginikatklkindeksi(g(t)) aadaki formlle belirlenmektedir. ==i jt i p t j p t g ) | ( ) | ( ) ( (1) Burada i ve j hedef (baml) deikenin kategorileridir. Trlerindalmnaynelikmodellemelerdebaml deikenlerinikili(var-yok)kategorilerindenolutuundan dolay indeks iin eitlik aadaki gibidir. ) | 2 ( ) | 1 ( 2 ) ( t p t p t g = (2) Dmdekibtnyenilenmikodlarsadecebir kategoriyeaitolduunda-kibudurumdadmsaftr-indeksdeerisfraeittir.Birdmneniyikestirimini yapacakbamszdeikenibulmakiinbamszdeiken setindeki her deiken deerlendirilir ve en iyi deere sahip olan-kiokatkldeerindekienyksekazalmay gstermektedir- deiken seilir. Herhangi bir t dm iin dmnbiradayayrcsolanshemsatarafayrmn (tR) hem de sol taraf ayrmn (tL) gerekletirir. Deer aadaki forml ile belirlenir. ) ( ) ( ) ( ) , (R R L Lt g p t g p t g t s = | (3) BuradaPR sataraftakibamltdmndeki durumlarnorannverirkenPL soltaraftakitdmndeki durumlarnorannvermektedir.Herbirdmdeikilisin biradaySsetibelirlenebilmektedirvekkdmolant1 denbalayarakayrcs*btnmuhtemelSlerarasnda daha byk bir katklk azalama deeri ile aranmaktadr. ) , ( max ) , (1 1t s t sS se-= | | (4) deal bir ayrc s veri setini g(tL)=g(tR =0 olacak ekilde ikialtgrubaayrmaktadr.Tekrarlamalblmealgoritmasi, homojenliksalananavebazentekbirdurumbirsnfta kalana kadar devam etmektedir. Btn nihayi dmlerin en ideal safla gelmesi ile maksimum aa elde edilmi olur. 2.2. Regresyon aac Regresyonaalarndasnflaryoktur.Busebepten regresyonaactekniindesnflandrmaayrmkurallar Giniindeksikullanlarakuygulanamaz.Regresyon aacndakiayrmlarikisonulanandmiintahmin edilentoplamvaryansnminimizeolmasnngereklilii anlamna gelen artklarn karelerini azaltma algoritmasna gregerekletirilir(Breimanvd.,1984;Deathand Fabricius, 2000). Regresyonaacyntemindeherdmde minimizasyon (azaltma) problemi aada gibi zlr. min arg,..., 1 , M j x xjRj= s
| | ) ( ) (r r l lY Var P Y Var P + (5) BuradaPlvePr srasilesolvesadmlerin olaslklardr.Meitimsetindekideikenlerinsaylardr. Deikenjxj olarak gsterilmektedir. Rjxise deiken xj
nineniyiayrmdeerinigstermektedir.Var(Yl),Var(Yr) karlklsavesolaltdmleriinsorumluvektrlerdir. M j x xRj j...., 1 , = s optimalayrmsorgulamas anlamna gelmektedir.ArtklarnkareleriniazaltmaalgoritmasGiniayrm kurallarnabenzemektedir.Eersnfknnnesnelerideer 1 , dier snflarn nesnelerideer 0 atamas yaplr ise, o zaman bu deerlerin rnek varyans p(k|t)[1- p(k|t)]e eit olur. Katklk lm i(t) aadaki yolla bulunur. = =Kkt k p t i12) | ( 1 ) ((6) Buradap(k|t)dmtiindesnfknnkoullarabal zelliklerini,Ksnfsaysn,ksnfindeksinivetdm indeksini gstermektedir. 2.3. Optimal aa Herhangibirsnrlandrmayapmadan,snflandrmave SRATileeldeedilenilkaamodelemaximumaaismi verilir. Veri setindeki aykr veya uzak gzlemlerdendolay maksimumaagenellikleareitilmitir.Busorunu ortadakaldrmakiinbudamayaplmasveoptimalaacn eldeedilmesigerekir.Uygunaaboyutunubulmakiin yaklamlardanbiriverisetininbirksmnntestiindier ksmnneitimiinayrlmaseklindedir.Eitimleelde edilenaamodelstndentestsetindehembtnaa hem de alt aalar iin hata deerleri hesaplanr ve en kk hatadeerinesahipaltaaoptimalaaolarakbelirlenir. Ancakbuyollagenellikleidealaacneldeedilmesipek mmknolmamaktadr.Dahasbuyaklamnkullanlmas iingenibirverisetineihtiyavardr.Bununyerine aratrmaclarndahafazlatercihettikleriaprazgeerlilik (cross-validation)testiuygulanabilir.aprazgeerlilik testinde (1) veri eit orana (genellikle on eit paraya) ayrlr veherdefasndabiraltgrup(verinin%10u)testiin kullanlmak zere veriden kartlr ve dier kalan veriler ile model ina edilir. (2) Bu ilem verinin ayrld para says kadar(10defa)gerekletirilirvebylecebtnveri kullanlmolur.(3)Herdefasndainaedilenmodeller ilgilitestgruplarilekontroledilir.Dahasonrabtnalt gruplarbirletirilir,2.ve3.admlaraacnherboyutuiin gerekletirilir.Modellerindeerlendirmesiileendk hatadeerinesahipaaoptimalaaolarakkabuledilir (Breimanvd.,1984;DeathveFabricius,2000;Moisen, 2008). SD Orman Fakltesi Dergisi / SDU Faculty of Forestry Journal2012, 13: 1-43 2.4. Modellerin deerlendirilmesi Modeldeerlendirmelerindehatadeerlerinin hesaplanmasndageneldesnflandrmaaaciin snflandrmahataorankullanlr.Bunundndakappa katsays,khikare,oddsoranveduyarllktestleri snflandrmaaacmodellerindeerlendirilmesiiin kullanlabilir(Manelvd.,2001;Liuvd.,2005;zkanve Mert2010).Regresyonaacmodellerininhata deerlendirmelerindeortalamakarakkhatasveya artklarnortalamasapmaskullanlmaktadr.Bunun yanndaregresyonkatsays,etkinlikkatsays,Akaike kriteriveBayesiankriteriregresyonaacmodellerinin deerlendirmeleriiinkullanlabilecekdieryaklamlardr (Aertsen vd., 2010). 3. Kurallarn yazlmas ve corafi modelleme Optimalaacakararverildiktensonra,analizbitmitir vebuaamodelartkkullanlmayahazrdr.Aa modellerihtiyaduyuldukabellialanlardahedef deikeninkestirimiyapmakiinkullanlabilir.Dier yandanaamodellerhedefdeikenlerincorafi modellemeleriiindekullanlabilir.Ancakcorafi modellemeiinsnflandrmaveregresyonaalarnn oluumunusalayanbamldeikenlerininherbirineait dijitalaltlkharitalarnnmevcutolmasgerekir.Snflandrma ve regresyon aalarnn corafi modellemesi iinmodeldekihernihaidmdeerikestirimdeeri olarakkullanlrveherhcreyebukesittimdeerleriilgili bamszdeikenlerinkritikdeerleriesasalnarakatanr. Bylecehedefdeikenlerincorafimodellemesi gerekletirilmi olur (zkan ve Mert, 2010).Snflandrmaveregresyonaacncorafi modellemesinde her bir nihai dm iin (Bn) ilgili bamsz deikenveyadeikenlerinsrekli(forml8)veya kategorik(forml9)olmadurumunagreaadaki(eer-ise kurallar) formller kullanlr. =EER(VE((XL1ij # Nd1 ; XL2ijXLnij # Ndn); (Bn)(8) =EER(VE(VEYA(XLC1ij=c1;XLC1ij=c2;XLC1ij=cn); (Bn)(9) BuradaXL1ij..XLnijaazerindebellibirhattailk seviyeden(L1)(tepedm)sonseviyeye(nihaidm) (Ln)kadari.stunvej.satriinayrcdeikenlerive onlarnkritikdeerlerinigstermektedir.Ndayrc deikenlerinilgilihatboyuncaherbirseviyedekikritik deerlerinigstermektedir.XLC1ij kategorikayrc deikenlerigstermektedirvecnbellibirkategorik deikenin eer-ise kurallarndan elde edilen kategorileridir. 4. Uygulama rnei Snflandrmaveregresyonaactekniininuygulama ktlarnarnekgstermekamacylaekil1de Yukargkdereyresindedikdrtgeneklindekesinlenbelli bir alanda henz daha yazm aamasnda olan iki almann (Toros sedirinin (Cedrus libani A. Rich) ve tr eitliliinin (H))aavecorafidalmmodelleriverilmitir.ekil1 dekiaamodellerebaklacakolursasnflandrmaaac yntemininuygulandTorossedirinindalmndabata ykselti(ELVN)olmakzerescaklkindisi(HI),yllk toplamya(BIO12),eim(SLOP),araziekli(LFC)ve yamakonumuindisi(TPI)roloynamaktadr.Regresyon aacnnuygulandtreitliliidalmndadaykselti (ELVN)ennemliyetimeortamfaktrdr.Bunun dnda,mevsimselscaklksapmas(BIO4),radyasyon indeksi(RI),eim(SLOP),araziekli(LFC),yllktoplam ya(BIO12),enscakaylkdneminya(BIO18), enscakaylkdneminortalamascakl(BIO10)ve anakaya (ROCK) tr eitlilii aac modelinin olumasnda katkda bulunan dier deikenlerdir. ekil1:Yukargkdere(Isparta)YresindebirkesitalandaTorossedirinindalmnnsnflandrmaaacyntemi(sada)vetreitlilii(H) dalmnn regresyon aac yntemi (solda) ile elde edilen aa ve corafi dalm modelleri SD Orman Fakltesi Dergisi / SDU Faculty of Forestry Journal2012, 13: 1-44 5. neriler Ekosistemlerinplanlamasilefaydalanmave srdrlebilirlikarasndakidengeiinentemelveenfazla istenenekolojikbilgihedeftrlerinveyatrgruplarnn potansiyeldeermodellerive/veyaharitalardr.Ekolojik anlamdabirpotansiyeldeermodelive/veyaharitasnn retilmesi,bilimselolarakgerekverilerstnden ilikilendirmeilegerekletirilebilmektedir.Busayede potansiyel deer tabanl modeller elde edilebilir.Ekolojikilikilerinkarmakldorusalmodellerin zaaflarnortayakarmaktadr.zellikleormanlardalk yerlerde bulunan lkemizde, geleneksel analitikyaklamlar ile ekolojik ilikilerin yeterince aklanamad bir gerektir.SRATgelenekselyntemlerealternatifolabilecek hiyerarik,kuraltabanl,nonparametrikbiryntemdir. SRATilehemkategorikhemdesreklideikenler modellenebilmektedir.SRATiledorusalolmayan ilikilerinalglamasvemodellenmesimmknolmaktadr. SRATkullanlabileceknonparametrikyntemlerdensadece biridir.Bunundndagenelletirilmidorusalmodelinbir uzantsolangenelletirilmieklemelimodel,yapaysinir alar veya bulank mantk uygulamalarna da bavurulabilir (zkan, 2010). Ormanekolojialanndamodeltabanlalmalarnbir diernemi,retilenmodelleriniklimdeiim senaryolarnndijitalverilerineuyarlanabilmesidir.Model tabanlharitalarnpotansiyeldeergstermesihedef blgelerdezellikleaalandrma,restorasyonvekoruma almalarndagnmzvegeleceeynelikdoru kararlarn verilebilmesi iin byk nem tamaktadr. Kaynaklar Aertsen,W.,Kint,V.,Orshoven,J.,zkan,K.,Muys,B.,2010. Comparisonandrankingofdifferentmodellingtechniquesfor predictionofsiteindexinMediterraneanmountainforests, Ecological modelling 221, 1119-1130.Breiman,L.,Friedman,J.H.,Olshen,R.,Stone,A.C.G.,1984. Classificationandregressiontrees.WadsworthInternational Group, Belmont, California, USA. Chu, C.M, Tsai, B.W., Chang, K.T., 2009. Integrating decision tree and spatial cluster analysis for landslide susceptibility zonation. WorldAcademyofScience,EngineeringandTechnology 59:470-483. Death,G.,FabriciusK.E.,2000.Classificationandregression trees:Apowerfulyetsimpletechniqueforecologicaldata analysis. Ecology, 81(11): 3178-3192 . Liu, C., Berry, P.M., Dawson, T.P., Pearson, R.G., 2005. Selecting thresholdsofoccuranceinthepredictionofspecies distribution, Ecography 28, 385-393. Manel,S.,Williams,H.C.,Ormerod,S.J.,2001.Evaluating presence-absencemodelsinecology:theneedtoaccountfor prevalence, Journal of Applied Ecology, 38, 921-931.Mckenney,D.W.,Pedlar,J.H.,2003.Spatialmodelsofsiteindex based on climate and soil properties for two boreal tree species in Ontario, Canada. Forest Ecology and Management, 175:497-507. Moisen,G.G.,2008.ClassificationandRegressionTree.In: Jorgensen SE (ed) In Encyclopedia of Ecology, pp.582-588. NavarrateE.,EspinosaM.,2011.Usingthenon-parametric classifiesCARTtomodelwooddensity.JournalofData Science 9:261-270.zkan,K.,2010.Ormanekosistemeitliliiharitalama almalar iin ekolojik alan eitliliinin belirlenmesi zerine bir neri. SD Orman Fakltesi Dergisi 2:136-148 zkan,K.,Mert,A.,2010.IspartaYukarGkdereYresinde Kasnak Meesinin Senaryolarna gre 2050ve 2080 yllarnda muhtemelpotansiyelyaylalanlarnncorafimodellemesi, llemeileMcadeleSempozyumu17-18Haziran,2010, Anitta Otel, orum.