18
VERİ MADENCİLİĞİNİN GÖREVLERİ

DM_2

  • Upload
    noipana

  • View
    225

  • Download
    0

Embed Size (px)

DESCRIPTION

rteruyteryurt

Citation preview

VER MADENCLNNGREVLERVER MADENCLNNGREVLER Classification (Snflandrma) Karakterizasyon (Betimleme) Regression (liki karm) Clustering (Kmeleme)Association (liki Analizi)Association (liki Analizi) Forecasting (Tahmin Yapma)CLASSIFICATION (SNFLANDRMA)En popler veri madencilii eitlerinden birisidir.Temel olarak yapt ey yeni bir nesnenin niteliklerini inceleme ve bu nesneyi nceden tanmlanm bir snfa atamaktadr. Burada nemli olan ,bir snfn zelliklerinin nceden net bir ekilde belirtilmi olmas gerektiidir.net bir ekilde belirtilmi olmas gerektiidir. Bir maln zellikleriyle mteri zelliklerini eletirebiliriz.Bylece bir mteri iin ideal rn veya bir rn iin ideal mteri profili karlabilir.CLASSIFICATION (SNFLANDRMA) Veri ierisindeki ayrmalarn ve deiim noktalarnn nceden bilindii durumlarda, I.Yeni bir verinin yer alaca grubun (snfn) belirlenmesi,II.nceden gruplanm (snflandrlm) verilerinII.nceden gruplanm (snflandrlm) verilerin doru snflandrlp snflandrlmadnn tespiti ve yanl snflandrma varsa gzlemin (nesnenin) doru gruba atanmas iin kullanlr.RNEKKARAKTERIZASYONVeriyi tanmak, anlamak, doru yntem uygulamak, doru sonular elde etmekdoru sonular elde etmek iin kullanlr.RNEKREGRESSION Classificationa benzer. Temel fark, tahmin edilecek olan attributeuncontinious number (paralanabilir birimler -1.5, 23.8 gibi-) olmasdr. Regresyon teknii yzyllardr istatistik ana Regresyon teknii yzyllardr istatistik ana bilim dalnn bir kolu olarak retilmektedir. Lineer ve lojistik regresyon, en popler regresyon metotlarndandr.RNEKCLUSTERING (KMELEME)Veri ierisindeki ayrmalarn ve deiim noktalarnn nceden bilinmedii durumlarda, bir benzerlik veya benzemezlik ltne gre verileri (nesneleri) gruplamay salar.CLUSTERING (KMELEME) Cluster 1, dk gelir grubuna sahip gen poplasyon Cluster 2, daha yksek gelirli ve orta-yal poplasyon Cluster 3 ise daha dk gelirli ve yal Cluster 3 ise daha dk gelirli ve yal poplasyonu temsil ediyor.RNEKASSOCIATION (LIKI ANALIZI) liki analizi, veri iinde gl bir ekilde ilikilenmi zelliklerin kefini amalar. Genelde bu ilikiler kurallar eklinde ifade bulur. Verinin zellikleri arasndaki olas ilikilerin, zellik saysna bal olarak stel bir ekildezellik saysna bal olarak stel bir ekilde artmas nedeniyle, iliki analizi bir yandan zayf ilikileri gzard ederken, gl ilikileri saptamaya alr. Birliktelik analizinin kullanld alanlardan bir ka; gen gruplarnn saptanmas, web sitesi zerinde birlikte gezilen sayfalarn saptanmas ve marketten birlikte satn alnan rnlerin belirlenmesi saylabilir.ASSOCIATION (LIKI ANALIZI) Marketten birlikte alnma ihtimali yksek rnleri saptanmasna Market Sepeti Analizi (Market Basket Analysis) ismi verilmitir. Market sepet analizi, mterilerin birlikte satn alma ihtimali yksek rnlerin saptanarak, raf yerleim ve fiyatlamay ona gre dzenlemeyi ve ciroyu artrmaygre dzenlemeyi ve ciroyu artrmay amalamaktadr. Market sepet analizi sonucunda krem peynir alanlarn %80inin ekmek ald bulunmu ise bu iki rn grubunu raflar birbirinden uzak raflara koyarak mterinin markette daha uzun sre dolamas salanabilecei gibi krem peynire yaplacak ufak bir indirime karlk ekmekte yaplacak daha byk bir fiyat art oluan kar artracaktr.ASSOCIATION (LIKI ANALIZI)RNEKFORECASTING Genellikle girdi olarak bir zaman serisi veri kmesi alr; rnein zaman temsil eden bir attribute ile bir dizi say. Zaman serileri verileri genellikle sra baml bir ekilde birbirine yakn deerlere sahip olurlar.ekilde birbirine yakn deerlere sahip olurlar. Forecasting teknikleri, genel trendler ve periyodiklik ile urar. En popler zaman serileri teknii ARIMAdr. (AutoRegressive Integrated Moving Average)RNEK