Carlos Alberto Alves Varella Doutor em Engenharia Agrícola Universidade Federal Rural do Rio de...
29
Análise de Componentes Principais Carlos Alberto Alves Varella Doutor em Engenharia Agrícola Universidade Federal Rural do Rio de Janeiro Pós-Graduação em Agronomia Ciência do Solo: CPGA- CS Novembro 2011
Carlos Alberto Alves Varella Doutor em Engenharia Agrícola Universidade Federal Rural do Rio de Janeiro Pós-Graduação em Agronomia Ciência do Solo: CPGA-CS
Carlos Alberto Alves Varella Doutor em Engenharia Agrcola
Universidade Federal Rural do Rio de Janeiro Ps-Graduao em
Agronomia Cincia do Solo: CPGA-CS Novembro 2011
Slide 2
Introduo a tcnica mais conhecida da estatstica multivariada;
Pode ser utilizada para gerao de ndices e agrupamento de indivduos;
Cada componente principal uma combinao linear de todas as variveis
originais; So independentes entre si; importante ter uma viso
conjunta de todas ou quase todas as tcnicas da estatstica
multivariada para resolver a maioria dos problema prticos.
Slide 3
Construo da matriz de dados (Matriz X) Matriz de dados para p
variveis e n indivduos; Caractersticas observadas so : X 1, X 2, X
3,..., X p ; A matriz de ordem n x p.
Slide 4
Matriz de Covarincia, S Obtida a partir da matriz X de dados de
ordem n x p; uma estimativa da matriz de covarincia da populao ; A
matriz S simtrica e de ordem p x p.
Slide 5
Padronizao dos dados Mdia zero e varincia 1 Mdia qualquer e
varincia 1
Slide 6
Variveis Padronizadas A matriz Z igual a matriz de correlao R
da matriz de dados X;
Slide 7
Consideraes sobre a padronizao Normalmente partimos da matriz
padronizada; O resultado a partir da matriz S pode ser diferente do
resultado a partir da matriz R. A padronizao s dever ser feita
quando as unidades das variveis observadas no so as mesmas.
Slide 8
Determinao dos Componentes Principais Os componentes principais
so determinados resolvendo-se a equao caracterstica da matriz S ou
R, isto :
Slide 9
Autovalores da matriz R 1, 2, 3,..., p so as razes da equao
caracterstica da matriz R ou S, ento: 1, 2, 3,..., p podem se
autovalores da matriz R ou S;
Slide 10
Autovetores Para cada autovalor i existe um autovetor: ip 2i 1i
i a a a a ~
Slide 11
Componente principal Y i Sendo o autovalor = i, ento o i-simo
componente principal dado por: pip22i11ii XaXaXaY
Slide 12
Propriedades dos Componentes Principais A varincia do
componente principal Y i igual ao valor do autovalor i : O primeiro
componente o que apresenta maior varincia e assim por diante: ii
YarV )Y(arV )Y( V )Y( V p21
Slide 13
Propriedades dos Componentes Principais Total de varincia das
variveis originais = somatrio dos autovalores = total de varincia
dos componentes principais: )Y(arV )X( V iii Os componentes
principais no so correlacionados entre si: 0Y,YovC ji
Slide 14
Importncia de cada componente principal Medida pela porcentagem
de varincia de cada componente em relao ao total 100 Strao 100 YarV
Y V C i p 1i i i p 1i i i i
Slide 15
Nmero de componentes No existe um modelo estatstico; O nmero de
ser aquele que acumula 70% ou mais de proporo da varincia total.
pkonde%70100 YarV Y V Y V k 1i i k1
Slide 16
Interpretao dos componentes Verifica-se o Grau de influncia que
cada varivel Xj tem sobre o componente Yi. j j1 1 j 1 j11YXj1,j
XarV a X V Y V arYXCorr
Slide 17
Interpretao dos componentes Verifica-se o peso ou loading de
cada varivel sobre o componente p p1 p 2 12 2 1 11 1 XarV a w, X V
a w, X V a w
Slide 18
Escores dos componentes Organizao dos dados Trat (Indiv)
Variveis Escores dos componentes principais X1X1 X2X2...XpXp Y1Y1
Y2Y2 YkYk 1X 11 X 12...X 1p Y 11 Y 12...Y 1k 2X 21 X 22...X 2p Y 21
Y 22...Y 2k nX n1 X n2 X np Y n1 Y n2...Y nk
Slide 19
Escores do primeiro componente para n tratamentos e p variveis
O escore o valor da cominao linear; Y n1 =componente 1 do
tratamento n para p variveis.
Slide 20
Exemplo de Aplicao Variveis originais observadas (X1 e X2) e
padronizados (Z1 e Z2). Duas variveis para cinco tratamentos (k=5).
Tratamentos Variveis originaisVariveis padronizadas X1X1 X2X2 Z1Z1
Z2Z2 110296 24,38276,9554 210487 24,86086,3033 310162 24,14364,4920
49368 22,23134,9268 510077 23,90465,5788 Varincia17,50190,50
11
Slide 21
Padronizao da Varincia Os dados sero padronizados para varincia
1:
Slide 22
Matriz de Correlao Elementos da diagonal principal igual a 1.
Significa a correlao entre mesmas variveis; Elementos fora da
diagonal principal igual a 0,5456. Significa a correlao entre as
variveis (X1,X2).
Slide 23
Autovalores da matriz de correlao So os elementos fora da
diagonal principal da matriz. Significa a varincia de cada
componente principal. 1 = 1,5456 e 2 = 0,4544
Slide 24
Trao da matriz de correlao Somatrio dos elementos da diagonal
da matriz. Significa o total de varincia. Trao(R) = 1+1=2
Slide 25
Primeiro autovetor da matriz de correlao So os coeficientes das
variveis padronizadas Z1, Z2. Y1 a combinao linear de Z1, Z2 que
denominamos de primeiro componente principal
Slide 26
Resultados da anlise Varincia, ponderao, correlao, % de
varincia e % de varincia acumulada dos componentes principais.
CPVarincia () PonderaoCorrelao entre Zj eYi % de varincia % de
varincia acumulada dos Y i Z1Z1 Z2Z2 Z1Z1 Z2Z2 Y11,54560,707 0,879
77,28 Y20,4544-0,7070,707-0,4760,47622,72100,00
Slide 27
Escores dos componentes principais Tratamentos Componentes
principais Y1Y1 Y2Y2 122,16-12,32 222,04-13,12 320,25-13,90
419,20-12,24 520,85-12,96
Slide 28
Grfico de disperso Permite visualizar se os componentes
principais (Y is ) so capazes de discriminar indivduos da populao (
) utilizando caractersticas (X i ). 19 20 21 22 23
-14-13.5-13-12.5-12 Segundo componente (Y2) Primeiro componente
(Y1)
Slide 29
Aula prtica com o programa computacional SAS Material didtico:
http://www.ufrrj.br/institutos/it/deng/varella/multivariada.htm
http://www.ufrrj.br/institutos/it/deng/varella/multivariada.htm
Disciplina: Anlise Multivariada Aplicada as Cincias Agrrias.Aula
prtica: 14-17 com SAS.