Estatística Multivariada.pdf

Embed Size (px)

Citation preview

  • MINISTRIO DA EDUCAO E DO DESPORTO UNIVERSIDADE FEDERAL DE LAVRAS DEPARTAMENTO DE CINCIAS EXATAS

    ANLISE MULTIVARIADA

    Daniel Furtado Ferreira

    LAVRAS, MG

    1996

  • ii

    SUMRIO Pg.

    1. Aspectos da anlise multivariada 1

    1.1. Introduo 1

    1.2. Aplicao das tcnicas multivariadas 3

    1.3. Organizao de dados 5

    1.4. Distncias 15

    1.5. Exerccios 24

    2. lgebra vetorial e matricial 25

    2.1. Introduo 25

    2.2. Elementos de lgebra vetorial 26

    2.3. Elementos de lgebra matricial 34

    2.4. Exerccios 82

    3. Amostragem multivariada 89

    3.1. Introduo 89

    3.2. Geometria amostral 90

    3.3. Amostras aleatrias e esperanas do vetor de mdia e da matriz de covarincia amostral. 101

    3.4. Varincia generalizada 104

    3.5. Varincia generalizada de variveis generalizadas 113

    3.6. Outra generalizao da varincia 116

    3.7. Exerccios 117

  • iii

    4. Distribuio normal multivariada 119

    4.1. Introduo 119

    4.2. Pressuposies das anlises multivariadas 120

    4.3. Densidade normal multivariada e suas propriedades 121

    4.4. Distribuio normal bivariada 125

    4.5. Distribuio amostral de X e S 133

    4.6. Distribuies amostral derivada da distribuio normal multivariada 138

    4.7. Verificando a normalidade 143

    4.8. Exerccios 169

    5. Inferncias sobre o vetor mdia 171

    5.1. Introduo 171

    5.2. Inferncias sobre mdia de uma populao normal 171

    5.3. Regio de confiana e comparaes simultneas de componentes de mdia 177

    5.4. Inferncias sobre propores de grandes amostras 190

    5.5. Comparaes pareadas 192

    5.6. Comparaes de vetores de mdias de duas populaes 199

    5.7. Exerccios 215

    6. Anlise de varincia multivariada 219

    6.1. Introduo 219

    6.2. Delineamento de classificao simples 220

  • iv

    6.3. Intervalos de confiana simultneos para o efeito de tratamentos 230

    6.4. Exerccios 232

    7. Componentes principais 233

    7.1. Introduo 233

    7.2. Componentes principais populacionais 234

    7.3. Componentes principais amostrais 250

    7.4. Grficos dos componentes principais 256

    7.5. Inferncias para grandes amostras 259

    7.6. Exerccios 282

    8. Anlise de agrupamento 285

    8.1. Introduo 285

    8.2. Medidas de parecena (similaridades e dissimilaridades) 286

    8.3. Agrupamentos 296

    8.4. Exerccios 308

    9. Anlise de fatores 309

    9.1. Introduo 309

    9.2. Modelo de fatores ortogonais 310

    9.3. Estimao de cargas fatoriais 316

    9.4. Rotao fatorial 342

    9.5. Teste da falta de ajuste do modelo fatorial 346

  • v

    9.6. Escores fatoriais 349

    9.7. Exerccios 354

    10. Anlise de correlao cannica 355

    10.1. Introduo 355

    10.2. Variveis cannicas e correlao cannica populacionais 356

    10.3. Variveis e correlaes cannicas amostrais 371

    10.4. Inferncias para grandes amostras 380

    10.5. Exerccios 386

    11. Referencias bibliogrficas 389

    Apndices 395

    ndice remissivo 397

  • ||[ ]||Aspectos da anlise multivariada

    1

    1.1. Introduo

    Nos trabalhos cientficos, o problema de se inferir, a partir de dados

    mensurados pelo pesquisador, sobre os processos ou fenmenos fsicos,

    biolgicos ou sociais, que no se pode diretamente observar, uma realidade

    constante. A pesquisa cientfica se constitui num processo interativo de

    aprendizado. Para explicao de um fenmeno, o pesquisador em geral coleta e

    analisa dados de acordo com uma hiptese. Por outro lado, a anlise destes

    mesmos dados coletados de amostragem ou experimentao geralmente sugere

    modificaes da explicao do fenmeno, alm disso, devido complexidade

    destes fenmenos, o pesquisador deve coletar observaes de diferentes

    variveis. Neste contexto, a inferncia estatstica realizada de acordo com o

    paradigma hipottico-dedutivo (Bock, 1975).

    Devido aos fenmenos serem estudados a partir de dados coletados

    ou mensurados em muitas variveis, os mtodos estatsticos delineados para

    obter informaes a partir destes conjuntos de informaes, so denominados de

    mtodos de anlises multivariados. A necessidade de compreenso das relaes

  • 1. Aspectos da anlise multivariada 2

    entre as diversas variveis faz com que as anlises multivariadas sejam

    complexas ou at mesmo difceis. O objetivo do presente material apresentar a

    utilidade das tcnicas multivariada de uma forma clara, usando exemplos

    ilustrativos e evitando o mximo de possvel de clculo.

    Sendo assim, os objetivos gerais, para os quais a anlise

    multivariada conduz so:

    a. reduo de dados ou simplificao estrutural: o fenmeno sob estudo

    representado da maneira mais simples possvel, sem sacrificar

    informaes valiosas e tornando as interpretaes mais simples;

    b. ordenao e agrupamento: agrupamento de objetos (tratamentos) ou

    variveis similares, baseados em dados amostrais ou experimentais;

    c. investigao da dependncia entre variveis: estudos das relaes

    estruturais entre variveis muitas vezes de interesse do pesquisador;

    d. predio: relaes entre variveis devem ser determinadas para o

    propsito de predio de uma ou mais varivel com base na observao

    de outras variveis;

    e. construo e teste de hipteses.

    Os modelos multivariados possuem em geral, um propsito atravs

    do qual o pesquisador pode testar ou inferir a respeito de uma hiptese sobre um

  • Ferreira, D.F. Estatstica multivariada 3

    determinado fenmeno. No entanto a sua utilizao adequada depende do bom

    conhecimento das tcnicas e das suas limitaes. A frase utilizada por Marriott

    (1974) descreve bem este fato: No h mgica com os mtodos numricos, e que

    apesar de serem uma importante ferramenta para anlise e interpretao de

    dados, no devem ser utilizados como mquinas automticas de encher lingia,

    transformando massas numricas em pacotes de fatos cientficos.

    1.2. Aplicao de tcnicas multivariadas

    As tcnicas estatsticas constituem se uma parte integral da pesquisa

    cientfica e em particular as tcnicas multivariadas tem sido regularmente aplicada

    em vrias investigaes cientficas nas reas de biologia, fsica, sociologia e

    cincias mdicas. Parece, neste instante, ser apropriado descrever as situaes

    em que as tcnicas multivariadas tm um grande valor.

    Medicina

    Nos estudos onde as reaes de pacientes a um determinado

    tratamento so mensuradas em algumas variveis e possuem difcil diagnstico,

    as tcnicas multivariadas podem ser usadas para construir uma medida de

    resposta simples ao tratamento, na qual preservada a maior parte da informao

    da amostra e das mltiplas variveis respostas. Em outras situaes as tcnicas

  • 1. Aspectos da anlise multivariada 4

    multivariadas podem ser usadas tambm quando a classificao de um paciente,

    baseada nos sintomas medidos em algumas variveis, difcil de ser realizada.

    Neste caso, uma tcnica multivariada de classificao, em que se cria uma funo

    que pode ser usada para separar as pessoas doentes das no doentes, pode ser

    implementada.

    Sociologia

    Em alguns estudos o inter-relacionamento e o agrupamento de

    indivduos, cidades ou estados em grupos homogneos em relao mobilidade,

    nmero de estrangeiros nascidos e de segunda gerao em determinado pas

    necessria em alguns estudos sociolgicos. As tcnicas de anlise multivariada,

    conhecidas como anlise de agrupamento (Cluster analysis), pode ser empregada

    com esta finalidade.

    Biologia

    No melhoramento de plantas necessrio, aps o final de uma

    gerao, selecionar aquelas plantas que sero os genitores da prxima gerao. a

    seleo deve ser realizada de maneira que a prxima gerao seja melhorada em

    relao resposta mdia de uma srie de caractersticas da gerao anterior. O

    objetivo do melhorista consiste em maximizar o ganho gentico em um espao

  • Ferreira, D.F. Estatstica multivariada 5

    mnimo de tempo. As anlises multivariadas podem ser usadas para converter

    uma srie de caractersticas para um ndice, na qual a seleo e escolha dos pais

    possam ser feitas.

    Em algumas situaes se deseja a separao de algumas espcies,

    e as tcnicas multivariadas tm sido utilizadas com esta finalidade. Uma funo

    construda e os seus valores so usados para esta separao.

    1.3. Organizao de dados

    Atravs deste material pretende-se tratar das anlises realizadas em

    muitas caractersticas ou variveis. Essas medidas, muitas vezes chamadas de

    dados, devem ser organizadas e apresentadas em vrias formas. Por exemplo, a

    utilizao de grficos e arranjos tabulares so importantes auxiliares nas anlises

    de dados. Por outro lado, nmeros que resumem, ou seja, que descrevem

    quantitativamente certas caractersticas, so essenciais para a interpretao de os

    dados amostrais ou experimentais.

    Arranjos

    Os dados multivariados so provenientes de uma pesquisa em

    determinada rea em que so selecionadas p 1 variveis ou caractersticas para

  • 1. Aspectos da anlise multivariada 6

    serem mensuradas. As medidas so tomadas em cada unidade da amostra ou do

    experimento. A representao destes dados feita com a notao xjk para indicar

    um valor particular da j-sima unidade amostral ou experimental e da k-sima

    varivel mensurada. Conseqente, estas medidas de p variveis em n unidades

    amostrais ou experimentais, podem ser representadas conforme o arranjo

    apresentado na Tabela 1.1.

    Tabela 1.1. Representao de dados atravs da notao xjk para indicar um valor

    particular da k-sima varivel mensurada na j-sima unidade amostral

    ou experimental.

    Variveis

    Unidades amostrais ou experimentais

    1 2 ... k ... p

    1 X11 X12... X1k... X1p

    2 X21 X22... X2k... X2p

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    . j Xj1 Xj2... Xjk... Xjp

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    . n Xn1 Xn2... Xnk... Xnp

  • Ferreira, D.F. Estatstica multivariada 7

    Estes valores, apresentados na Tabela 1.1, podem ser

    representados em um arranjo retangular, denominado de X, com n linhas e p

    colunas, da seguinte forma:

    11 12 1 1

    21 22 2 2

    1 2

    1 2

    k p

    k p

    j j jk jp

    n n nk np

    x x x xx x x x

    Xx x x x

    x x x x

    =

    " "" "

    # # # # # #" "

    # # # # % #" "

    Exemplo 1.1

    Uma seleo de 4 firmas de rao de Minas Gerais foi obtida para

    avaliar a venda de raes. Cada observao bivariada forneceu a quantidade de

    sacos de rao vendidos e a quantidade de reais de cada venda. Os dados

    obtidos na forma tabular so:

    Varivel 1 (Reais/venda) 80 120 90 110

    Varivel 2 (nmero de sacos de rao vendidos)

    10

    12

    6

    8

    Usando a notao proposta anteriormente, tem-se:

    X11=80 X21=120 X31=90 X41=110 X12=10 X22=12 X32=6 X42=8

    E a matriz X dos dados :

  • 1. Aspectos da anlise multivariada 8

    80 10120 12

    90 6110 8

    X

    =

    A organizao dos dados em arranjos facilita a exposio e permite

    que os clculos sejam efetuados de uma forma ordenada e eficiente. Os ganhos

    na eficincia so: (1) descrio dos clculos como operaes com matrizes e

    vetores; e (2) sua fcil implementao em computadores.

    ESTATSTICAS DESCRITIVAS

    Grandes conjuntos de dados possuem um srio obstculo para

    qualquer tentativa de extrao de informaes visuais pertinentes aos mesmos.

    muitas das informaes contidas nos dados podem ser obtidas por clculo de

    certos nmeros, conhecidos como estatsticas descritivas. Por exemplo, a mdia

    aritmtica ou mdia amostral, uma estatstica descritiva que fornece informao

    de posio, isto , representa um valor central para o conjunto de dados. Como

    um outro exemplo, a mdia das distncias ao quadrado de cada dado em relao

    mdia, fornece uma medida de disperso, ou variabilidade.

    s estatsticas descritivas que mensuram posio, variao e

    associao linear so enfatizadas. As descries formais destas medidas esto

    apresentadas a seguir.

    A mdia amostral, simbolizada por X , dada por:

  • Ferreira, D.F. Estatstica multivariada 9

    1

    1 nk jk

    jX X

    n == k=1, 2, ..., p (1.1)

    Uma medida de variao fornecida pela varincia amostral,

    definida para as n observaes de i-sima varivel por:

    ( )221

    11 =

    = = n

    k kk jk kj

    S S X Xn

    k = 1, 2, ..., p (1.2)

    A raiz quadrada da varincia amostral, kkS , conhecida como

    desvio padro amostral. Esta medida de variao est na mesma unidade de

    medida das observaes.

    Uma medida de associao entre as observaes de duas variveis,

    variveis k e k, dada pela covarincia amostral:

    ( )( )' ' '1

    11 =

    = n

    kk jk k jk kjX X X X

    nS k, k=1,2, ..., p (1.3)

    Se grandes valores de uma varivel so observados em conjunto

    com grandes valores da outra varivel, e os pequenos valores tambm ocorrem

    juntos, Skk ser positiva. Se grandes valores de uma varivel ocorrem com

    pequenos valores da outra, Skk ser negativa. Se no h associao entre os

  • 1. Aspectos da anlise multivariada 10

    valores das duas variveis, Skk ser aproximadamente zero. Quando k=k, a

    covarincia reduz-se a varincia amostral. Alm disso, Skk= Skk, para todo k e k.

    A ltima estatstica descritiva a ser considerada aqui o coeficiente

    de correlao amostral. Esta medida de associao linear entre duas variveis

    no depende da unidade de mensurao. O coeficiente de correlao amostral

    para k-sima e k-sima varivel, definido por:

    ( )( )( ) ( )

    ' '1'

    '2 2

    ' '' '

    1 1

    =

    = =

    = =

    n

    jk k jk kjkk

    kk n nkk k k

    jk k jk kj j

    X X X Xr

    X X X X

    SS S

    (1.4)

    Verifica-se que rkk=rkk para todo k e k. O coeficiente de correlao

    amostral a verso estandardizada da covarincia amostral, onde o produto das

    razes das varincias das amostras fornece a estandardizao.

    O coeficiente de correlao amostral pode ser considerado como

    uma covarincia amostral. Suponha que os valores Xjk e Xjk sejam substitudos

    pelos valores padronizados, ( )jk kkk

    X XS e ' ' ' '

    ( )jk kk k

    X XS . Esses valores padronizados

    so expressos sem escalas de medidas (adimensionais), pois so centrados em

    zero e expressos em unidades de desvio padro. O coeficiente de correlao

    amostral justamente a covarincia amostral das observaes estandardizadas.

    A correlao amostral (r), em resumo, tem as seguintes

    propriedades:

  • Ferreira, D.F. Estatstica multivariada 11

    1. Os valores de r devem ficar compreendidos entre -1 e 1;

    2. Se r = 0, implica em inexistncia de associao linear entre as variveis. Por

    outro lado, o sinal de r, indica a direo da associao: se r < 0 h uma

    tendncia de um dos valores do par ser maior que sua mdia, quando o outro

    for menor do que a sua mdia, e r > 0 indica que quando um valor do par for

    grande o outro tambm o ser, alm de ambos valores tender a serem

    pequenos juntos;

    3. Os valores de rkk no se alteram com a alterao da escala de uma das

    variveis.

    As estatsticas Skk e rkk, em geral, no necessariamente refletem

    todo o conhecimento de associao entre duas variveis. Associaes no

    lineares existem, as quais, no podem ser reveladas por estas estatsticas

    descritivas. Por outro lado, estas estatsticas so muito sensveis a observaes

    discrepantes (outliers).

    Alm destas, outras estatsticas como a soma de quadrados de

    desvios em relao mdia (Wkk) e a soma de produtos de desvios (Wkk), so

    muitas vezes de interesse. Essas esto apresentadas a seguir:

  • 1. Aspectos da anlise multivariada 12

    2

    1( )

    == nkk jk k

    jX XW

    ' ' '1( )( )

    == nkk jk k jk k

    jW X X X X

    As estatsticas descritivas multivariadas calculadas de n observaes

    em p variveis podem ser organizadas em arranjos.

    Mdias da amostra

    1

    2

    = #p

    XX

    X

    X

    Matriz de covarincia amostral

    S

    S S S

    S S S

    S S S

    p

    p

    p p pp

    =

    11 12 1

    21 22 2

    1 2

    ""

    # # % #"

  • Ferreira, D.F. Estatstica multivariada 13

    Matriz de correlaes amostral

    R

    r r

    r r

    r r

    p

    p

    p p

    =

    1

    1

    1

    12 1

    21 2

    1 2

    ""

    # # % #"

    Exemplo 1.2

    Considerando os dados introduzidos no exemplo 1.1, encontrar as o

    vetor de mdias X e as matrizes S e R. Neste exemplo, cada firma de rao,

    representa uma das observaes multivariadas, com p = 2 variveis (valor da

    venda em reais e nmero de sacos de raes vendidas).

    As mdias amostral so:

    4

    1 j1j 1

    1 1X X (80 120 90 110) 1004 4=

    = = + + + =

    4

    2 j2j 1

    1 1X X (10 12 6 8) 94 4=

    = = + + + =

    1

    2

    1009

    = = X

    XX

    A matriz de covarincia amostral :

  • 1. Aspectos da anlise multivariada 14

    S11=[(80-100)2+(120-100)2+(90-100)2+(110-100)2]/3 = 333,333

    S22=[(10-9)2+(12-9)2+(6-9)2+(8-9)2]/3 = 6,667

    S12=[(80-100)(10-9)+(120-100)(12-9)+(90-100) (6-9)+(110-100)(8-9)]/3 = 20,000

    S21=S12=20,000, e

    S =

    333 333 20 00020 000 6 667

    , ,, ,

    A correlao amostral :

    r1220

    33 333 6 6670 424= =

    , ,, 3

    r21=r12=0,4243

    Portanto,

    1,0000 0, 4243R

    0, 4243 1,0000 =

  • Ferreira, D.F. Estatstica multivariada 15

    1.4. Distncias

    A maioria das tcnicas multivariadas baseada no simples conceito

    de distncia, por mais formidvel que isso possa parecer. O conceito de distncia

    euclidiana deve ser familiar para a maioria dos estudantes. Se for considerado um

    ponto P=(x1, x2) no plano cartesiano, a distncia deste ponto P da origem O=(0, 0),

    definida por d(O,P), dada pelo teorema de Pitgoras por:

    d O P x x( , ) = +12 22 (1.5)

    Esta situao ilustrada na Figura 1.1. Em geral, se o ponto P tem p

    coordenadas, de tal forma que P=(x1, x2, ... xp), a distncia de P da origem

    O=(0, 0, ..., 0), pode ser generalizada por:

    d O P x x x p( , ) ...= + + +12 22 2 (1.6)

  • 1. Aspectos da anlise multivariada 16

    X1

    X2

    P

    d(O, P)

    Figura 1.1. Distncia entre um ponto P=(x1, x2) e a origem O=(0, 0), fornecida pelo teorema de Pitgoras.

    Todos os pontos (x1, x2, .., xp) que contm uma distncia ao

    quadrado, denominada c2, da origem, satisfaz a equao:

    d O P x x x cp2

    12

    22 2 2( , ) ...= + + + = (1.7)

    A expresso em (1.7) representa a equao de uma hiperesfera (um

    crculo se p = 2), e os pontos eqidistantes da origem por uma distncia d(O, P)

    pertencem a essa hiperesfera. A distncia de um ponto P a um ponto arbitrrio Q,

    com coordenadas P=(x1, x2, ... xp) e Q=(y1, y2, ... yp) dada por:

    ( ) ( ) ( )d P Q x y x y x yp p( , ) ...= + + + 1 1 2 2 2 2 2 (1.8)

  • Ferreira, D.F. Estatstica multivariada 17

    A distncia euclidiana insatisfatria para muitas situaes

    estatsticas. Isso ocorre devido contribuio de cada coordenada ter o mesmo

    peso para o clculo da distncia. Quando estas coordenadas representam

    medidas so provenientes de um processo que sofre flutuaes aleatrias de

    diferentes magnitudes muitas vezes desejvel ponderar as coordenadas com

    grande variabilidade por menores pesos em relao quelas com baixa

    variabilidade. Isto sugere o uso de uma nova medida de distncia.

    Ser apresentada a seguir uma distncia que considera as

    diferenas de variao e a presena de correlao. Devido a escolha de a

    distncia depender das varincias e das covarincias amostrais, a partir deste

    instante, ser utilizado o termo distncia estatstica para distinguir de distncia

    euclidiana.

    A princpio, ser considerada a construo de uma distncia entre

    um ponto P, com p coordenadas, da origem. O argumento que pode ser usado

    refere-se ao fato de que as coordenadas de P podem variar no espao produzindo

    diferentes posies para os pontos. Para ilustrar, suponha que se tenha n pares

    de medidas em duas variveis (x1 e x2) e que as medidas de x1 variam

    independentemente das mensuraes em x2. O significado de independente neste

    ponto pode ser dado pelo fato de que os valores de x1 no podem ser preditos

    com nenhuma acurcia a partir dos valores de x2 e vice-versa. Em adio,

    assumido que as observaes de x1 possuem maior variabilidade que as de x2.

    Uma ilustrao desta situao est apresentada na Figura 1.2.

  • 1. Aspectos da anlise multivariada 18

    -6 -4 -2 0 2 4 6

    X2

    -6

    -5

    -4

    -3

    -2

    -1

    0

    1

    2

    3

    4

    5

    6

    Figura 1.2. Diagrama de disperso, mostrando a maior variabilidade na direo de

    x1 do que na direo de x2.

    Observando a Figura 1.2, verifica-se que no surpreendente

    encontrar desvios na direo de x1 que se afastem da origem consideravelmente,

    o que no ocorre na direo de x2. Parece ser razovel, ento, ponderar x2 com

    mais peso do que x1 para um mesmo valor, quando as distncias da origem forem

    calculadas.

  • Ferreira, D.F. Estatstica multivariada 19

    Um modo de fazer isso dividir cada coordenada pelo desvio padro

    amostral. Aps a diviso, tm-se as coordenadas estandardizadas 1 1 11*x x s= e

    2 2 22*x x s= . Aps eliminar as diferenas de variabilidade das variveis

    (coordenadas), determina-se a distncia usando a frmula euclidiana padro:

    d O P x xxS

    xS

    ( , ) ( ) ( )* *= + = +1 2 2 2 12

    11

    22

    22 (1.9)

    Usando a equao (1.9) todos os pontos tendo como coordenadas

    (x1, x2) e com distncia quadrada (c2) da origem devem satisfazer:

    12

    11

    22

    22

    2xS

    xS

    c+ = (1.10)

    A expresso (1.10) a equao de uma elipse, cujos maiores e

    menores eixos coincidem com os eixos das coordenadas. A Figura 1.3 mostra o

    caso geral para p = 2 coordenadas.

  • 1. Aspectos da anlise multivariada 20

    OX1

    X2

    cS110.5-cS11

    0.5

    cS220.5

    -cS220.5

    Figura 1.3. Elipse de uma distncia estatstica quadrtica d2(O,P)= 12

    11

    22

    22

    2xS

    xS

    c+ = .

    Exemplo 1.3

    Um conjunto de pares (x1, x2) de duas variveis forneceu 1 2X X 1= = , S11=9 e S22=1. Supe-se que as observaes de x1 so independentes de x2. A

    distncia quadrtica de um ponto arbitrrio (P) da origem, uma vez que as

    varincias da amostra no so iguais, dada por:

    d O Px x2 1

    222

    9 1( , ) = +

  • Ferreira, D.F. Estatstica multivariada 21

    Todos os pontos (x1, x2) que possuem distncias quadrada da origem igual a 1,

    satisfazem a equao:

    x x12

    22

    9 11+ = (1.11)

    As coordenadas de alguns pontos com distncia quadrtica unitria

    da origem foram apresentadas na Tabela 1.2.

    Tabela 1.2. Coordenadas de alguns pontos com distncia quadrtica unitria da

    origem.

    Coordenadas (x1, x2) Distncia ao quadrado

    ( 0, 1)

    ( 0,-1)

    ( 3, 0)

    (-3, 0)

    09

    11

    2 21+ =

    09

    11

    2 2

    1+ =( )

    39

    01

    2 21+ =

    ( ) + =39 012 2

    1

    O grfico da equao (1.11) uma elipse centrada na origem (0,0),

    cujo maior eixo o da direo de x1 e o menor da direo de x2. A metade do

    maior eixo (semi-eixo maior) c S11 3= e do menor c S22 1= . A elipse de distncia

    quadrtica unitria foi plotada na Figura 1.4.

  • 1. Aspectos da anlise multivariada 22

    -5 -4 -3 -2 -1 0 1 2 3 4 5

    -5

    -4

    -3

    -2

    -1

    0

    1

    2

    3

    4

    5

    x1

    x2

    Figura 1.4. Elipse de distncia unitria quadrtica da origem obtida a partir da

    equao 1.11.

    A expresso (1.9) pode ser generalizada para o clculo da distncia

    entre pontos P e Q, cujas coordenadas variam, mutuamente independentemente

    uma da outra. O caso mais geral, em que a hiptese de independncia no

    satisfeita, ser abordado futuramente.

    d P Qx yS

    x yS

    x y

    Sp p

    pp( , )

    ( ) ( ) ( )= + + + 1 12

    11

    2 22

    22

    2

    " (1.12)

  • Ferreira, D.F. Estatstica multivariada 23

    Todos os pontos (P) situados a uma distncia quadrtica constante

    de Q, pertencem a uma hiperelipside centrada em Q, cujos maiores e menores

    eixos so paralelos aos eixos das coordenadas.

    O programa SAS, apresentado a seguir, contm os cdigos

    necessrios para a obteno das principais estatsticas descritivas multivariadas

    apresentadas nesse captulo. O programa contm cdigos matriciais e ser

    abordado com mais detalhe nos prximos captulos. Os dados do exemplo 1.1 so

    utilizados para a ilustrao.

    Proc IML; X={ 80 10, 120 12, 90 6, 110 8}; Print X; n=nrow(X);p=ncol(X); Xbar=x`*j(n,1,1)/n; Print Xbar; q=i(n)-(1/n)*j(n,n,1); print q; S=(1/(n-1))*X`*q*X; W=(n-1)*S; print S W; V=diag(S); Vroot=half(V); IVroot=inv(Vroot); R=Ivroot*S*Ivroot; Print V Vroot IVroot; Print R; Quit;

    Foi motivado nesse captulo o estudo das anlises multivariadas e

    tentou-se fornecer alguns rudimentares, mas importantes, mtodos de organizar e

    resumir os dados. Em adio, o conceito geral de distncia foi apresentado, e ser

    abordado e generalizado nos prximos captulos.

  • 1. Aspectos da anlise multivariada 24

    1.5. Exerccios

    Considere as amostras com 8 observaes e 3 variveis apresentadas a seguir:

    x1 3 5 6 4 8 9 6 7

    x2 6 11 11 9 15 16 10 12

    x3 14 9 9 13 2 2 9 5

    a) Construa o grfico de disperso dos pontos das variveis x1 e x2, x1 e x3, x2 e x3.

    Comente sobre sua aparncia.

    b) Calcule: X , S e R e interprete os valores em R.

    c) Calcule a distncia euclidiana dada em (1.8) de um ponto

    P=( x1, x2, x3)=(5, 12, 8) em relao a origem e em relao a X .

    d) Calcule as mesmas distncias do item c, usando (1.12).

  • ||[ ]||lgebra vetorial e matricial

    2

    2.1. Introduo

    desejvel que as p respostas multivariadas sejam representadas

    por uma notao concisa. Os dados multivariados podem ser dispostos

    convenientemente como um arranjo de nmeros, como foi apresentado no

    captulo 1. Em geral, um arranjo retangular destes nmeros, com n linhas e p

    colunas, por exemplo, chamada de matriz de dimenses n x p. Se por outro lado,

    o arranjo consiste em n mensuraes em apenas 1 varivel, ou ainda, de uma

    observao multivariada em p variveis, esses arranjos so denominados de

    vetores.

    Com esse arranjo bidimensional, no s, a notao fica mais

    concisa, mas os muitos resultados matemticos de lgebra vetorial e matricial

    facilitam a derivao e exposio dos mtodos estatsticos multivariados. Neste

    material, os elementos de lgebra vetorial e matricial, sero considerados como

    conhecidos. Nesse captulo, no entanto, para os estudantes no familiarizados

    com o assunto, ser apresentada uma breve reviso.

  • 2. lgebra vetorial e matricial 26

    2.2. Elementos de lgebra vetorial

    De um ponto de vista geomtrico, as observaes multivariadas,

    podem ser consideradas como pontos no espao p-dimensional, cujas

    coordenadas so dadas por (x1, x2, ..., xp). Esse ponto pode ser visto como o final

    de um segmento de reta da origem (0, 0, ..., 0) ao ponto (x1, x2, ..., xp). Tal

    segmento de reta denominado de vetor de posio e pode ser denotado

    simplesmente por X . O vetor de posies apenas um exemplo de vetor, para os

    quais pode ser elaborada a lgebra, baseada nos seguintes postulados.

    POSTULADOS

    1. Para qualquer vetor X dado um nmero escalar c, a multiplicao do escalar

    pelo vetor, resulta em outro vetor Y , definido por:

    Y = c X

    c ser considerado um nmero real;

    2. A adio de dois vetores conduz a um nico vetor definido como:

  • Ferreira, D.F. Estatstica multivariada 27

    Z = X + Y

    3. A adio de vetores :

    Comutativa: X + Y = Y + X

    Associativa: X + ( )Y Z+ = ( )X Y Z+ +

    4. Se 0 o vetor nulo, ento:

    X + 0 = X

    0 . X = 0

    COMPRIMENTO, NGULO E DISTNCIA

    Inicialmente, definido produto interno entre dois vetores, que

    representa a soma de produtos de pares de coordenadas correspondentes. Para

    dois vetores (n x 1) de posio X e Y , o produto interno ser o escalar, dado por:

    n

    i i 1 1 2 2 n ni 1

    X.Y x y x y x y x y=

    = = + + + "

  • 2. lgebra vetorial e matricial 28

    fcil verificar que X.Y Y.X= . Por meio, do produto interno possvel generalizar o teorema de Pitgoras para o espao euclidiano

    n-dimensional:

    n2 2 2 2 2 2

    i 1 2 ni 1

    X X.X x x x x d (P,O)=

    = = = + + + = " (2.1)

    em que P, o ponto do espao n-dimensional, definido pelas coordenadas do

    vetor X . A expresso (2.1) o comprimento ao quadrado do vetor X . A

    expresso entre mdulo | X | indica a norma de X .

    Dessa forma o comprimento do vetor definido por:

    X X.X= (2.2)

    O ngulo entre dois vetores ( X e Y ) pode ser expresso em funo

    do produto interno e do comprimento dos vetores, obtido atravs da lei dos

    cosenos, por:

    ( ) X.YCosX.X Y.Y

    =

    (2.3)

    As distncias apresentadas no captulo 1, entre os pontos

    coordenados dos vetores X e Y , podem ser expressos agora como o

  • Ferreira, D.F. Estatstica multivariada 29

    comprimento do vetor diferena das coordenadas de X e Y . A distncia entre X

    e Y :

    d(X, Y) X Y (X Y).(X Y)= = (2.4)

    Alm de ser no negativa, essa distncia entre os dois vetores

    independente da direo das medidas e satisfaz a desigualdade triangular:

    d( X , Y ) d( X , Z ) + d( Y , Z ) (2.5)

    Derivada a partir da desigualdade de Cauchy-Schwars:

    a.b a . b (2.6)

    O que implica, no fato, que o valor do co-seno do ngulo entre a e b no pode exceder a unidade.

    ORTOGONALIDADE

    Dois vetores no nulos so denominados ortogonais, se o co-seno

    do ngulo entre eles for zero. Isto indica que:

  • 2. lgebra vetorial e matricial 30

    X.Y = 0 (2.7)

    Muitas vezes desejvel (em sistemas de equaes lineares)

    construir uma base ortonormal de vetores, isto , cada vetor da base possui

    comprimento unitrio ( )i iX .X 1= e cada par de vetor da base so ortogonais ( )i jX .X 0, i j= . Para um conjunto de vetores arbitrrios pode-se empregar a construo de Gram-Schimidt. O algoritmo est apresentado a seguir,

    considerando o conjunto 1 2 nX , X , ..., X de vetores:

    Passo 1: normalize 1X :

    11 1 1

    1 1

    XX ; X .X 0X .X

    =

    Passo 2: Ortonormalize 2X calculando o produto interno entre *1X e 2X , e

    subtraindo de 2X os componentes de *1X :

    Ortogonalizando 1X e 2X :

    ( )* *2 2 2 1 1X X X .X X =

    Ento, normalizando-se 2X

    :

  • Ferreira, D.F. Estatstica multivariada 31

    *2 2 2 2

    2 2

    1X X ; X .X 0X .X

    =

    Passo 3: Calcule o produto interno de 3X com *1X e

    *2X , e subtraia de 3X os

    componentes de *1X e *2X ,

    ( ) ( )* * * *3 3 3 1 1 3 2 2X X X .X X X .X X =

    Ento, normalizando-se 3X

    :

    *3 3 3 3

    3 3

    1X X ; X .X 0X .X

    =

    E assim por diante, at o n-simo estgio, quando todos os vetores

    entrarem na construo. Se o i-simo vetor for linearmente dependente dos

    vetores anteriores, ento iX

    ser igual ao vetor nulo, iX 0 = , devendo ser

    eliminado do conjunto e o processo deve continuar com o vetor i 1X + . O nmero de

    vetores no nulos remanescentes no conjunto, constituem a dimenso do espao

    vetorial original.

  • 2. lgebra vetorial e matricial 32

    Exemplo 2.1

    Dado o conjunto de vetores, a seguir, utilizar como ilustrao a construo de

    Gram-Schimidt.

    1 1 01 1 0

    X1 0 11 0 1

    =

    Os vetores de X so dados por:

    X = [ 1X 2X 3X ]

    Passo 1. Normalize 1X :

    *1

    111X121

    =

    Passo 2: Ortonormalize 2X :

    Produto interno: 2X .*1X = 1

  • Ferreira, D.F. Estatstica multivariada 33

    ortogonalizao: 2

    1 1 11 1 11 1X 1.0 1 12 20 1 1

    = =

    Normalizao: *2

    1 11 11 1 1X .1 11 2 21 1

    = =

    Passo 3: Ortonormalizao de 3X

    Produto interno: *3 1X .X 1= e *

    3 2X .X 1=

    ortogonalizao:

    1 12 21 12 2

    3 1 12 21 12 2

    00 1 1 000 1 1 01 1X 1. ( 1).11 1 1 02 211 1 1 0

    + + = = =

    Verifica-se neste passo que 3X linearmente dependente dos

    vetores 1X e 2X , e deve ser eliminado da base vetorial. fcil verificar que

    3 1 2X X X= . Agrupando os vetores linearmente independentes ortonormalizados

    obtm-se a base vetorial de Gram-Schimidt.

  • 2. lgebra vetorial e matricial 34

    1 12 21 12 2

    2 1 12 21 12 2

    X

    =

    Pode ser observar facilmente que o produto interno dos vetores em

    X2, igual a zero.

    Um importante tipo de matriz inversa, denominado de inversa de Moore-

    Penrose, obtido de uma base ortonormal das colunas de uma matriz para a qual

    se deseja obter a inversa generalizada de Moore-Penrose. Seja A uma matriz de

    dimenso qualquer nxp e seja U a base ortonormal de vetores obtida da

    ortonormalizao das colunas de A, ento, defini-se T por:

    T=UA

    Logo, a inversa generalizada de Moore-Penrose (A+) definida por:

    A+ = T(TT)-1U.

    2.3. Elementos de lgebra matricial

    Na lgebra matricial as relaes e operaes so definidas atravs

    de operaes em arranjos retangulares dos elementos, denominados de matrizes.

    Um exemplo de matriz :

  • Ferreira, D.F. Estatstica multivariada 35

    11 12 1p

    21 22 2p

    n x p

    n1 n2 np

    a a aa a aAa a a

    =

    ""

    # # % #"

    O nmero de linhas de uma matriz denominado de ordem de linha

    e o nmero de colunas, ordem de colunas. Se o nmero de linhas n e o nmero

    de colunas p, diz-se que a matriz possui ordem nxp. Pode-se representar a

    matriz por:

    A=[aij] i=1, 2,..., n j=1, 2, ..., p (2.8)

    Nas anlises multivariadas, muitas vezes, ser feito referncias a

    matriz de dados, a qual consiste de p respostas de n observaes ou unidades

    experimentais, e ter ordem nxp.

    POSTULADOS

    1. Igualdade: Duas matrizes necessariamente com o mesmo nmero de linhas e

    colunas so iguais, se e somente se os elementos correspondentes, forem

    iguais:

    A=B aij=bij i=1, 2, ..., n e j=1, 2, ..., p

  • 2. lgebra vetorial e matricial 36

    2. Adio: A soma de duas matrizes de mesma ordem obtida pela soma dos

    elementos correspondentes:

    A+B = [ aij] + [bij] = [aij + bij]

    A adio com matriz nula 0, contendo elementos iguais a zero :

    nAp + n0p = nAp

    3. Multiplicao por escalar: o produto de um escalar e uma matriz obtido pela

    multiplicao de cada elemento da matriz pelo nmero escalar:

    cA = c[ aij] = [ caij]

    4. Multiplicao de matriz: a multiplicao de matrizes definida para aquelas em

    que a ordem coluna do fator que pr multiplica igual a ordem linha do fator

    que ps multiplica. Tais matrizes so denominadas conformveis para

    multiplicao. O elemento (i, k) da matriz resultante do produto a soma dos

    produtos dos elementos correspondentes, da i-sima linha do fator que pr

    multiplica com os da k-sima coluna do fator que ps multiplica.

    nAq qBp = AB = q

    ij jkj 1

    a b=

    = [ai1b1k + ai2b2k + ... + aiqbqk] = [cik] = C

  • Ferreira, D.F. Estatstica multivariada 37

    Em geral AB BA.

    A matriz quadrada com unidades na diagonal e zero nas demais

    partes denominada de matriz unitria ou identidade:

    1 0 00 1 0

    0 0 1

    =

    ""

    # # % #"

    Verifica-se que:

    nAp pp = nAp

    nn nAp = nAp

    A matriz quadrada cujos elementos fora da diagonal principal so

    iguais a zero denominada matriz diagonal:

    D = diag[d1, d2, ..., dn] =

    1

    2

    n

    d 0 00 d 0

    0 0 d

    ""

    # # % #"

  • 2. lgebra vetorial e matricial 38

    A pr-multiplicao por uma matriz diagonal, simplesmente re-escala

    as linhas do fator que ps multiplica, e a ps-multiplicao re-escala as colunas do

    pr-fator.

    5. Inverso de matriz: a inversa de uma matriz quadrada A, nxn, chamada de A-1

    e definida de tal forma que A A-1 = A-1 A = .

    A inversa de um produto de matrizes o produto do inverso dos fatores em

    ordem inversa a ordem de multiplicao original:

    (AB)-1 = B-1A-1

    Pois, B-1A-1AB = B-1B = e AB B-1A-1 = AA-1 =

    6. Matriz transposta: uma matriz obtida pela troca de linhas por colunas a partir de

    uma matriz especfica denominada de matriz transposta. denotada por A.

    nAP = [aij], ento, pAn = [aij] = [aji]

    (A + B) = A + B

    (AB) = BA

  • Ferreira, D.F. Estatstica multivariada 39

    (A-1) = (A)-1

    7. Matrizes particionadas: deixe as r linhas de uma matriz A (mxn) ser particionada

    das restantes s=m-r linhas, e as p colunas particionadas das remanescentes

    q = n - p colunas. Ento, A pode ser representada por submatrizes, como a

    seguir:

    11 12

    21 22

    A A rA

    A A sp q

    =

    Seja B uma matriz particionada de forma similar e sejam A e B tais

    que suas parties sejam conformveis para adio, logo,

    11 11 12 12

    21 21 22 22

    A B A B rA B

    A B A B sp q

    + + + = + +

    Suponha agora que B seja particionada em p e q linhas e em t e u

    colunas. Ento, possvel verificar que:

  • 2. lgebra vetorial e matricial 40

    11 12 11 12

    21 22 21 22

    11 11 12 21 11 12 12 22

    21 11 22 21 21 12 22 22

    A A B Br pAB

    A A B Bs qp q t u

    A B A B A B A B rA B A B A B A B s

    t u

    =

    + + = + +

    Ainda possvel verificar que:

    ( ) ( )( ) ( )

    1 1 11 1 1 11 1

    1 111 1

    A A B CA A Bp A B p D CA B D CA Bq C D q CAD CA B D CA B

    p q p q

    + =

    Mtodo prtico para clculo de matrizes inversas

    As rotinas para computadores usualmente fazem uso da verso

    compacta do mtodo de Gauss, denominado de mtodo de Gauss-Jordan

    (Householder, 1953, 1964).

    Os clculos do mtodo de Gauss-Jordan so recursivos, sendo que

    os elementos da matriz no estgio i+1 so trocados pelos resultados da chamada

    operao pivotante dos elementos do estgio i, por:

    ( ) ( )( ) ( )

    ( )i i

    kj ji 1 ik k i

    jj

    a aa a k e j

    a+ = AA A A

  • Ferreira, D.F. Estatstica multivariada 41

    ( )( )

    ( )i

    ji 1j i

    jj

    aa j

    a+ = AA A

    ( )( )

    ( )i

    kji 1kj i

    jj

    aa k j

    a+ =

    ( )( )

    i 1jj i

    jj

    1aa

    + =

    O elemento ( )ijja chamado de piv, e sua linha e coluna so

    chamados de linha e coluna pivotais. Aps n operaes pivotantes, a matriz

    original substituda pela sua inversa, garantindo-se que cada linha e coluna seja

    pivotada somente uma vez.

    Exemplo 2.2

    Use o algoritmo de Gauss-jordan para inverter a matriz A (2x2) a seguir:

    ( )0 4 2A2 2

    =

    Passo 1. Um bom compromisso com a preciso pivotar a linha e coluna cujo

    elemento da diagonal seja o maior de todos os no pivotados. Assim o

  • 2. lgebra vetorial e matricial 42

    elemento escolhido para piv o elemento a11=4. A matriz aps a

    primeira ao pivotante :

    ( )1 14 2112

    1 24 4A

    12 2 224 4

    = =

    Passo 2. Neste passo, a nica coluna ou linha no pivotada a 2. Portanto o piv

    a22=1, e a matriz resultante da operao pivotante :

    ( )( )1 1 12 2 2

    12

    1 112 24 1 1211 21 1

    1 11A1 1 22

    = = =

    Ao final da operao pivotante, a matriz resultante, A(2), a matriz

    inversa de A.

    Matrizes ortogonais

    Classes especiais de matrizes, que sero utilizadas rotineiramente

    nas tcnicas multivariadas, so denominadas de matrizes ortogonais, sendo

    simbolizadas em geral por Q e caracterizada por:

  • Ferreira, D.F. Estatstica multivariada 43

    QtQ = QQt = ou Qt = Q-1

    O nome deriva da propriedade de que se Q tem i-sima linha tiq ,

    ento, se QQt = implica que ti iq q 1= e ti jq q 0= para ij, sendo que as linhas

    possuem tamanho unitrio e so mutuamente ortogonais (perpendiculares). De

    acordo com a condio de que QtQ = , as colunas tm a mesma propriedade.

    Exemplo 2.3

    Dado a matriz Q, a seguir, verifique sua ortogonalidade:

    1 12 2

    1 12 2

    Q =

    A transposta de Q dada por:

    1 12 2t

    1 12 2

    Q =

    ento,

    1 1 1 12 2 2 2t1 1 1 12 2 2 2

    2 0 1 01QQ0 2 0 12

    = = =

  • 2. lgebra vetorial e matricial 44

    e,

    1 1 1 12 2 2 2t

    1 1 1 12 2 2 2

    2 0 1 01Q Q0 2 0 12

    = = =

    sendo, QtQ = QQt = ou Qt = Q-1, verificou-se que Q ortogonal.

    Determinantes

    Uma funo escalar importante de uma matriz A quadrada nxn, o

    determinante da mesma. O determinante da matriz A simbolizado por |A| e

    definido por:

    ( )11

    ni j

    ij ijj 1

    A a se n 1

    A a A 1 se n 1+=

    = == > (2.9)

    em que Aij a matriz quadrada (n-1)x(n-1) obtida deletando-se a i-sima linha e a

    j-sima coluna de A, para qualquer escolha arbitrria de i=1, 2, ..., n.

    Exemplo 2.4

    Para ilustrar a definio (2.9), sero consideradas as seguintes matrizes:

  • Ferreira, D.F. Estatstica multivariada 45

    4 2 24 1

    A [4] B C 2 2 01 2

    2 0 2

    = = =

    A 4= ; 2 3B 4 2 ( 1) 1 1 ( 1) 4.2.1 1 1 1 7= + = = ;

    2 3 4

    2 3 2 2 3 3

    2 3 4

    2 0 2 0 2 2C 4 ( 1) 2 ( 1) 2 ( 1)

    0 2 2 2 2 0

    4 [2 2 ( 1) 0 0 ( 1) ] ( 1) 2 [2 2 ( 1) 0 2 ( 1) ] ( 1)

    2 [2 0 ( 1) 2 2 ( 1) ] ( 1) 16 8 8 0

    C 0

    = + +

    = + + + +

    + + = =

    =

    Propriedades dos determinantes

    1. tA A= ;

    2. Se uma linha ou coluna de A for multiplicada por uma constante k, o

    determinante ficar multiplicado pela constante;

    3. Se A multiplicada por uma constante k, o determinante resultante ficar

    multiplicado por kn;

  • 2. lgebra vetorial e matricial 46

    nkA k A=

    4. Se duas linhas ou duas colunas so trocadas de posio, ento o determinante

    muda de sinal;

    5. Se duas linhas ou duas colunas so proporcionais, ento o determinante de A

    ser igual a zero;

    6. O determinante obtido deletando a i-sima linha e j-sima coluna de A

    denominado menor de A, e denotado por |Aij|. A relao entre |A| e |Aij| foi

    apresentada na definio de determinante (2.9);

    7. 11 1A AA

    = = ;

    8. |AB| = |A||B|.

    Determinante e posto (rank)

    Se |A|0, ento, A denominada de posto completo, ou como mais comum dizer, A no-singular e A-1 existe. Uma condio necessria e suficiente

    para a existncia da inversa de A que |A|0.

  • Ferreira, D.F. Estatstica multivariada 47

    Teorema da multiplicao

    Seja a matriz A de ordem 2n x 2n, particionada em sub-matrizes

    n x n dadas por:

    B C nA

    D E nn n

    =

    Supe-se que o determinante de A no nulo, e se necessrio for,

    linhas e colunas correspondentes de A devem ser trocadas para assegurar que B

    seja no-singular. Como o nmero de trocas de linhas e colunas

    necessariamente par, o valor de |A| no se altera. Considere matrizes

    elementares, com determinante 1, dadas por:

    1

    0DB

    e 1B C

    0

    Se A for pr e ps-multiplicada, respectivamente, por essas matrizes

    o resultado :

  • 2. lgebra vetorial e matricial 48

    1

    1

    1

    1 1

    0 B C B CDB D E 0

    B C B 0B C0 DB C E 0 E DB C0

    = = +

    Ento, A foi reduzida para sua forma quase-diagonal ou bloco

    diagonal. Seja uma matriz V (2n x 2n) particionada da seguinte forma:

    1

    2

    V 0 nV

    0 V nn n

    =

    ento, o determinante de v dado por:

    1 2V V V=

    Aplicando essa regra a A transformada pela pr e ps-multiplicao por

    matrizes elementares, cujo determinante igual a 1, o que no altera o valor de

    |A|, tem-se:

    11

    B 0A B E DB C0 E DB C

    = =

    Observe que se A for quasi-triangular, ou seja, triangular por blocos,

    o determinante o produto dos determinantes de suas sub-matrizes principais:

  • Ferreira, D.F. Estatstica multivariada 49

    B CB E0 E

    =

    Agora possvel apresentar e provar o teorema da multiplicao. Se

    A e B so matrizes quadradas n x n, ento, |AB|=|A|.|B|. Considere para isso a

    identidade:

    I A A 0 0 AB0 I I B I B

    =

    O produto do lado esquerdo da igualdade envolve operaes

    elementares que no afeta o determinante. Assim, o determinante de ambos os

    lados igualado e o resultado obtido :

    A 0 0 ABI B I B

    =

    Colocando o lado direito na forma quasi-triangular por meio de trocas

    nas ltimas n colunas o resultado obtido dado por:

    ( )nA 0 AB 01I B B I=

  • 2. lgebra vetorial e matricial 50

    Usando o resultado do determinante de uma matriz triangular por

    blocos, tm-se:

    ( )( ) ( )( )

    n

    n n

    2n

    A B 1 AB I

    A B 1 1 AB

    A B 1 AB

    AB A B

    = = =

    =

    Infelizmente, no h teorema simples para a soma de matrizes.

    Decorre desse teorema que:

    1

    1

    11

    IA A

    1AA1

    AAA

    =

    == =

    Derivadas de vetores e matrizes

    As derivadas de funes envolvendo vetores e matrizes so

    necessrias em inmeras aplicaes na multivariada e em outras reas. Apesar

    de ser possvel escrever essas mesmas funes em uma forma expandida e

    tomar as derivadas elemento a elemento pelas regras de diferenciao escalar,

    vantajoso definir regras que retenham vetores e matrizes na notao (Bock, 1975).

  • Ferreira, D.F. Estatstica multivariada 51

    A seguir so apresentadas as principais regras de diferenciao vetorial e

    matricial.

    Derivadas de matrizes de funes em relao a variveis escalares

    Seja A uma matriz m x n cujos elementos so funes diferenciveis

    com relao a uma varivel escalar x. A derivada de A em relao a x uma

    matriz m x n:

    11 1n

    m1 mn

    a ax xA

    xa ax x

    =

    "# % #

    " (2.10)

    Seja A uma matriz m x n de funes diferenciveis em x e B outra

    matriz p x q cujos elementos, tambm, so diferenciveis em x. Para cada caso

    abaixo, so adotadas dimenses tais que as operaes matriciais sejam

    conformveis.

    ( ) A BA B ; m p, n qx x x

    + = + = = (2.11)

    ( ) B AAB A B; n px x x

    = + = (2.12)

  • 2. lgebra vetorial e matricial 52

    ( )1 1 1AA A A ; m n, 0Ax x = = (2.13)

    Seja X uma matriz m x n com o elemento xij na i-sima linha e

    j-sima coluna, ento,

    ijij

    X 1x

    = (2.14)

    em que 1ij uma matriz m x n com 1 na i-sima linha e j-sima coluna e 0 nas

    demais posies. Se X for uma matriz diagonal n x n, logo,

    iiii

    X 1x

    = (2.15)

    Derivadas de uma funo escalar de matrizes em relao a um vetor ou matriz varivel

    Seja g uma funo escalar qualquer de uma matriz X, que pode ser por

    exemplo o determinante, o trao, entre outras, ento, a diferenciao de g em

    relao a X :

  • Ferreira, D.F. Estatstica multivariada 53

    11 1n

    m1 mn

    g gx x

    gX

    g gx x

    =

    # % #"

    (2.16)

    a) o trao

    O trao de uma matriz n x n uma funo que aparece com muita

    freqncia na estatstica multivariada, o qual a soma dos elementos da diagonal

    principal dessa matriz:

    ( ) n iii 1

    tr aA=

    = (2.17)

    Para as matrizes A, B e C de ordem m x n, p x q e r x s,

    respectivamente, o trao tem as seguintes propriedades:

    ( ) ( ) ( )tr tr tr , m n p qA B A B= + = = =+ (2.18)

    ( ) ( )tr tr , m nA A= = (2.19)

    ( ) ( )ttr tr , m nAA = = (2.20)

    ( ) ( )tr tr , m q, n pAB BA= = = (2.21)

  • 2. lgebra vetorial e matricial 54

    ( ) [ ] ( )tr tr tr , m s, n p, q r(AB)CABC CAB= = = = = (2.22)

    Seja C uma matriz r x s de constantes e X uma matriz u x v de

    variveis. As seguintes diretivas de derivao do trao de funes de C e X com

    relao aos elementos de X, resultam em matrizes de dimenso u x v:

    ( )tr C 0, r sX

    = = (2.23)

    ( )tr X I, r sX

    = = (2.24)

    ( ) ttr XC C , r v, s uX

    = = = (2.25)

    ( ) ( )t ttr X CX X, r v s uC CX = = = =+ (2.26)

    Essas diretivas de derivao so invariantes as permutaes cclicas

    sofridas por transposio ou permutao dos fatores de multiplicao de matrizes.

    no entanto, as derivadas com relao a transposta de X resultam em transpostas

    das matrizes anteriores de ordem v x u. Em particular:

  • Ferreira, D.F. Estatstica multivariada 55

    ( ) tt

    tr XC C , r v, s uX

    = = = (2.27)

    ( ) ( )t t tttr X CX X , r v s uC CX = = = =+ (2.28)

    Para obter derivadas de funes elementares das matrizes algumas

    diretivas tambm so definidas. Sejam os elementos de A e B funes de X, e

    seja C uma matriz de constantes. Ento,

    ( ) ( ) ( )tr tr trA B A B , m n p qX X X

    + = + = = = (2.29)

    ( ) ( ) ( )trtr trAB AB AB , m q, n pX X X

    = + = = (2.30)

    ( ) ( )1 2tr trA A A , m n, 0AX X = = (2.31)

    ( ) ( )1 1 1tr trA C A CA A , m n r s, 0AX X = = = = (2.32)

    A barra acima das matrizes anteriores em (2.29) a (2.32) indica que

    essas so consideradas constantes para fins de diferenciao.

  • 2. lgebra vetorial e matricial 56

    b) determinante

    ( ) ( )tt 1X adj , u v, 0X XX XX = = = (2.33)

    ( ) ( )t t1adjln X X , u v, 0XXX X = = = (2.34)

    Restries da varivel de diferenciao

    Alguns problemas esto sujeitos a maximizao ou minimizao com

    relao a uma varivel que por sua vez est sujeita a restries. Os casos

    especiais so queles em que X simtrica. Logo X=Xt e os elementos fora da

    diagonal so sujeitos a:

    xij = xji i

  • Ferreira, D.F. Estatstica multivariada 57

    em que g uma funo escalar de X, U a n x n matriz de multiplicadores de

    Lagrange. Logo, X deve satisfazer:

    ( )tg 1 0U UX 2 + = (2.36)

    Como tambm

    ( ) ( )t t

    tt t1 1g g 0U U U U2 2X X + = = (2.37)

    Somando essas expresses obtm-se a condio para o extremo

    restrito:

    tg g 0X X

    + = (2.38)

    Outro caso importante de matriz X restrita : se X uma matriz

    diagonal n x n e Y uma matriz funo de X, ento,

    11 22 nn

    tr(Y) tr(Y) tr(Y)tr(Y) Diagx x xX

    = " (2.39)

    E se X = x , ento,

  • 2. lgebra vetorial e matricial 58

    tr(Y) tr(Y)X x

    = (2.40)

    Regra da cadeia para funes escalares de matrizes

    Seja g uma funo escalar de A diferencivel com relao aos

    elementos de A, e deixe os elementos de A ser funo diferencivel de x. Ento,

    tg g Atrx A x

    = (2.41)

    Por exemplo, para |A|0, g=ln|A| de (2.34) tem-se:

    ( )t tt1g ln ln A AA Atr tr Ax x A x x = = = (2.42)

    derivada de uma funo de um vetor com relao a um vetor

    Seja um vetor z m x 1, cujos elementos so diferenciveis pelos

    elementos 1 x n do vetor [ ]t 1 2 nx x x x= " . A derivada de Z em relao a tx a matriz m x n:

  • Ferreira, D.F. Estatstica multivariada 59

    tj ij

    z i 1, 2, ..., mzx j 1, 2, ..., nx

    = = =

    (2.43)

    Por exemplo, de (2.26) tem-se a primeira derivada de tx Ax , sendo A

    simtrica,

    ( )tt tr x Axx Ax 2Axx x

    = = (2.44)

    De (2.43), a segunda derivada representada em forma matricial

    por:

    ( )ttt t t

    x Ax xx Ax 2Ax 2Ax x x x

    = = = (2.45)

    Formas quadrticas

    Definindo A como uma matriz simtrica no nula (nxn), e o vetor

    t1 2 nx [X X X ]= " a expresso:

    n n 1 nt 2

    ii i ij i ji 1 i 1 j i 1

    Q x A x a X 2 a X X

    = = = += = +

  • 2. lgebra vetorial e matricial 60

    dita forma quadrtica, pois s contm termos quadrados ( )2ix e de produtos ( )i jx x .

    Exemplo 2.5

    Obtenha a expanso da forma quadrtica, dado o vetor x e a matriz A, a seguir:

    [ ]1 2 4 1x x x A 1 2 = =

    [ ] [ ]1 11 2 1 2 1 22 2

    x x4 1Q x x 4x x x 2x

    x x1 2 = = + +

    2 21 1 2 2Q 4x 2x x 2x = + +

    Assumindo, para o momento, que p elementos x1, x2, ..., xp, de um

    vetor x so realizaes de p variveis aleatrias X1, X2, ..., Xp pode-se

    consider-los como coordenadas de um ponto no espao p-dimensional. A

    distncia desse ponto 1 2 p[x x x ]" da origem pode e deve, nesse caso, ser

    interpretada em termos de unidades de desvio padro. Desse modo, pode-se

    considerar a incerteza inerente (variabilidade) s observaes. Pontos com a

    mesma incerteza associada so considerados de mesma distncia da origem.

    Introduzindo agora uma frmula geral de distncia mais apropriada tm-se:

  • Ferreira, D.F. Estatstica multivariada 61

    ( ) n n 1 n2 2ii i ij i ji 1 i 1 j i 1

    d a x 2 a x x0,P

    = = = += + (2.46)

    e garantindo que d2 > 0 para todo ponto P0, e fazendo aij=aji, tm-se:

    11 12 1p

    121 22 2p2 t

    1 p

    pp1 p2 pp

    0 d x Ax

    a a axa a ax xxa a a

    < = =

    """ # # # % #"

    (2.47)

    Verifica-se que (2.47) uma forma quadrtica, o que permite que a

    interprete como uma distncia. A determinao, dos coeficientes da matriz A de

    (2.47) ser apresentada oportunamente.

    Classificao de formas quadrticas

    As formas quadrticas podem ser classificadas, quanto aos

    resultados que produzem. Nesta seo, o interesse residir nas formas

    quadrticas no negativas e nas matrizes associadas (denominadas positivas

    definidas). Uma condio necessria e suficiente para que A seja positiva definida

    (pd) que esta possa ser fatorada por:

  • 2. lgebra vetorial e matricial 62

    tn n n n n nA S S=

    e que o posto de S seja n, em que S uma matriz triangular, denominada fator de

    Cholesky de A (Bock, 1975). Portanto, se uma matriz admite o fator de Cholesky,

    ela positiva definida.

    t t t t t t t

    2 2 21 2 n

    Q x Ax x (SS )x (S x) (S x) z z

    Z Z Z

    = = = =

    = + + +

    "

    Devido a S ter posto coluna completo, no existe x no nulo, tal que tz S x 0= = . Portanto, a forma quadrtica Q sempre positiva, como foi afirmado.

    Se por outro lado, o posto de S for rn, ento o posto de A ser r, e a forma quadrtica Q x 'Ax= 0, denominada positiva semidefinida (psd). Isso se deve

    ao fato de que para algum vetor x 0, a igualdade Q = 0, acontece. O algoritmo

    para obteno do fator de Cholesky de uma matriz pd, est apresentado a seguir.

    Algoritmo para obteno do fator de Cholesky

    de uma matriz positiva definida

    1. Dada uma matriz A (nxn), com elementos aij.

  • Ferreira, D.F. Estatstica multivariada 63

    2. Obteno da transposta do fator de Cholesky St, dada pelo algoritmo abaixo,

    sendo que os elementos desta matriz no contemplados pelo mtodo devem

    ser considerados iguais a zero:

    1a linha: 1j11 11 1j11

    aS a S j 1

    S= = >

    i-sima linha:

    12i 1

    2ii ii ri

    r 1

    i 1

    ij ij ri rjr 1ii

    S a

    1S aS

    i 2 j i

    S

    S S

    =

    =

    =

    =

    >

    3. A obteno de S-1, inversa de S, com elementos Sij, dada por:

    i 1ii ij rj

    rir 1ii ii

    ij

    1 1S S S S i jS S

    para i < j S 0

    =

    = = >=

    4. A obteno da A-1, inversa de A, com elementos aij, em que aij=aji, dada por:

  • 2. lgebra vetorial e matricial 64

    ( )n n2ii ri ij ri rjr i r i

    a S a S S i j= =

    = = >

    Exemplo 2.6

    Obtenha o fator de Cholesky (S), sua inversa (S-1) e a matriz inversa (A-1), a partir

    da matriz A, apresentada a seguir:

    4 2 0A 2 2 1

    0 1 2

    =

    Obteno de St:

    Primeira linha:

    11 12 132 0S 4 2; S 1; S 02 2

    = = = = = =

    Segunda linha:

    [ ]12222 23 1S 2 1 1 S 1 1 0 11 = = = =

    Terceira linha:

  • Ferreira, D.F. Estatstica multivariada 65

    ( ) 122 233S 2 0 1 1 = + =

    Logo,

    t

    2 1 0 2 0 0S 0 1 1 e S 1 1 0

    0 0 1 0 1 1

    = =

    A matriz S-1 obtida por:

    Linha 1:

    11 12 131S ; S S 0 i j2

    = = = <

    Linha 2:

    22 21 121 1 1S 1; S 1 1 ; S 0 pois i j1 2 2

    = = = = =

  • 2. lgebra vetorial e matricial 66

    logo,

    1

    1 0 021S 1 021 1 12

    =

    A matriz A-1 obtida por:

    Diagonal principal:

    ( )

    2 2 211

    222 2

    33 2

    1 1 1 3a2 2 2 4

    a 1 1 2

    a 1 1

    = + + = = + == =

    Demais elementos:

    21

    31 32

    12 21 13 31 23 32

    1 1a 1 ( 1) 1;2 2

    1 1a 1 ; a 1 ( 1) 1;2 2

    1a a 1; a a ; a a 12

    = + = = = = =

    = = = = = =

  • Ferreira, D.F. Estatstica multivariada 67

    Logo,

    3 14 2

    1

    12

    1A 1 2 1

    1 1

    =

    O fator de Cholesky S e sua inversa tm as seguintes propriedades:

    1. SSt = A

    2. S-1S = St(S-1) t =

    3. S-1A = S t

    4. A(S-1) t = S

    5. (S-1)A(S-1) t =

    6. (S-1) t (S-1) = A-1

  • 2. lgebra vetorial e matricial 68

    Maximizao de formas quadrticas

    Na estatstica multivariada e em outras reas aplicadas, muitas

    vezes necessria a maximizao de uma forma quadrtica. Devido forma

    quadrtica tQ x Ax= poder ser feita arbitrariamente grande tomando-se os valores

    dos elementos de x grandes, necessrio maximizar Q condicionada a alguma

    restrio no comprimento de x . Uma conveniente alternativa tomar uma soluo

    normalizada de x , ou seja, uma soluo tal que x tenha comprimento unitrio.

    Ento a maximizao da forma quadrtica Q pode ser transformada na

    maximizao da razo:

    t

    t

    x Axx x

    =

    para toda matriz A simtrica real. Para a maximizao deve-se tomar a derivada

    em relao a x e igualar a zero, resolvendo o sistema obtido, como demonstrado

    a seguir.

    t tQ x Ax x x2Ax e 2xx x x

    = = =

    usando a regra do quociente:

  • Ferreira, D.F. Estatstica multivariada 69

    t t t

    t 2 t t

    2Ax(x x) 2(x Ax)x 2 x AxA xx (x x) x x x x

    = =

    igualando a zero essa derivada e dividindo-a por ( )t2 x x , obtido o sistema homogneo de equaes:

    t

    t

    x AxA x 0x x

    =

    Desde que t

    t

    x Axx x

    =

    , ento para um ponto estacionrio qualquer i,

    ( )i iA x 0 = (2.48)

    Para que o sistema de equaes em (2.48) no possua apenas a

    soluo trivial, A-i no pode ter posto completo. Isto significa que seu determinante deve ser zero:

    |A-i| = 0 (2.49)

    A equao polinomial em , resultado da expanso dos termos a esquerda na equao (2.49) atravs do uso da definio (2.9), chamada de

    equao caracterstica de A. A i-sima raiz da equao (i) denominada de valor

  • 2. lgebra vetorial e matricial 70

    caracterstico de A; ix denominado vetor caracterstico de A associado a i.

    Outras terminologias podem ser empregadas, tais como, autovalores e

    autovetores, ou, valores e vetores prprios, ou ainda, raiz e vetor latente.

    Pares de formas quadrticas

    de fundamental importncia na anlise multivariada o problema de

    maximizar razo entre duas formas quadrticas:

    t

    t

    x Ax B 0x Bx

    =

    em que B uma matriz pd. O mximo dado da mesma forma que apresentado

    anteriormente, a partir da derivada em relao a x , igualando-a a zero, como

    apresentado a seguir:

    t t

    t

    x Bx x AxAx Bx (A B)x 0x 2 x Bx

    = = = (2.50)

    O sistema homogneo de equaes (2.50) ter soluo no trivial

    ( x 0 ), se e somente se,

    A B 0 = (2.51)

  • Ferreira, D.F. Estatstica multivariada 71

    Os autovalores () de A em relao a B so denominados de valores prprios, razes caractersticas, e os autovetores de vetores caractersticos ou

    prprios. Desde que B seja pd, possvel fator-la atravs do fator de Cholesky,

    por:

    tB BB S S=

    Ento definindo-se tBz S x= e usando as propriedades do fator de

    Cholesky tem-se que ( )t1Bx S z= . Agora, se (2.50) for pr multiplicada por 1BS e ( )t1Bx S z= for substitudo na expresso, tm-se:

    ( )( )

    t1 1 1B B B

    t1 1B B

    S A S B S z 0

    S A S z 0

    =

    =

    (2.52)

    desde que ( )t1 1B BS B S = A soluo de (2.52) a mesma da obtida pela maximizao de uma

    forma quadrtica, apresentada em (2.48), exceto que ( )t1Bx S Z= deve ser recuperado, uma vez que Z obtido. Os autovalores, no entanto, so invariantes

    transformao no-singular realizada.

  • 2. lgebra vetorial e matricial 72

    Clculo prtico dos autovalores e autovetores

    Ser apresentado aqui o mtodo denominado Power method

    derivado por Hotelling (1936). Esse mtodo apropriado para problemas em que

    somente r autovalores de maior magnitude e os seus respectivos autovetores so

    necessrios (rn). O mtodo iterativo, dado um vetor inicial arbitrrio (0)v . O

    vetor do estgio i ser representado por (i)v e o da prxima iterao ser obtido

    por:

    (i 1) (i)v Av+ =

    Usualmente um vetor de elementos iguais a 1 usado como vetor inicial. Os vetores caractersticos devem ser normalizados em cada estgio, para

    que o critrio de convergncia seja verificado. Quando uma aproximao desejada

    para 1 e 1x sejam alcanados, o segundo autovalor e autovetor devem ser

    encontrados na matriz A2, definida por:

    t2 1 1 1A A x x= (2.53)

    E assim o processo repetido at que um nmero rn de pares de autovalores e autovetores sejam obtidos.

  • Ferreira, D.F. Estatstica multivariada 73

    Exemplo 2.7

    aplicar o power method e determinar os autovalores e autovetores da matriz

    apresentada a seguir:

    4 2A

    2 1 =

    1. Determinao de 1 e 1x

    O vetor (0)v ser considerado como: (0)v =

    11

    Na avaliao da convergncia, o autovetor em cada estgio ser

    padronizado atravs da diviso pelo elemento de maior valor do mesmo.

    (i) (1) (0) 4 2 1 6

    A2 1 1 3v v

    = = =

    Normalizando (1)v :

    6(1) 63 1

    26

    1v = =

  • 2. lgebra vetorial e matricial 74

    Para avaliar a convergncia, os vetores (0)v e (1)v devem ser comparados. Ser

    considerado, convergente se todos os elementos de (1)v forem semelhantes aos

    elementos correspondentes de (0)v , para uma preciso pr estipulada, ou seja, de

    1x10-8. Neste caso, os vetores diferem consideravelmente.

    (ii) (2) (1)12

    14 2 5v Av

    2 1 2.5 = = =

    , normalizando

    (2)12

    1v

    =

    Comparando-se (2)v com (1)v , padronizados, verifica-se que so idnticos,

    indicando que o critrio de convergncia foi alcanado.

    O autovetor 1x obtido pela normalizao de (2)v e o primeiro

    autovalor 1, por t1 1 1x A x = .

    [ ]

    (2)

    (2)t (2)1

    t1 1 1

    0,8944V0, 4472V V

    0,8944x A x 4, 4721 2, 2361 5

    0, 4472

    x = = = = =

    2. determinao de 2 e 2x

    t2 1 1 1A A x x= = [ ]4 2 0,8944 0 0

    5 0,8944 0, 44722 1 0, 4472 0 0

    =

  • Ferreira, D.F. Estatstica multivariada 75

    Portanto os demais autovalores e autovetores de A so nulos (2=0 e

    2x 0= ). Os autovalores da matriz da forma quadrtica podem servir para

    classificao das mesmas. Demonstra-se que se todos os autovalores da matriz

    A, dado tQ x Ax= , forem positivos e maiores que zero a matriz A positiva

    definida e a forma quadrtica positiva. Se A possui autovalores positivos e nulos

    a matriz ser psd, e a forma quadrtica poder ser nula para um vetor x 0 . Os resultados apresentados at agora, a respeito de formas

    quadrticas, so conseqncias da expanso de matrizes simtricas em um

    processo denominado de decomposio espectral. A decomposio espectral de

    uma matriz A (nxn), simtrica, dada por:

    t t t1 1 1 2 2 2 n n nA e e e e e e= + + + " (2.54)

    em que i (i=1, 2, ..., n) so os autovalores de A e ie so os autovetores

    normalizados associados.

    Exemplo 2.8

    Considere a matriz simtrica:

    4 2A

    2 2 =

    com os autovalores e autovetores normalizados, apresentados a seguir:

  • 2. lgebra vetorial e matricial 76

    1 1 2 2

    0,8507 0,52575, 2361 e 0,7639 e

    0,5257 0,8507 = = = =

    Obtenha a decomposio espectral de A.

    t1 1 1

    3,7893 2,3417e e

    2,3417 1, 4471 =

    t2 2 2

    0, 2111 0,3416e e

    0,3416 0,5528 =

    4 2 3,7893 2,3417 0, 2111 0,34162 2 2,3417 1, 4471 0,3416 0,5528

    = +

    A expresso da distncia como raiz quadrada de uma forma

    quadrtica positiva definida permite que se obtenha a interpretao geomtrica

    baseada nos autovalores e autovetores de uma matriz. Dada uma matriz A, pxp, e

    suponha que p=2, os pontos tx =[x1, x2] de distncia constante c da origem

    satisfazem a:

    t 2 2 211 1 22 2 12 1 2x Ax a X a X 2a X X c= + + =

    pela decomposio espectral de A, como no exemplo 2.8, tem-se:

  • Ferreira, D.F. Estatstica multivariada 77

    ( ) ( )t t

    1 1 1 2 2 22 2t t t

    1 1 2 2

    A e e e e

    x Ax X e X e

    = + = +

    Fazendo ti iy x e= , obtm-se: 2 2 2

    1 1 2 2c y y= + que uma elipse, pois i>0. Verifica-

    se que 121 1x c e= satisfaz ( )12 2t t 21 1 1 1x Ax c e e c= = e 122 2x c e= fornece a

    apropriada distncia na direo de 2e . Portanto, os pontos de distncia c

    pertencem a uma elipse cujos eixos so dados pelos autovetores de A com

    tamanhos proporcionais ao recproco da raiz quadrada dos autovalores. A

    constante de proporcionalidade c. A situao ilustrada na Figura 2.1. Se p>2

    os pontos pertencem a uma hiperelipside de distncia c constante da origem,

    cujos eixos so dados pelos autovetores de A. O semi eixo na direo i tem

    comprimento de i

    c

    .

    x 1

    x 2

    e1

    e2

    -0,5 c 1

    c 2-0,5

    Figura 2.1. Pontos de distncia c constante da origem (1 < 2).

  • 2. lgebra vetorial e matricial 78

    Matriz raiz quadrada

    A partir da decomposio espectral, possvel definir uma categoria

    de matriz, em funo dos autovalores e autovetores, denominada de matriz raiz

    quadrada.

    Sendo A (nxn), uma matriz com decomposio espectral dada por

    nt

    i i ii 1

    A e e=

    = , pode-se construir uma matriz P, cujas colunas so os autovetores normalizados de A, tal que, [ ]1 2 nP e e e= " , e uma matriz diagonal, como os autovalores de A, tal que, =diag[i]. fcil verificar que:

    t

    n1 1 t t

    i ii 1 i

    A P P

    1A P P e e =

    = = =

    (2.55)

    Definindo, 1/2 como uma matriz diagonal com i como elemento

    da i-sima diagonal, ento, a matriz a seguir definida como matriz raiz quadrada

    de A e simbolizada por A1/2.

    1 12 2

    nt t

    i i ii 1

    A e e P P=

    = = (2.56)

  • Ferreira, D.F. Estatstica multivariada 79

    As suas propriedades so:

    1. (A1/2)t= A1/2 (A1/2 simtrica)

    2. A1/2A1/2=A

    3. ( )1 12 2i

    n1 t t1i i

    i 1A e e P P

    =

    = =

    4. A1/2A-1/2=A-1/2A1/2= e A-1/2A-1/2=A-1

    em que A-1/2 = (A1/2)-1

    Exemplo 2.9

    Obtenha a matriz raiz quadrada e a inversa da matriz utilizada no exemplo (2.8),

    usando as equaes (2.55) e (2.56):

    4 2A

    2 2 =

    com autovalores e autovetores normalizados, apresentados a seguir:

  • 2. lgebra vetorial e matricial 80

    1 1 2 2

    0,8507 0,52575, 2361 e 0,7639 e

    0,5257 0,8507 = = = =

    As matrizes P e foram obtidas pelos autovalores e autovetores, e esto apresentadas a seguir:

    0,8507 0,5257 5, 2361 0P

    0,5257 0,8507 0 0,7639 = =

    1 1 15,2361 2 21 1 t

    1 10,7639 2

    00,8507 0,5257 0,8507 0,5257A P P

    00,5257 0,8507 0,5257 0,8507 1 = = =

    1 12 2 tA P P

    5, 2361 00,8507 0,5257 0,8507 0,5257 1,8975 0,63240,5257 0,8507 0,5257 0,8507 0,6324 1, 26490 0,7639

    = = = =

    A seguir, um programa SAS apresentado contendo os principais

    comandos para a realizao das vrias operaes matriciais e vetoriais descritas

    nesse captulo.

  • Ferreira, D.F. Estatstica multivariada 81

    /* Capitulo 2 de multivariada - principais operaes matriciais descritas */ /* por meio do proc iml. Rotinas de inverso, multiplicao, transposio */ options nodate nonumber ps=1000 ls=76; proc iml; /* elementos de algebra vetorial*/ x1={1,1,1,1}; x2={1,1,0,0}; x3={0,0,1,1}; print x1 x2 x3; y=4*x1; z=x1+x2; print y z; yz=y` * z; yy=y`*y; /*distancia quadratica*/ dy=sqrt(yy); /* distancia da origem*/ zz=z`*z; dz=sqrt(zz); costeta=yz/(dy*dz); print yz yy zz dy dz costeta; /* elementos de algebra matricial*/ x=x1||x2||x3;/* concatenando vetores para obter uma matriz*/ xpx=x`*x; xx=xpx#xpx; /* produto de xpx elemento a elemento por xpx*/ print x xpx xx; /*calculo da base ortonormal de Gramshimidt - a matriz p contm as colunas ortonormalizadas de X*/ Call Gsorth(p, t, lindep, X); print lindep p t; /* calculo de autovalores e autovetores */ pu=eigvec(xpx); /* pu matriz de autovetores */ au=eigval(xpx); /* au vetor de autovalores */ print pu; print au; a={4 2,2 2}; /* matriz A*/ ainv=inv(a); /* inversa de A*/ deta=det(a); /* determinante de A*/ print a ainv deta; c={4 2 2,2 2 0, 2 0 2}; detc=det(c); print c detc; /* fator de Cholesky A=S`S em que S e uma matriz triangular superior */ /* S e a transposta do fator de Cholesky */ Sc=root(c); /* matriz c e singular, porem o SAS calcula assim mesmo o fator de Cholesky */ /* pode-se observar que a ultima linha, da matriz Sc e nula devido a isso*/ Sa=root(a); b={4 2 0,2 2 1,0 1 2}; print b; sb=root(b); print Sc Sa sb; /*maximizao de pares de formas quadrticas */ /* resolver (D - lG)e=0 */ D={4 2,2 2}; G={7 1,1 4}; print D G; Sg=root(G); /* transposta do fator de Cholesky de G */ Sginv=inv(Sg); /* inversa da transposta do fator de Cholesky de G */

  • 2. lgebra vetorial e matricial 82

    print Sg Sginv; II=Sginv`*G*Sginv; /* mostrar que igual a identidade */ print ii; H=Sginv`*D*Sginv; /* operar D, e em seguida extrair auto valores e vetores */ print H; /* D transformada */ zh=eigvec(H); /* zh matriz de autovetores */ auh=eigval(H); /* auh vetor de autovalores */ xh=Sginv*zh; /* matriz de autovetores recuperados */ teste=xh`*g*xh; print teste;/*mostrar que resulta na identidade*/ print xh; print auh; /* obtencao de matriz raiz quadrada - exemplificar com a matriz D */ aud=eigval(D); /* autovalores de D*/ lamb=diag(aud); /* diagonalizando aud e resultado em lamb */ print lamb; lambS=root(lamb); /* achando a raiz quadrada de lamb */ avd=eigvec(D); /* autovetores de D em avd */ Droot=avd*lambS*avd`; /* usando a definio para encontrar a matriz raiz quadrada de D */ print Droot; DD=avd*lamb*avd`; /* checando propriedades */ print DD; /* deve ser igual a D */ quit;

    2.4. Exerccios

    2.1. Sejam os vetores x =[3, 2, 4] e y '=[-1, 2, 2]

    (a) plote os dois vetores

    (b) encontre (i) o comprimento de x , (ii) o ngulo entre x e y, e (iii) a distncia

    entre x e y.

    (c) plote os vetores x x.1 e y y.1 ( x 3= e y = 1).

  • Ferreira, D.F. Estatstica multivariada 83

    2.2. Dada a matriz

    1 1 0 01 1 0 0

    X 1 0 1 01 0 1 01 0 0 1

    =

    (a) Ortonormalize as colunas de X, usando a construo de Gram-Schimidt.

    (b) Determine o vetor (coluna de x) linearmente dependente.

    (c) Determine o posto coluna de X, a partir da construo de Gram-Schimidt

    realizada em (a).

    2.3. Dadas as matrizes

    4 2 2 6 4 2A 2 2 0 B 4 4 0

    2 0 4 2 0 6

    = =

    (a) Obtenha a inversa de A e de B, usando o algoritmo de Gauss-Jordan.

    (b) Verifique usando o processo de Gauss-Jordan que (AB)-1=B-1A-1.

    2.4. Verifique se a matriz

  • 2. lgebra vetorial e matricial 84

    0,8507 0,5257P

    0,5257 0,8507 =

    uma matriz ortogonal.

    2.5. Seja

    8 1A

    1 2 =

    (a) Calcule o determinante de A.

    (b) Com base em (a) a matriz A pode ser considerada positiva definida? Porque?

    (c) Obtenha o fator de Cholesky, e confirme a resposta dada em (b).

    (d) Determine os autovalores e autovetores de A.

    (e) Obtenha a decomposio espectral de A.

    (f) Encontre A-1.

  • Ferreira, D.F. Estatstica multivariada 85

    (g) Encontre os autovalores e autovetores de A-1. Verifique que relao tem como

    os valores encontrados em (d).

    2.6. Considere as matrizes

    4 4,001 4 4,001A B

    4,001 4,002 4,001 4,002001 = =

    As matrizes so idnticas, exceto por pequenas diferenas no

    elemento, a22 e b22 devida a arredondamentos. Mostre que A-1 = -3B-1 (pequenas

    mudanas, talvez devido a arredondamentos, podem causar substanciais

    diferenas na inversa).

    2.7. Verifique se a forma quadrtica

    2 21 1 2 2Q 2x 2x x 4x= +

    positiva definida.

    Sugesto: Verificar se tQ x Ax= positiva, pode ser feita verificando se A pd.

    2.8. Dada as matrizes

  • 2. lgebra vetorial e matricial 86

    4 1 2 1A B

    1 2 1 1 = =

    (a) determine os autovalores e autovetores que maximizam a razo

    t

    t

    x Ax B 0x Bx

    =

    Obs. O que equivalente a resolver o sistema determinantal dado por (2.51)

    A B 0 = .

    (b) Determine a matriz raiz quadrada de A e de B.

    2.9. Dada a matriz de covarincia amostral (S)

    25 2S

    2 4 =

    (a) Determine R, dada D1/2, definida por:

  • Ferreira, D.F. Estatstica multivariada 87

    12

    11

    22

    pp

    S 0 0

    0 S 0D

    0 0 S

    =

    ""

    # # % #"

    Sendo ( ) ( )1 12 21 1R D S D =

    (b) Verifique a relao

    ( ) ( )1 12 2S D R D=

  • 2. lgebra vetorial e matricial 88

  • ||[ 3 ]||Amostragem multivariada

    3.1. Introduo

    Com os conceitos de lgebra vetorial introduzidos no captulo 2,

    pode-se aprofundar na interpretao geomtrica das estatsticas descritivas X , S

    e R. A maioria das explicaes usam a representao das colunas de X, como p

    pontos no espao n dimensional. Ser introduzida neste instante a pressuposio

    de que as observaes constituem uma amostra aleatria. De uma forma

    simplificada, amostra aleatria significa (i) que as medidas tomadas em diferentes

    itens (unidades amostrais ou experimentais) so no relacionadas uma com as

    outras, e (ii) que a distribuio conjunta das p variveis permanece a mesma para

    todos os itens. Essa estrutura de amostra aleatria que justifica uma escolha

    particular de distncia e dita a geometria para a representao n dimensional dos

    dados. Finalmente, quando os dados podem ser tratados como uma amostra

    aleatria inferncia estatstica ter por base um slido fundamento.

  • 3. Amostragem multivariada 90

    3.2. Geometria amostral

    Uma observao multivariada uma coleo de medidas em p

    variveis tomadas na mesma unidade amostral ou experimental. No captulo 1,

    item 1.3, as n observaes obtidas foram dispostas em um arranjo (Matriz) X por,

    11 12 1 1

    21 22 2 2

    1 2

    1 2

    k p

    k p

    j j jk jp

    n n nk np

    x x x xx x x x

    Xx x x x

    x x x x

    =

    " "" "

    # # # # # #" "

    # # # # % #" "

    em que cada linha de X representa uma observao multivariada. Desde que o

    conjunto todo de mensuraes muitas vezes uma particular realizao de

    variveis aleatrias, diz-se que os dados representam uma amostra de tamanho n

    de uma populao p variada.

    Os dados podem ser plotados por um grfico com p coordenadas. As

    colunas de X representam n pontos no espao p dimensional. Esse tipo de grfico

    fornece informaes de locao dos pontos e de variabilidade. Se os pontos

    pertencem a uma esfera, o vetor de mdias amostrais, X , o centro de balano

    ou de massa. Se a variabilidade ocorre em mais de uma direo, pode-se detectar

    pela matriz de covarincia, S. Uma medida numrica nica de variabilidade

    fornecida pelo determinante da matriz de covarincia.

  • Ferreira, D.F. Estatstica multivariada 91

    Exemplo 3.1

    Calcule o vetor mdia X para a matriz X apresentada a seguir. Plote os n = 3

    pontos no espao p=2 (bidimensional) e localize X no diagrama resultante.

    2 1X 3 0

    2 2

    =

    A mdia amostral dada por:

    ( ) ( )( )

    2 3 2 3 1X

    11 0 2 3

    + + = = + +

    O primeiro ponto dado por [ ]t1X 2 1= , o segundo por [ ]t2X 3 0= , e o terceiro por [ ]t3X 2 2= . A Figura 3.1 mostra os pontos juntamente com X , centro de massa ou de balano, obtidos a partir da matriz X.

  • 3. Amostragem multivariada 92

    -4 -3 -2 -1 0 1 2 3 4

    -3

    -2

    -1

    0

    1

    2

    3

    x3

    x1

    x2

    x_

    1

    2

    Figura 3.1. Diagrama com n=3 pontos no espao bidimensional (p=2) mostrando o

    centro de massa, X .

    Uma representao alternativa obtida atravs da considerao de p

    pontos no espao n dimensional. Os elementos das linhas de X so utilizados

    como coordenadas.

  • Ferreira, D.F. Estatstica multivariada 93

    11 12 1 1

    21 22 2 2

    1 2

    1 2

    1 2

    =

    =

    " "" "

    # # # # # #" "

    # # # # % #" "

    " "

    k p

    k p

    j j jk jp

    n n nk np

    k p

    x x x xx x x x

    Xx x x x

    x x x x

    y y y y

    As coordenadas do k-simo ponto [ ]tk 1k 2k nky x x x= " determinada pela n-upla de todas as medidas da k-sima varivel. conveniente

    representar tky como vetor ao invs de pontos.

    Exemplo 3.2

    Plote os dados da matriz X, com p=2 vetores no espao tridimensional (n=3)

    2 13 03 2

    X =

    [ ]t1y 2 3 2= e [ ]t2y 1 0 2=

  • 3. Amostragem multivariada 94

    1

    2

    3

    0

    Y

    Y 2

    1

    Figura 3.2. Diagrama da matriz de dados X como p=2 vetores no espao

    tridimensional.

    Muita das expresses algbricas que sero encontradas na anlise

    multivariada, podem ser relacionadas s noes geomtricas de ngulos,

    comprimento (norma) e volumes. Isto importante, pois representaes

    geomtricas facilitam a compreenso e conduz a novas vises. Infelizmente, o ser

    humano est limitado a visualizar objetos no espao tridimensional, e as

    representaes da matriz X no sero teis se n>3. No entanto, os

    relacionamentos geomtricos e os conceitos estatsticos associados, descritos

    para o espao tridimensional ou bidimensional, permanecem vlidos para

    dimenses maiores.

  • Ferreira, D.F. Estatstica multivariada 95

    possvel, em funo do exposto, prover uma interpretao

    geomtrica ao processo de encontrar a mdia amostral. O vetor 1 (nx1) ser

    definido por t1 =[1 1 1]. O vetor 1 forma um ngulo igual com cada um dos

    eixos coordenados, de tal forma que ( )1 n 1 tenha comprimento unitrio e mesmo ngulo de direo. Considerando o vetor [ ]tk 1k 2k