INTERVALOS DE CONFIANÇA E ASSOCIAÇÃO ENTRE VARIÁVEIS
CATEGÓRICAS
Biotecnologia – UFPel
2011
Amostra
Quero conhecer um atributo de uma
população (alvo)
Escolho um grupo para estudar (população
em estudo)
Deste grupo, tiro uma amostraamostra
Porque todo este trabalho???
Amostra
Representar a população
equiprobabilidade
Precisão
influi no cálculo do tamanho da amostra
VARIABILIDADE
cada amostra dá um resultado!
Distribuição das médias amostrais
Se cada amostra dá 1 resultado diferente…
Repetir o processo de amostragem e estudar a distribuição dos
resultados!
Como será que esta distribuição se compara com a
distribuição dos dados originais????
Teorema do Limite Central
distribuição das médias amostrais tende à distribuição normal
quando o N tende ao infinito, independente da distribuição original
dos dados
Distribuição das médias amostrais
A média é a mesma
A variância é menor
depende do tamanho da amostra!
nep
Intervalo de confiança
Intervalo que contém o parâmetro de interesse
() com alto grau de certeza
Intervalo de confiança de 95%:
IC95%: média – 1,96 x e.p., média + 1,96 x e.p.
baseado na distribuição normal
%95)( ICP
Intervalo de confiança de 95%
3100 3200 3300
95% das amostras
Exemplos
PNASC
Total Sum Mean Variance Std Dev Std Err 449 1420145 3162.906 245887.125 495.870 23.402
Minimum 25%ile Median 75%ile Maximum Mode 900.000 2900.000 3210.000 3475.000 4640.000 3280.000
Student's "t", testing whether mean differs from zero.T statistic = 135.158, df = 448 p-value = 0.00000
Calcular:IC 95% = 3162,9 – 1.96 x 23,4 -- 3162,9 + 1.96 x 23,4IC 95% = 3117.036 -- 3208.764
Exemplos (Stata)
. ci pnasc compr aigdubo banho gesta nprenat
Variable | Obs Mean Std. Err. [95% Conf. Interval]-------------+--------------------------------------------------------------- pnasc | 449 3162.906 23.40156 3116.916 3208.897
compr | 445 48.46944 .1187009 48.23615 48.70272
aigdubo | 447 38.2081 .0722459 38.06611 38.35008
banho | 450 1.155556 .0301043 1.096393 1.214718
gesta | 450 2.324444 .0732 2.180587 2.468301
nprenat | 414 8.623188 .16236 8.304033 8.942343-------------+---------------------------------------------------------------
Tabela 2 x 2
Associação entre 2 variáveis categóricas
Comparar a ocorrência de uma variável binária
(desfecho) entre as categorias de outra variável
binária (exposição)
Na tabela vai haver apenas 2 linhas e 2 colunas com
dados
As linhas e colunas correspondem às categorias de cada
variável
Tabela 2 x 2
Por convenção as linhas correspondem a
exposição e as colunas ao desfecho (Kirkwood)
Mas nem todos os autores fazem desta forma...
O importante é que os % demonstrados sejam
da variável de exposição
Tabela 2×2 padrão
exposição + – + a b n1 – c d n2 do
ença
m1 m2 N
exposição + – + a b n1 – c d n2 do
ença
m1 m2 N
Exemplo de Tabela 2×2
Desfecho = chiado no peito (s/n) linha
Exposição = mama no peito aos 12 meses (s/n) coluna
Teste do qui-quadrado
Permite examinar se existe associação entre a
variável da linha e a da coluna
Em outras palavras....verifica se a distribuição dos
indivíduos entre as categorias de uma variável é
independente da sua distribuição entre as categorias
da outra variável
Exemplo: qui-quadrado em tabela 2x2
INFLUENZA TOTAL
SIM NÃO
VACINA 20 (8,3%) 220 (91,7%) 240
PLACEBO 80 (36,4%) 140 (63,6%) 220
TOTAL 100 (21,7%) 360 (78,3%) 460
Estudo realizado durante uma epidemia de influenza
Perguntas:
Quantos indivíduos contraíram influenza?
Quantos indivíduos foram vacinados?
INFLUENZA TOTAL
SIM NÃO
VACINA 20 (8,3%) 220 (91,7%) 240
PLACEBO 80 (36,4%) 140 (63,6%) 220
TOTAL 100 (21,7%) 360 (78,3%) 460
R: 100
R: 240
Perguntas:
Que percentagem de indivíduos contraíram influenza dentre os
vacinados?
Que percentagem de indivíduos contraíram influenza dentre os
que receberam placebo?
INFLUENZA TOTAL
SIM NÃO
VACINA 20 (8,3%) 220 (91,7%) 240
PLACEBO 80 (36,4%) 140 (63,6%) 220
TOTAL 100 (21,7%) 360 (78,3%) 460
R: 20/240 * 100 = 8,3%
R: 280/220 * 100= 36,4%
Perguntas:
O fato de vacinar, afeta a probabilidade
dos indivíduos de contrair influenza?
Aparentemente sim, mas é preciso testar
estatisticamente para ver a probabilidade de
as diferenças encontradas terem ocorrido ao
acaso
Testar uma associação
Teste de qui-quadrado (2)
compara os valores observados em cada
uma das 4 categorias da tabela 2 x 2 com
os valores esperados se não existisse
nenhuma diferença entre receber vacina ou
placebo
Teste do qui-quadrado
O valor esperado para a é:
Nnm
aNm
na 111
1
influenza + – + a b n1 – c d n2 va
cina
m1 m2 N
Teste de qui-quadrado
Globalmente 100/460 (0,22) contraíram
influenza
Se a vacina e placebo são igualmente efetivos,
esperaríamos essa mesma proporção entre
vacinados = 0,21739... * 240=52,2
placebo = 0,21739...... * 220=47,8
Teste qui-quadrado
INFLUENZA TOTAL
SIM NÃO
VACINA 52,2 187,8 240
PLACEBO 47,8 172,2 220
TOTAL 100 360 460
Valores esperados
Obtenção do valor do qui-quadrado
(observados – esperados )² / esperados
...Isso para cada uma das 4 caselas da tabela de contingência
Quanto maior a diferença entre valores observados e esperados, maior o valor de 2
gl
E
EO1
22
2 ~
Aplicando o teste do ²
Para o teste ser válido: Valor esperado (E) 5 em todas as caselas
Fórmula para cálculo na mão:
2121
22 )(
mmnn
Nbcad
influenza + – + a b n1 – c d n2 va
cina
m1 m2 N
Aplicando o teste do ²
Fórmula para cálculo na mão:
0,001 p devalor
1 d.f. ; 53,01220 * 240* 360 * 100
460)220* 80140* 20( 22
exposição + – + 20 220 240 – 80 140 220
doen
ça
100 360 460
Aplicando o teste do ²
Valor encontrado do ² = 53,09
Procurar a correspondência com valor-p na
tabela de distribuição ²
Para isso é necessário conhecer o nº de graus
de liberdade (Linhas – 1)x (Colunas – 1)
Tabela 2x2: (2-1)x(2-1) = 1 grau de liberdade
Observando a tabela do ²
O valor calculado (53,09) é maior que o maior
valor da primeira linha da tabela correspondente
a 1G.L. (10,83)
10,83 é o ponto de probabilidade = 0,1% na
distribuição ² com 1 G.L., logo, o valor-p para o
teste é < 0,001
Conclusão do teste do ²
Em nosso exemplo valor-p < 0,001
Existe uma probabilidade muito pequena de que a diferença
entre os % de influenza encontrados no grupo de vacinados e
no grupo de placebo possa ter sido obtida ao acaso (< 0,1%)
Correção de continuidade
Teste ² pode ser melhorado usando a correção
de continuidade de Yates:
Esta quantidade tem distribuição ² com 1 grau
de liberdade
Neste caso o valor de 53,09 ficaria em 51,46
gl
E
EO1
2
2
2 ~5,0
Correção de continuidade
Correção de continuidade de Yates é útil se o tamanho
amostral é <40 ou os números esperados são
pequenos
Se os números esperados são muito pequenos ou se o
total geral da tabela <20 Teste exato
O ² é válido quando
N total > 40, independente dos valores esperados
N total entre 20 e 40, sendo todos os valores esperados > 4
Teste exato de Fisher
Se a aproximação pela ² não é boa
Teste exato
Usado quando os valores esperados são muito
pequenos
N total da tabela < 20, ou
N total entre 20 e 40 e o menor dos 4 valores
esperados é <5
Testes na prática
Hoje o cálculo do teste exato é muito rápido,
exceto para tabelas r x c onde r ou c >2
Conclusão:
Aplicar sempre o teste exato na análise de tabelas
2 x 2
Teste do ² ou exato de Fisher?
Mortos Vivem Total
ATB novo 0 10 10
ATB habitual 4 8 12
Total 4 18 22
Pearson chi2(1) = 4,02 P = 0,0435
Fisher's exact P = 0,0964
Teste do ² ou exato de Fisher?
Mortos Vivem Total
ATB novo 650 350 1000
ATB habitual 600 400 1000
Total 1250 750 2000
Pearson chi2(1) = 5,3 P = 0,021
Fisher's exact P = 0,024
SSeexxoo BBPPNN nnoorrmmaaiiss TToottaall
MMeenniinnooss 5500 445500 550000
MMeenniinnaass 4400 446600 550000
TToottaall 9900 991100 11000000
p1 = 50/500=0,10=10% p2 = 40/500 = 0,08=8%
Será que a proporção de BPN é a mesma nos dois sexos?
Outro exemplo: BPN
Hipóteses
Ho: a proporção de BPN é a mesma nos dois sexos (hipótese de independência ou não associação)
H1: a proporção de BPN não é a mesma nos dois sexos (hipótese de dependência ou associação)
Outro exemplo: BPN
Sexo BPN normais Total
Meninos 50 (45) 450 (455) 500
Meninas 40 (45) 460 (455) 500
Total 90 910 1000
Outro exemplo: BPN
Comparar as freqüências observadas com as freqüências esperadas (E) sob a hipótese de nulidade Ho
Outro exemplo: BPN
Será que as diferenças são suficientemente grandes para que se possa rejeitar a hipótese Ho? Calcular ² a partir da amostra:
² = 0,989 valor-p = 32% (> 5%)
Não rejeitar H0 não existe
associação entre sexo e BPN
Exemplo: tabela de resultados
Tabela – Prevalência de baixo peso ao nascer (BPN) conforme sexo, Pelotas 2004.
Característica N BPN (%)
Total N
Valor-p1
Sexo 0,3
masculino 50 10 500
feminino 40 8 500
1 teste exato de Fisher
Tabelas 2×k
Consideramos um desfecho dicotômico
Se as k categorias não são ordenadas testa-se associação usando ² geral
i j ij
ijijglk E
EO 2
2)1(
Exemplo
Tabela – Uso de preservativo entre escolares, de acordo com religião
Exposição Não usa O (E)
Usa O (E)
Total
Religião
Nenhuma 44 (52) 345 (337) 389 Católica 145 (149) 969 (965) 1114 Espírita 21 (25) 164 (160) 185
Protestante 44 (30) 182 (196) 226
Afro-brasileira 4 (6) 44 (42) 48
Evangélica 7 (3) 13 (17) 20
Outras 2 (2) 10 (10) 12 Total 267 1727 1994
Pearson ²(6) = 18,7; p = 0,005
Exemplo
Tabela – Uso de preservativo entre escolares, de acordo com religião
Exposição Não usa N (%)
Total Valor-p1
Religião 0,005
Nenhuma 44 (11) 389
Católica 145 (13) 1114
Espírita 21 (11) 185
Protestante 44 (19) 226
Afro-brasileira 4 (8) 48
Evangélica 7 (35) 20
Outras 2 (17) 12
Total 267 1994 1 teste de Pearson
Tabelas 2×k: categorias ordenadas
Além de avaliar associação
Avaliar se há uma tendência prevalências aumentam ou diminuem
² com k-1 gl é dividido parte devido à tendência (1 gl)
resto
Método de análise “muito mais poderoso”
Exemplo
Tabela – Distribuição do no. de filhos nas famílias, de acordo com classe social
Exposição N filhos<5
N (%) N filhos5
N (%) Total
Classe social
Alta 88 (92) 8 (8) 96 Média alta 113 (91) 11 (9) 124 Média baixa 87 (84) 16 (16) 103
Baixa 85 (83) 18 (17) 103 Total 373 53 426
Pearson Pearson ²(3) = 6,24; p = 0,10²(3) = 6,24; p = 0,10Tendência linear z = 2,36; p = 0,02Tendência linear z = 2,36; p = 0,02
Idade x uso de medicamentos
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
20 a 29
30 a 39
40 a 49
50 a 59
60 a 69
70 ou +
Homens
Mulheres
P < 0,001 para ambos os sexos (teste para tendência linear)
Dúvidas?