Upload
heaton
View
90
Download
0
Embed Size (px)
DESCRIPTION
Wykład 10 Układ zrandomizowany blokowy. Staramy się kontrolować zróżnicowanie badanych obiektów poprzez zapewnienie ``jednorodności’’ obiektów w każdej grupie zabiegowej. Najpierw dzielimy obiekty na bloki. Co to są bloki ? Blok to jednorodna grupa obiektów - PowerPoint PPT Presentation
Citation preview
Wykład 10Układ zrandomizowany blokowy
• Staramy się kontrolować zróżnicowanie badanych obiektów poprzez zapewnienie ``jednorodności’’ obiektów w każdej grupie zabiegowej.
• Najpierw dzielimy obiekty na bloki.• Co to są bloki ?Blok to jednorodna grupa obiektówChcemy aby obiekty w jednym bloku miały
podobne wartości zmiennych ``zakłócających’’.
Przykłady bloków
• Owocówki z jednej linii wsobnej
• Pacjenci podobni pod względem wieku, płci, diagnozy i/lub historii choroby
• Rośliny rosnące blisko siebie w cieplarni
• Rośliny kukurydzy rosnące na tym samym fragmencie pola
Przyporządkowanie
• Obiekty dzielimy na jednorodne bloki• Dokonujemy randomizacji (losowego
przyporządkowania obiektów do poszczególnych zabiegów) w obrębie każdego z bloków
• To zapewnia, że w każdej grupie zabiegowej mamy tę samą liczbę obiektów z każdego bloku
• Tak więc ``wstępne’’ rozkłady badanej cechy w grupach zabiegowych są do siebie podobne.
Przykład
• Porównujemy efekt działania nowego lekarstwa z placebo
• Obiekty – ochotniczki, u których w ciągu ostatniego roku stwierdzono raka piersi
• Niektóre miały lumpektomię, inne radykalną mastektomię (2)
• Niektóre były poddane naświetlaniom, inne nie (2)• U niektórych zidentyfikowano ryzyko genetyczne
BRCA1, BRCA2, u innych nie (3)• Te czynniki są znane ale nie kontrolowane w tym
badaniu
• Dzielimy pacjentki na 223=12 bloków, tzn. lumpektomia, naświetlania, BRCA1 lumpektomia, naświetlania, BRCA2, …. mastektomia, brak naświetlań, nie
zidentyfikowano ryzyka genetycznego
• Potem w każdym bloku losowo wybrana połowa kobiet otrzymuje lekarstwo, a druga połowa placebo
• To zapewnia, że grupy kobiet biorących lekarstwo i placebo mają w przybliżeniu tą samą strukturę
• Inne czynniki używane do blokowania:Laboratorium lub osoba dokonująca pomiarówLaboratorium lub osoba wykonująca zabiegGeografiaGenetykaCzynniki socjo-ekonomiczneBlokujemy tylko względem tych czynników,
które mogą mieć wpływ na odpowiedź.
• Stratyfikacja• ``Blokowanie’’ względem zmiennej, której
wartości można uporządkować (często ciągłej). Wtedy dzielimy na ``warstwy’’ a nie na bloki.
• PrzykładyNiskie, średnie, wysokie dochodyGrupy wiekoweStopień rozwoju choroby• Randomizujemy w obrębie każdej warstwy.• Czasami definiujemy warstwy przed
próbkowaniem, aby pobrać podobną liczbę obserwacji z każdej warstwy: próbkowanie warstwowe.
Powiązane pary
• Obserwacje występują w parach
• Takich jak:Układ blokowy dwuzabiegowy, gdzie
każdy blok składa się z dwu obiektówDwa pomiary na tym samym obiekcie
(dwa dni, dwie strony, przed/po…)Obserwujemy dwie grupy w czasie
Przykłady:
• Obiekty naturalnie występują w parach, takich jak pary identycznych blizniaków
• Obiekty łaczymy w pary o podobnym wieku, płci, zawodzie, stanie rozwoju choroby, etc
• Ten sam obiekt mierzony przy dwu okazjach
Test Studenta dla powiązanych par
• Do produkcji butów używamy dwóch różnych materiałów, A i B.
• Obserwacje: zużycie podeszew w butach noszonych przez 10 chłopców.– Każdy chłopiec ma podeszwę w jednym bucie
zrobioną z materiału A, a w drugim z materiału B
– Randomizujemy (lewy albo prawy)
Chłopiec A B A-B
1 13.2 14.0 -0.8
2 8.2 8.8 -0.6
… … … ….
10 13.3 13.6 -0.3
średnia -0.41
s 0.38
Zużycie podeszew
boys
we
ar
2 4 6 8 10
81
01
21
4
81
01
21
4
A B
b -
a
2 4 6 8 10
-0.2
0.0
0.2
0.4
0.6
0.8
1.0
• Hipoteza– H0 : d = A - B=0
– Ha : d ≠ 0
• Liczymy d= Y1- Y2, średnią(d), SD(d), SE(d)
• liczymy ts = średnia(d)/SE(d) =
• df = nd-1=
• P-wartość=
• Co się stanie jeżeli wykorzystamy test Studenta dla
prób niezależnych ?• Ta sama hipoteza
=10.63, =11.04
• =1.11
• ts=(10.63-11.04)/1.11=-0.369
• P-wartość =
1Y 2Y
1 2Y YSE
Skąd taka rozbieżność?
• Bardzo różne SE– Test dla par : SE = 0.12– Test dla dwóch niezależnych prób: SE=1.11
• Jeżeli jest duże zróżnicowanie między obiektami może ono ukryć wpływ zabiegu
• To zróżnicowanie można zredukować łącząc obiekty w pary
• Skąd wiadomo czy użyć testu dla par czy testu dla niezależnych prób ?
• Na ogół łatwo stwierdzić czy istnieją naturalne pary obiektów z jednej i drugiej grupy zabiegowej.
• Kiedy zaplanować eksperyment w oparciu o powiązane pary ?
• Trudniejsze: oczekujemy, że zmienne zakłócające mogą istotnie zwiększyć rozrzut wyników i staramy się utworzyć dwuelementowe bloki, jednorodne ze względu na zmienne zakłócające.
Założenie
• Test Studenta dla par jest oparty na założeniu, że różnice mają w przybliżeniu rozkład normalny.
Test znaków
• Co zrobić jeżeli obserwacje nie mają rozkładu normalnego ?
• Dla dwóch niezależnych prób liczyliśmy test Wilcoxona-Manna-Whitneya.
• Gdy występują sparowane obserwacje możemy zastosować test znaków.
• Patrzymy na znak różnicy między każdą parą obserwacji.
• Jeżeli zabiegi się nie różnią, liczba plusów powinna być w przybliżeniu równa liczba minusów lub inaczej p-stwo, że w dowolnej parze dostaniemy plus powinno być równe
= p-stwo, że w dowolnej ustalonej parze pierwszy zabieg daje lepszy wynik niż drugi.
• H0: =
• HA:
• Dla każdej pary obserwacji zapisujemy (+) gdy y1–y2 jest dodatnie lub (–) gdy jest ujemne
• Zliczamy liczbę + (= N+) i – (= N–) (nie liczymy zer)
• Statystyka testowa Bs = max( N+, N– ) (dla testu dwustronnego)
• Wartości krytyczne na kolejnym slajdzie. n = #par z niezerowymi wynikami.
• Tabela daje wartości krytyczne dla testu jedno i dwustronnego
• Odrzucamy H0 gdy Bs wartości krytycznej
• Można także policzyć p-wartości korzystając ze wzorów na rozkład Bernoulliego.
• CRITICAL VALUES FOR THE SIGN TEST, N = 5..44 |
• Alpha |• 1 Sided 0.05 0.025 0.01 0.005 0.0025 0.001 |• 2 Sided (0.10) (0.05) (0.02) (0.01) (0.005) (0.002) |• ------+-------------------------------------------------+----• N | • ----| • 5 | 5 . . . . . • 6 | 6 6 . . . . • 7 | 7 7 7 . . . • 8 | 7 8 8 8 . . • 9 | 8 8 9 9 9 . • | |• 10 | 9 9 10 10 10 10 • 11 | 9 10 10 11 11 11 • 12 | 10 10 11 11 12 12 • 13 | 10 11 12 12 12 13 • 14 | 11 12 12 13 13 13 • | |• 15 | 12 12 13 13 14 14 • 16 | 12 13 14 14 14 15 • 17 | 13 13 14 15 15 16 • 18 | 13 14 15 15 16 16 • 19 | 14 15 15 16 16 17 • | |• 20 | 15 15 16 17 17 18 • 21 | 15 16 17 17 18 18 • 22 | 16 17 17 18 18 19 • 23 | 16 17 18 19 19 20 • 24 | 17 18 19 19 20 20 • • This public domain table was made by APL programs written by the author.• William Knight <http://www.math.unb.ca/~knight> Friday,
• CRITICAL VALUES FOR THE SIGN TEST, N =25..44 |• Alpha |• 1 Sided 0.05 0.025 0.01 0.005 0.0025 0.001 |• 2 Sided (0.10) (0.05) (0.02) (0.01) (0.005) (0.002) |
• 25 | 18 18 19 20 20 21 • 26 | 18 19 20 20 21 22 • 27 | 19 20 20 21 22 22 • 28 | 19 20 21 22 22 23 • 29 | 20 21 22 22 23 24 • | |• 30 | 20 21 22 23 24 24 • 31 | 21 22 23 24 24 25 • 32 | 22 23 24 24 25 26 • 33 | 22 23 24 25 25 26 • 34 | 23 24 25 25 26 27 • | |• 35 | 23 24 25 26 27 27 • 36 | 24 25 26 27 27 28 • 37 | 24 25 27 27 28 29 • 38 | 25 26 27 28 29 29 • 39 | 26 27 28 28 29 30 • | |• 40 | 26 27 28 29 30 31 • 41 | 27 28 29 30 30 31 • 42 | 27 28 29 30 31 32 • 43 | 28 29 30 31 32 32 • 44 | 28 29 31 31 32 33
• This public domain table was made by APL programs written by the author.• William Knight <http://www.math.unb.ca/~knight> Friday,
• Dla testu jednostronnego
• HA jest albo < 0.5 (w dowolnej parze druga obserwacja ma większą szansę być większa) (Bs = N–)
lub HA jest > 0.5; (w dowolnej parze pierwsza obserwacja ma większą szansę być większa) (Bs = N+)
P-wartość
• Gdy HA jest > 0.5, wtedy Bs = N+, i P-wartość jest Pr(Y Bs )
• Gdy HA jest < 0.5, wtedy Bs = N–, i P-wartość jest Pr(Y Bs )
• Gdy HA jest 0.5, wtedy Bs = max(N+, N–), i P-wartość = 2Pr(Y Bs )
• gdzie Y ma rozkład Bernoulliego (n, 0.5)
Przykład: przeszczepy skóry
• Po dwóch stronach ciała 11 ochotników zastosowano przeszczepy skóry.
• Jeden przeszczep ma dobre dopasowanie HLA z odbiorca, drugi nie.
• Obserwujemy czas do odrzucenia przeszczepu (nie ma rozkładu normalnego więc nie można stosować testu Studenta).
• Czy dobre dopasowanie HLA zwiększa czas przetrwania przeszczepu ?
dobre 37 19 57 93 16 23 20 63 29 60 18
złe 29 13 15 26 11 18 26 43 18 42 19
znak + + + + + + - + + + -
• Testu znaków używamy gdyDane nie mają rozkładu normalnegoGdy dane zapisane są w postaci
preferencji a nie wielkości liczbowej, np. lepsze/gorsze, mniejsze/większe itp.
Test znakowany Wilcoxona
• Podobny do testu znaków ale bardziej czuły• Metoda
– Liczymy różnice w parach– Znajdujemy wartość bezwzględną– Przyporządkowujemy rangi wartościom
bezwzględnym (1 dla najmniejszej, n dla największej)– Każdej randze przyporządkowujemy jej znak (+,-)
– W+ : suma rang dodatnich
– W- : suma rang ujemnych
– Ws : min(W+, W-)
– Odrzucamy H0 gdy Ws ≤ wartość krytyczna
– Tabela wartości krytycznych jest dostępna w kartotece z wykładami.
Obs Y1 Y2 d |d| Rank Sign+R
1 33 25 8 8 6 6
2 39 38 1 1 1 1
3 25 27 -2 2 2 -2
4 29 20 9 9 7 7
5 50 54 -4 4 3 -3
6 45 40 5 5 4 4
7 36 30 6 6 5 5
Przed & Po vs. Grupa kontrolna
• Czasami obserwujemy obiekty przed i po pewnym zabiegu i mierzymy wpływ zabiegu na poszczególne obiekty
Dostajemy pary zależnych obserwacji• Czasami parujemy podobne (ze względu
na zmienne zakłócające) obiekty z grupy zabiegowej i kontrolnej
• Również dostajemy pary zależnych obserwacji
• Czasami obiektów w grupie kontrolnej i zabiegowej nie można w naturalny sposób połączyć w pary
takie obserwacje traktujemy jako dwie niezależne próby
• Czasami oczekujemy, że obiekty w naturalny sposób się zmieniają w trakcie eksperymentu.
Chcemy odróżnić zmiany wywołane zabiegiem od zmian wynikających z upływu czasu
Obserwujemy grupę zabiegową i kontrolną przed i po zabiegu
Obiekty w grupie kontrolnej dostarczają nam informacji jakiej zmiany należy oczekiwać jedynie w wyniku upływu czasu
Obiekty w grupie zabiegowej dostarczają nam informacji o wpływie zabiegu
Cztery grupy obserwacji
Możemy porównać obiekty z grupy zabiegowej przed i po zabiegu za pomocą testu dla par
Również obiekty z grupy kontrolnej możemy porównać przed i po zabiegu za pomocą testu dla par
Dowiemy się czy była zmienność w każdej z grup
Naprawdę interesuje nas porównanie zmian wartości cechy (przed i po zabiegu)
Zwykle w takim przypadku analizujemy różnice po-przed za pomocą testu dla dwu prób