Wykład 10 Układ zrandomizowany blokowy

Wykład 10Układ zrandomizowany blokowy

• Staramy się kontrolować zróżnicowanie badanych obiektów poprzez zapewnienie ``jednorodności’’ obiektów w każdej grupie zabiegowej.

• Najpierw dzielimy obiekty na bloki.• Co to są bloki ?Blok to jednorodna grupa obiektówChcemy aby obiekty w jednym bloku miały

podobne wartości zmiennych ``zakłócających’’.

Przykłady bloków

• Owocówki z jednej linii wsobnej

• Pacjenci podobni pod względem wieku, płci, diagnozy i/lub historii choroby

• Rośliny rosnące blisko siebie w cieplarni

• Rośliny kukurydzy rosnące na tym samym fragmencie pola

Przyporządkowanie

• Obiekty dzielimy na jednorodne bloki• Dokonujemy randomizacji (losowego

przyporządkowania obiektów do poszczególnych zabiegów) w obrębie każdego z bloków

• To zapewnia, że w każdej grupie zabiegowej mamy tę samą liczbę obiektów z każdego bloku

• Tak więc ``wstępne’’ rozkłady badanej cechy w grupach zabiegowych są do siebie podobne.

Przykład

• Porównujemy efekt działania nowego lekarstwa z placebo

• Obiekty – ochotniczki, u których w ciągu ostatniego roku stwierdzono raka piersi

• Niektóre miały lumpektomię, inne radykalną mastektomię (2)

• Niektóre były poddane naświetlaniom, inne nie (2)• U niektórych zidentyfikowano ryzyko genetyczne

BRCA1, BRCA2, u innych nie (3)• Te czynniki są znane ale nie kontrolowane w tym

badaniu

• Dzielimy pacjentki na 223=12 bloków, tzn. lumpektomia, naświetlania, BRCA1 lumpektomia, naświetlania, BRCA2, …. mastektomia, brak naświetlań, nie

zidentyfikowano ryzyka genetycznego

• Potem w każdym bloku losowo wybrana połowa kobiet otrzymuje lekarstwo, a druga połowa placebo

• To zapewnia, że grupy kobiet biorących lekarstwo i placebo mają w przybliżeniu tą samą strukturę

• Inne czynniki używane do blokowania:Laboratorium lub osoba dokonująca pomiarówLaboratorium lub osoba wykonująca zabiegGeografiaGenetykaCzynniki socjo-ekonomiczneBlokujemy tylko względem tych czynników,

które mogą mieć wpływ na odpowiedź.

• Stratyfikacja• ``Blokowanie’’ względem zmiennej, której

wartości można uporządkować (często ciągłej). Wtedy dzielimy na ``warstwy’’ a nie na bloki.

• PrzykładyNiskie, średnie, wysokie dochodyGrupy wiekoweStopień rozwoju choroby• Randomizujemy w obrębie każdej warstwy.• Czasami definiujemy warstwy przed

próbkowaniem, aby pobrać podobną liczbę obserwacji z każdej warstwy: próbkowanie warstwowe.

Powiązane pary

• Obserwacje występują w parach

• Takich jak:Układ blokowy dwuzabiegowy, gdzie

każdy blok składa się z dwu obiektówDwa pomiary na tym samym obiekcie

(dwa dni, dwie strony, przed/po…)Obserwujemy dwie grupy w czasie

Przykłady:

• Obiekty naturalnie występują w parach, takich jak pary identycznych blizniaków

• Obiekty łaczymy w pary o podobnym wieku, płci, zawodzie, stanie rozwoju choroby, etc

• Ten sam obiekt mierzony przy dwu okazjach

Test Studenta dla powiązanych par

• Do produkcji butów używamy dwóch różnych materiałów, A i B.

• Obserwacje: zużycie podeszew w butach noszonych przez 10 chłopców.– Każdy chłopiec ma podeszwę w jednym bucie

zrobioną z materiału A, a w drugim z materiału B

– Randomizujemy (lewy albo prawy)

Chłopiec A B A-B

1 13.2 14.0 -0.8

2 8.2 8.8 -0.6

… … … ….

10 13.3 13.6 -0.3

średnia -0.41

s 0.38

Zużycie podeszew

boys

we

ar

2 4 6 8 10

81

01

21

4

81

01

21

4

A B

b -

a

2 4 6 8 10

-0.2

0.0

0.2

0.4

0.6

0.8

1.0

• Hipoteza– H0 : d = A - B=0

– Ha : d ≠ 0

• Liczymy d= Y1- Y2, średnią(d), SD(d), SE(d)

• liczymy ts = średnia(d)/SE(d) =

• df = nd-1=

• P-wartość=

• Co się stanie jeżeli wykorzystamy test Studenta dla

prób niezależnych ?• Ta sama hipoteza

=10.63, =11.04

• =1.11

• ts=(10.63-11.04)/1.11=-0.369

• P-wartość =

1Y 2Y

1 2Y YSE

Skąd taka rozbieżność?

• Bardzo różne SE– Test dla par : SE = 0.12– Test dla dwóch niezależnych prób: SE=1.11

• Jeżeli jest duże zróżnicowanie między obiektami może ono ukryć wpływ zabiegu

• To zróżnicowanie można zredukować łącząc obiekty w pary

• Skąd wiadomo czy użyć testu dla par czy testu dla niezależnych prób ?

• Na ogół łatwo stwierdzić czy istnieją naturalne pary obiektów z jednej i drugiej grupy zabiegowej.

• Kiedy zaplanować eksperyment w oparciu o powiązane pary ?

• Trudniejsze: oczekujemy, że zmienne zakłócające mogą istotnie zwiększyć rozrzut wyników i staramy się utworzyć dwuelementowe bloki, jednorodne ze względu na zmienne zakłócające.

Założenie

• Test Studenta dla par jest oparty na założeniu, że różnice mają w przybliżeniu rozkład normalny.

Test znaków

• Co zrobić jeżeli obserwacje nie mają rozkładu normalnego ?

• Dla dwóch niezależnych prób liczyliśmy test Wilcoxona-Manna-Whitneya.

• Gdy występują sparowane obserwacje możemy zastosować test znaków.

• Patrzymy na znak różnicy między każdą parą obserwacji.

• Jeżeli zabiegi się nie różnią, liczba plusów powinna być w przybliżeniu równa liczba minusów lub inaczej p-stwo, że w dowolnej parze dostaniemy plus powinno być równe

= p-stwo, że w dowolnej ustalonej parze pierwszy zabieg daje lepszy wynik niż drugi.

• H0: =

• HA:

• Dla każdej pary obserwacji zapisujemy (+) gdy y1–y2 jest dodatnie lub (–) gdy jest ujemne

• Zliczamy liczbę + (= N+) i – (= N–) (nie liczymy zer)

• Statystyka testowa Bs = max( N+, N– ) (dla testu dwustronnego)

• Wartości krytyczne na kolejnym slajdzie. n = #par z niezerowymi wynikami.

• Tabela daje wartości krytyczne dla testu jedno i dwustronnego

• Odrzucamy H0 gdy Bs wartości krytycznej

• Można także policzyć p-wartości korzystając ze wzorów na rozkład Bernoulliego.

• CRITICAL VALUES FOR THE SIGN TEST, N = 5..44 |

• Alpha |• 1 Sided 0.05 0.025 0.01 0.005 0.0025 0.001 |• 2 Sided (0.10) (0.05) (0.02) (0.01) (0.005) (0.002) |• ------+-------------------------------------------------+----• N | • ----| • 5 | 5 . . . . . • 6 | 6 6 . . . . • 7 | 7 7 7 . . . • 8 | 7 8 8 8 . . • 9 | 8 8 9 9 9 . • | |• 10 | 9 9 10 10 10 10 • 11 | 9 10 10 11 11 11 • 12 | 10 10 11 11 12 12 • 13 | 10 11 12 12 12 13 • 14 | 11 12 12 13 13 13 • | |• 15 | 12 12 13 13 14 14 • 16 | 12 13 14 14 14 15 • 17 | 13 13 14 15 15 16 • 18 | 13 14 15 15 16 16 • 19 | 14 15 15 16 16 17 • | |• 20 | 15 15 16 17 17 18 • 21 | 15 16 17 17 18 18 • 22 | 16 17 17 18 18 19 • 23 | 16 17 18 19 19 20 • 24 | 17 18 19 19 20 20 • • This public domain table was made by APL programs written by the author.• William Knight <http://www.math.unb.ca/~knight> Friday,

• CRITICAL VALUES FOR THE SIGN TEST, N =25..44 |• Alpha |• 1 Sided 0.05 0.025 0.01 0.005 0.0025 0.001 |• 2 Sided (0.10) (0.05) (0.02) (0.01) (0.005) (0.002) |

• 25 | 18 18 19 20 20 21 • 26 | 18 19 20 20 21 22 • 27 | 19 20 20 21 22 22 • 28 | 19 20 21 22 22 23 • 29 | 20 21 22 22 23 24 • | |• 30 | 20 21 22 23 24 24 • 31 | 21 22 23 24 24 25 • 32 | 22 23 24 24 25 26 • 33 | 22 23 24 25 25 26 • 34 | 23 24 25 25 26 27 • | |• 35 | 23 24 25 26 27 27 • 36 | 24 25 26 27 27 28 • 37 | 24 25 27 27 28 29 • 38 | 25 26 27 28 29 29 • 39 | 26 27 28 28 29 30 • | |• 40 | 26 27 28 29 30 31 • 41 | 27 28 29 30 30 31 • 42 | 27 28 29 30 31 32 • 43 | 28 29 30 31 32 32 • 44 | 28 29 31 31 32 33

• This public domain table was made by APL programs written by the author.• William Knight <http://www.math.unb.ca/~knight> Friday,

• Dla testu jednostronnego

• HA jest albo < 0.5 (w dowolnej parze druga obserwacja ma większą szansę być większa) (Bs = N–)

lub HA jest > 0.5; (w dowolnej parze pierwsza obserwacja ma większą szansę być większa) (Bs = N+)

P-wartość

• Gdy HA jest > 0.5, wtedy Bs = N+, i P-wartość jest Pr(Y Bs )

• Gdy HA jest < 0.5, wtedy Bs = N–, i P-wartość jest Pr(Y Bs )

• Gdy HA jest 0.5, wtedy Bs = max(N+, N–), i P-wartość = 2Pr(Y Bs )

• gdzie Y ma rozkład Bernoulliego (n, 0.5)

Przykład: przeszczepy skóry

• Po dwóch stronach ciała 11 ochotników zastosowano przeszczepy skóry.

• Jeden przeszczep ma dobre dopasowanie HLA z odbiorca, drugi nie.

• Obserwujemy czas do odrzucenia przeszczepu (nie ma rozkładu normalnego więc nie można stosować testu Studenta).

• Czy dobre dopasowanie HLA zwiększa czas przetrwania przeszczepu ?

dobre 37 19 57 93 16 23 20 63 29 60 18

złe 29 13 15 26 11 18 26 43 18 42 19

znak + + + + + + - + + + -

• Testu znaków używamy gdyDane nie mają rozkładu normalnegoGdy dane zapisane są w postaci

preferencji a nie wielkości liczbowej, np. lepsze/gorsze, mniejsze/większe itp.

Test znakowany Wilcoxona

• Podobny do testu znaków ale bardziej czuły• Metoda

– Liczymy różnice w parach– Znajdujemy wartość bezwzględną– Przyporządkowujemy rangi wartościom

bezwzględnym (1 dla najmniejszej, n dla największej)– Każdej randze przyporządkowujemy jej znak (+,-)

– W+ : suma rang dodatnich

– W- : suma rang ujemnych

– Ws : min(W+, W-)

– Odrzucamy H0 gdy Ws ≤ wartość krytyczna

– Tabela wartości krytycznych jest dostępna w kartotece z wykładami.

Obs Y1 Y2 d |d| Rank Sign+R

1 33 25 8 8 6 6

2 39 38 1 1 1 1

3 25 27 -2 2 2 -2

4 29 20 9 9 7 7

5 50 54 -4 4 3 -3

6 45 40 5 5 4 4

7 36 30 6 6 5 5

Przed & Po vs. Grupa kontrolna

• Czasami obserwujemy obiekty przed i po pewnym zabiegu i mierzymy wpływ zabiegu na poszczególne obiekty

Dostajemy pary zależnych obserwacji• Czasami parujemy podobne (ze względu

na zmienne zakłócające) obiekty z grupy zabiegowej i kontrolnej

• Również dostajemy pary zależnych obserwacji

• Czasami obiektów w grupie kontrolnej i zabiegowej nie można w naturalny sposób połączyć w pary

takie obserwacje traktujemy jako dwie niezależne próby

• Czasami oczekujemy, że obiekty w naturalny sposób się zmieniają w trakcie eksperymentu.

Chcemy odróżnić zmiany wywołane zabiegiem od zmian wynikających z upływu czasu

Obserwujemy grupę zabiegową i kontrolną przed i po zabiegu

Obiekty w grupie kontrolnej dostarczają nam informacji jakiej zmiany należy oczekiwać jedynie w wyniku upływu czasu

Obiekty w grupie zabiegowej dostarczają nam informacji o wpływie zabiegu

Cztery grupy obserwacji

Możemy porównać obiekty z grupy zabiegowej przed i po zabiegu za pomocą testu dla par

Również obiekty z grupy kontrolnej możemy porównać przed i po zabiegu za pomocą testu dla par

Dowiemy się czy była zmienność w każdej z grup

Naprawdę interesuje nas porównanie zmian wartości cechy (przed i po zabiegu)

Zwykle w takim przypadku analizujemy różnice po-przed za pomocą testu dla dwu prób

Documents

Wykład 10 Układ zrandomizowany blokowy