15
Copyright © StatSoft Polska 2011, [email protected] 50 METAANALIZA I METAREGRESJA W PROGRAMIE STATISTICA ZESTAW MEDYCZNY Michał Kusy, StatSoft Polska Sp. z o.o. Statystyczne metody łączenia wyników pochodzących z niezależnych badań muszą często radzić sobie z problemami wynikającymi ze zmienności między badaniami. Mimo że meta- analiza pozwala połączyć wyniki z badań pierwotnych w postaci efektu łącznego, jej celem nie jest sprowadzenie wszystkich wartości do jednej miary efektu. Dobrze oddaje to wykres leśny, przedstawiający uzyskany efekt łączny w kontekście poszczególnych badań i ich zmienności. W kolejnych rozdziałach przedstawimy przykład wykonania metaanalizy w programie STATISTICA Zestaw Medyczny. Do oceny zmienności wyników wykorzysta- my analizę niejednorodności. Szukając przyczyn tej zmienności, sięgniemy do analizy w grupach i metaregresji, aby sprawdzić powiązania między efektem i wybranymi charak- terystykami badania. Badania Przedstawiane analizy opierają się na danych pochodzących z analizy skuteczności szcze- pienia BCG w profilaktyce gruźlicy. Szczepionka BCG (Bacillus Calmette-Guérin) zapo- biegająca rozwojowi gruźlicy została opracowana we Francji przez Alberta Calmette i Camille'a Guérin. Obecnie Światowa Organizacja Zdrowia (WHO) zaleca jej stosowanie w ramach programu szczepień ochronnych w krajach o podwyższonym ryzyku zachoro- wania na gruźlicę. Mimo że szczepionkę wprowadzono do użycia w 1921 roku, jej sku- teczność często poddawano w wątpliwość. Dostępne wyniki badań wahają się od wartości wskazujących na przypuszczalną szkodliwość szczepienia do prawie 80% skuteczności. W latach 90., wraz z niepokojącym rozpowszechnianiem się gruźlicy w Stanach Zjedno- czonych, pojawiła się potrzeba zestawienia i podsumowania dotychczasowych badań opi- sujących skuteczność BCG. W 1994 roku Colditz i wsp. [4] przeprowadzili metaanalizę dostępnych badań, a rok później Berkey i wsp. [2] podjęli się próby wyjaśnienia części zmienności efektów za pomocą metaregresji. Dokonano przeglądu 1264 artykułów i abstraktów dotyczących występowania samej cho- roby oraz szczepień BCG i innych szczepień przeciw gruźlicy. Do identyfikacji badań klinicznych oceniających skuteczność szczepionki BCG wykorzystano elektroniczne bazy publikacji medycznych, analizując odwołania do wyszukanych artykułów, przeglądając

Metaanaliza i metaregresja w programie Statistica Zestaw ... · i wskazywało na brak skuteczności BCG. Według autorów główne konkluzje zostały Według autorów główne konkluzje

  • Upload
    others

  • View
    8

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Metaanaliza i metaregresja w programie Statistica Zestaw ... · i wskazywało na brak skuteczności BCG. Według autorów główne konkluzje zostały Według autorów główne konkluzje

Copyright © StatSoft Polska 2011, [email protected]

50

METAANALIZA I METAREGRESJA W PROGRAMIE STATISTICA ZESTAW MEDYCZNY

Michał Kusy, StatSoft Polska Sp. z o.o.

Statystyczne metody łączenia wyników pochodzących z niezależnych badań muszą często

radzić sobie z problemami wynikającymi ze zmienności między badaniami. Mimo że meta-

analiza pozwala połączyć wyniki z badań pierwotnych w postaci efektu łącznego, jej celem

nie jest sprowadzenie wszystkich wartości do jednej miary efektu. Dobrze oddaje to

wykres leśny, przedstawiający uzyskany efekt łączny w kontekście poszczególnych badań

i ich zmienności. W kolejnych rozdziałach przedstawimy przykład wykonania metaanalizy

w programie STATISTICA Zestaw Medyczny. Do oceny zmienności wyników wykorzysta-

my analizę niejednorodności. Szukając przyczyn tej zmienności, sięgniemy do analizy

w grupach i metaregresji, aby sprawdzić powiązania między efektem i wybranymi charak-

terystykami badania.

Badania

Przedstawiane analizy opierają się na danych pochodzących z analizy skuteczności szcze-

pienia BCG w profilaktyce gruźlicy. Szczepionka BCG (Bacillus Calmette-Guérin) zapo-

biegająca rozwojowi gruźlicy została opracowana we Francji przez Alberta Calmette

i Camille'a Guérin. Obecnie Światowa Organizacja Zdrowia (WHO) zaleca jej stosowanie

w ramach programu szczepień ochronnych w krajach o podwyższonym ryzyku zachoro-

wania na gruźlicę. Mimo że szczepionkę wprowadzono do użycia w 1921 roku, jej sku-

teczność często poddawano w wątpliwość. Dostępne wyniki badań wahają się od wartości

wskazujących na przypuszczalną szkodliwość szczepienia do prawie 80% skuteczności.

W latach 90., wraz z niepokojącym rozpowszechnianiem się gruźlicy w Stanach Zjedno-

czonych, pojawiła się potrzeba zestawienia i podsumowania dotychczasowych badań opi-

sujących skuteczność BCG. W 1994 roku Colditz i wsp. [4] przeprowadzili metaanalizę

dostępnych badań, a rok później Berkey i wsp. [2] podjęli się próby wyjaśnienia części

zmienności efektów za pomocą metaregresji.

Dokonano przeglądu 1264 artykułów i abstraktów dotyczących występowania samej cho-

roby oraz szczepień BCG i innych szczepień przeciw gruźlicy. Do identyfikacji badań

klinicznych oceniających skuteczność szczepionki BCG wykorzystano elektroniczne bazy

publikacji medycznych, analizując odwołania do wyszukanych artykułów, przeglądając

Page 2: Metaanaliza i metaregresja w programie Statistica Zestaw ... · i wskazywało na brak skuteczności BCG. Według autorów główne konkluzje zostały Według autorów główne konkluzje

`

Copyright © StatSoft Polska 2011, [email protected]

51

wcześniej przygotowane listy badań BCG oraz kontaktując się z ekspertami w tej dzie-

dzinie. Przeglądane publikacje obcojęzyczne były tłumaczone na język angielski. Wyszu-

kiwanie przeprowadzały niezależnie przynajmniej dwie osoby, a wszystkie przeglądane

artykuły rejestrowano wraz z ewentualnymi przyczynami wyłączenia ich z badania.

Do metaanalizy włączono jedynie badania oceniające skuteczność szczepienia BCG w za-

pobieganiu przypadkom gruźlicy lub śmierci. Autorzy starali się zgromadzić następujące

informacje o każdym z badań: rok publikacji, rok szczepienia, sposób zaplanowania bada-

nia, przedział wiekowy badanej populacji, liczba włączonych pacjentów, położenie (sze-

rokość geograficzna), typ i dawka użytej szczepionki, droga podania, czas badania lub czas

do uodpornienia, rodzaj miary efektu oraz wynik opisujący skuteczność szczepionki. Osta-

tecznie kryteria włączenia do metaanalizy skuteczności szczepienia BCG w profilaktyce

gruźlicy spełniło 13 badań, na których będą bazować kolejne analizy.

Metaanaliza

Analizę w module Metaanaliza programu STATISTICA Zestaw Medyczny rozpoczynamy

od wprowadzenia wyników poszczególnych badań. Zbiór danych zawiera informacje

o liczbach pacjentów z gruźlicą i pacjentów zdrowych, w grupach szczepionych BCG

i nieszczepionych. Na podstawie tych wartości dla każdego badania program oblicza inte-

resującą nas miarę efektu, którą w tym przypadku jest współczynnik ryzyka RR.

W pierwszym badaniu (Aronson 1948) gruźlica wystąpiła u 4 spośród 123 osób szczepio-

nych i 11 spośród 139 nieszczepionych. Współczynnik ryzyka i 95% przedział ufności

wyniosły w tym badaniu odpowiednio: 0,411 i (0,134; 1,257). Ponieważ dane z badań pier-

wotnych zostały wcześniej zapisane w arkuszu STASTISTICA, można je wprowadzić do

analizy jednocześnie. Moduł Metaanaliza umożliwia również wprowadzenie badań z już

Page 3: Metaanaliza i metaregresja w programie Statistica Zestaw ... · i wskazywało na brak skuteczności BCG. Według autorów główne konkluzje zostały Według autorów główne konkluzje

Copyright © StatSoft Polska 2011, [email protected]

52

wyliczonymi efektami, co jest szczególnie istotne w sytuacjach, gdy nie ma dostępu do

szczegółowych danych dla badania, dysponujemy jednak wyliczoną na ich podstawie

miarą efektu.

Po wprowadzeniu poszczególnych badań program wylicza automatycznie wszystkie miary

efektu dostępne dla takich danych. Istnieje również możliwość przeliczania części współ-

czynników między sobą, dzięki czemu w analizie można jednocześnie uwzględnić badania

prezentujące różne miary efektu. W przypadku miar efektu wyrażonych na skali ilorazowej

(takich jak np. współczynnik ryzyka RR czy iloraz szans OR) przed przeprowadzeniem

metaanalizy program zastosuje przekształcenie logarytmiczne. Pozwala ono sprowadzić

wyniki do skali addytywnej, a następnie wyznaczyć średnią ważoną będącą oszacowaniem

efektu łącznego w metaanalizie. Dopiero po wyliczeniu łącznego efektu przedstawiamy

wynik na wyjściowej skali.

Metaanaliza - model z efektem stałym i zmiennym

Metaanaliza, czyli ilościowa synteza wyników pochodzących z niezależnych badań, to

narzędzie badawcze, które pozwala precyzyjnie ocenić wpływ działania analizowanego

czynnika oraz rozszerzyć wnioski z pojedynczych badań na szerszą populację w sytuacji,

gdy nie mamy dostępu do danych surowych, a dysponujemy jedynie zbiorczymi wynikami

tych badań. Jako jedną z pierwszych metaanaliz traktuje się analizę wykonaną przez Karla

Pearsona w 1904 roku. Aby ocenić skuteczność szczepienia na tyfus brzuszny Pearson

wykorzystał wyniki z pięciu prób o małej liczności i obliczył uśrednioną miarę korelacji

między umieralnością a stosowaniem szczepionki.

Mimo że metaanaliza znajduje obecnie szerokie zastosowanie w medycynie, farmakologii

i epidemiologii, pierwsze publikacje oceniające skuteczność terapii za pomocą tej techniki

Page 4: Metaanaliza i metaregresja w programie Statistica Zestaw ... · i wskazywało na brak skuteczności BCG. Według autorów główne konkluzje zostały Według autorów główne konkluzje

`

Copyright © StatSoft Polska 2011, [email protected]

53

badawczej pojawiły się stosunkowo późno. Sam termin „metaanaliza” (meta-analysis)

sformułował po raz pierwszy Gene Glass w 1976 roku. W połowie lat 80. upowszechniły

się tzw. przeglądy systematyczne (systematic reviews), w których metaanaliza odgrywa

dużą rolę. O jej znaczeniu we współczesnych naukach medycznych może świadczyć

chociażby fakt, że najwyżej w hierarchii wiarygodności danych z badań klinicznych stawia

się właśnie metaanalizę badań z grupą kontrolną.

W większości przypadków metaanaliza jest oparta na jednym z dwóch modeli statys-

tycznych: modelu z efektem stałym (fixed-effect model) lub modelu z efektem zmiennym

(random-effects model). W modelu z efektem stałym zakłada się, że wyniki wszystkich

badań opisują tę samą, rzeczywistą wartość efektu, a różnice w obserwowanych efektach

wynikają z błędu próby. W tym przypadku efekt łączny jest wyznaczany na podstawie

średniej ważonej efektów, przy czym wagi są wyznaczane jako odwrotności wariancji

odpowiednich badań.

Podejmując decyzję o włączeniu do metaanalizy grupy badań, zakładamy, że mają one na

tyle zgodny charakter, że synteza ich wyników ma sens. Najczęściej jednak rzeczywisty

efekt nie jest w każdym z nich jednakowy, co jest spowodowane np. specyficznymi,

nieopisanymi w publikacjach cechami pacjentów lub różnicami w sposobie zaplanowania

badania, z których nie zdajemy sobie sprawy. W modelu z efektem zmiennym (nazywanym

również modelem efektów losowych) uwzględniamy sytuację, w której nieznane,

rzeczywiste efekty różnią się między badaniami. Zwykle zakłada się, że mają one rozkład

normalny. Również w tym modelu efekt łączny jest wyznaczany na podstawie średniej

ważonej efektów poszczególnych badań, z tym że wagi są wyznaczane jako odwrotności

wariancji wewnątrz badań, powiększonej o wariancję pomiędzy badaniami.

Wróćmy do naszego przykładu. Biorąc pod uwagę zróżnicowanie zgromadzonych badań

wybieramy model z efektem zmiennym. Miarą efektu, którą będziemy rozpatrywać jest

współczynnik ryzyka RR. Przed wykonaniem analizy program automatycznie sprowadzi

wartości do skali logarytmicznej, a na koniec przeskaluje wynik do wyjściowej miary. Na

karcie Badania wyświetlone zostają wyniki dla poszczególnych badań pierwotnych

i wyniki metaanalizy, umieszczone w ostatnim wierszu. Uzyskany w modelu efekt łączny

wynosi RR = 0,490, a odpowiedni 95% przedział ufności (0,345; 0,695). Wynik jest istotny

statystycznie przy poziomie istotności α = 0,05 (p = 0,0001). Oznacza to zatem średnio

o 50% niższe ryzyko zachorowania na gruźlicę wśród osób szczepionych BCG w porów-

naniu do grupy kontrolnej. Gdybyśmy dla porównania przeprowadzili metaanalizę, zakła-

dając, że zbiór badań jest jednorodny, a zmienność wynika jedynie z błędu próby (model

z efektem stałym), uzyskalibyśmy współczynnik ryzyka RR = 0,650 (0,601; 0,704), rów-

nież istotny statystycznie. Widzimy, że w modelu z efektem stałym wyznaczony przedział

ufności dla współczynnika ryzyka jest wyraźnie węższy niż w przypadku modelu z efektem

zmiennym.

Page 5: Metaanaliza i metaregresja w programie Statistica Zestaw ... · i wskazywało na brak skuteczności BCG. Według autorów główne konkluzje zostały Według autorów główne konkluzje

Copyright © StatSoft Polska 2011, [email protected]

54

Mimo że metaanaliza pozwala połączyć wyniki wielu badań w postaci efektu łącznego, jej

celem nie jest sprowadzenie tych wszystkich wartości do jednej miary efektu. W zależności

od zmienności wyników badań, badacz może koncentrować uwagę na oszacowaniu efektu

(w przypadku bardzo jednorodnych badań), wartości efektu i jego zmienności lub też

głównie na zmienności. Dobrze oddaje to wykres leśny (forest plot), przedstawiający za-

równo efekt łączny, jak i cały kontekst (poszczególne badania i ich zmienność), w którym

został on wyznaczony. Najczęściej przedstawia się na nim wyniki poszczególnych badań

i obliczone przedziały ufności oraz wynik łączny, umieszczany poniżej badań. Dodatkowo

punkty oznaczające wartości efektu zaznaczane są najczęściej jako kwadraty o różnych po-

lach, które odpowiadają wadze danego badania w metaanalizie. Moduł Metaanaliza

pozwala również dołączyć do wykresu tabelę z wybranymi wynikami badań.

Udziały poszczególnych badań w metaanalizie są dość zbliżone i mieszczą się w zakresie

ok. 4-10%. Wynika to z faktu, że model z efektem zmiennym uwzględnia w obliczeniach

zmienność zaobserwowaną między badaniami i nawet mało liczne badania wnoszą pewną

informację o zmienności efektu. W modelu z efektem stałym wagi badań wahałyby się

w tym przykładzie od niecałego 1% do 42% i byłyby w większym stopniu zależne od

liczności badania. Od razu rzuca się w oczy duża zmienność wyników, od 80% zmniej-

szenia ryzyka w grupie szczepionych BCG (Ferguson & Simes 1949, Vandiviere 1973) do

wyników świadczących na niekorzyść szczepionki, jak np. RR = 1,562 w badaniu

Comstock & Webster 1969. Widzimy również, że w 5 spośród 13 rozpatrywanych badań

wyniki okazały się nieistotne statystycznie.

Page 6: Metaanaliza i metaregresja w programie Statistica Zestaw ... · i wskazywało na brak skuteczności BCG. Według autorów główne konkluzje zostały Według autorów główne konkluzje

`

Copyright © StatSoft Polska 2011, [email protected]

55

Analiza skumulowana

Innym sposobem spojrzenia na wpływ poszczególnych badań na obliczany efekt łączny

jest tzw. skumulowana metaanaliza (cumulative meta-analysis). Badania są w niej zwykle

sortowane chronologicznie, dzięki czemu można śledzić, jak łączny efekt i błąd jego osza-

cowania zmieniały się w czasie, po uwzględnieniu kolejnych publikacji.

Page 7: Metaanaliza i metaregresja w programie Statistica Zestaw ... · i wskazywało na brak skuteczności BCG. Według autorów główne konkluzje zostały Według autorów główne konkluzje

Copyright © StatSoft Polska 2011, [email protected]

56

Powyżej przedstawiono wykres z wynikami analizy skumulowanej. Analizowane badania

pochodzą z ponad 30-letniego okresu, w związku z czym ich wyniki będą oddawać zmia-

ny, które zachodziły zarówno w praktyce medycznej, jak i sposobie planowania badań oraz

raportowania ich wyników. Precyzja oszacowania efektu łącznego poprawia się naturalnie

po dołączeniu do pojedynczego badania Aronson 1948 dwóch kolejnych badań. Widzimy

jednak, że zmienność wyników jest na tyle duża, że dodanie kolejnych 10 badań nie

powoduje znacznego zwężenia 95% przedziału ufności dla efektu łącznego.

Analiza wrażliwości

W trakcie przeprowadzania metaanalizy spotykamy ograniczenia związane nie tylko z zas-

tosowanymi technikami analitycznymi, ale przede wszystkim z dostępnością danych.

Przykładowo dane uzyskane z badań kohortowych nie pozwoliły na analizę czasu trwania

odporności po szczepieniu, a uwzględnienie różnego wieku pacjentów było ograniczone

określonym doborem pacjentów do badań oraz brakiem odpowiednich informacji w publi-

kacjach. Potencjalnym źródłem obciążenia wyników metaanalizy są również badania

niepublikowane, których wyniki są często nieistotne statystycznie lub nawet sprzeczne

z publikowanymi danymi.

Colditz i wsp. [4] kontaktowali się z ekspertami z WHO, CDC (Centers for Disease Con-

trol and Prevention) i innych organizacji, prosząc o pomoc w wyszukaniu jakichkolwiek

niepublikowanych badań skuteczności BCG. Nie udało się jednak dotrzeć do takich badań.

Przeprowadzono zatem analizę wrażliwości, w której oceniano m.in., jak wyniki metaana-

lizy przedstawiałyby się dla różnych zestawów uwzględnionych badań. Wykonano również

metaanalizy po włączeniu dodatkowych 20 hipotetycznych badań, z których każde miało

liczność porównywalną z największym badaniem rozpatrywanym w bazowej metaanalizie

i wskazywało na brak skuteczności BCG. Według autorów główne konkluzje zostały

zachowane, a efekt łączny pozostał istotny statystycznie.

Aby ocenić, na ile założenia metaanalizy i uwzględnione w niej badania wpłynęły na uzys-

kane łączne wyniki, możemy wykonać szereg eksperymentów kryjących się pod ogólnym

terminem analizy wrażliwości (sensitivity analysis). Gdy część wyników znacznie odbiega

od pozostałych, można zbadać wpływ poszczególnych badań na efekt łączny, powtarzając

wielokrotnie metaanalizę po wyłączeniu każdego z nich z osobna lub wyłączeniu grupy

badań. Podobnie jeśli badanie nie zostało uwzględnione w metaanalizie, np. ze względu na

jakość danych, możemy sprawdzić, jak zmieniłaby się łączna wartość efektu, gdyby włą-

czyć je do analizy.

Poniżej przedstawiono wykres wrażliwości, pokazujący zmiany w efekcie łącznym spo-

wodowane wyłączeniem z metaanalizy poszczególnych badań. Pionowymi liniami zazna-

czony został efekt łączny i granice przedziału ufności dla całościowej metaanalizy. Do tych

poziomów możemy odnieść wartość efektu łącznego i zakres przedziału ufności dla meta-

analizy przeprowadzonej bez danego badania.

Page 8: Metaanaliza i metaregresja w programie Statistica Zestaw ... · i wskazywało na brak skuteczności BCG. Według autorów główne konkluzje zostały Według autorów główne konkluzje

`

Copyright © StatSoft Polska 2011, [email protected]

57

Na podstawie wykresu możemy stwierdzić, że nieuwzględnienie w analizie badania Aron-

son 1948 nie wpłynęłoby znacznie na efekt łączny, natomiast w metaanalizie przeprowa-

dzonej bez badania TB Prevention Trial 1980 otrzymalibyśmy nieco mniejszy współczyn-

nik ryzyka (RR = 0,454). Dodatkowy wykres przedstawiający procentową zmianę błędu

standardowego po wyłączeniu badania z metaanalizy pokazuje, że w tym przypadku błąd

standardowy zmniejszyłby się o około 15%. Badanie TB Prevention Trial 1980 miało silny

wpływ na wyniki metaanalizy. Było to najliczniejsze spośród analizowanych badań, a wyz-

naczony w nim współczynnik ryzyka sugerował brak efektu (RR = 1,012, p = 0,8494).

Niejednorodność wyników

Rozważając niejednorodność wyników analizowanych badań, mamy na uwadze zmienność

rzeczywistej wartości efektu. Obserwowana zmienność może wynikać z różnic na po-

ziomie klinicznym (np. zróżnicowania populacji pacjentów, interwencji, czasu obserwacji)

lub metodycznym (np. różnic w zaplanowaniu badań, jakości badań), jak również z błędów

losowych. Aby wyodrębnić z obserwowanego rozrzutu wyników rzeczywistą wariancję,

porównujemy zaobserwowaną zmienność między badaniami ze zmiennością, której

oczekiwalibyśmy, gdyby badania wskazywały efekt wspólny. Różnica między nimi powin-

na odzwierciedlać rzeczywiste różnice między badaniami i na jej bazie konstruuje się

podstawowe miary wykorzystywane w analizie niejednorodności (heterogeneity analysis).

Przykładową miarą oceniającą niejednorodność wyników jest ważona suma kwadratów

Q Cochrana. Przy założeniu, że każde z k badań wskazuje na ten sam stały efekt, współ-

czynnik Q będzie pochodził z rozkładu chi-kwadrat o k-1 stopniach swobody. W ten

sposób otrzymujemy test sprawdzający niejednorodność efektów. Na podstawie wartości

Page 9: Metaanaliza i metaregresja w programie Statistica Zestaw ... · i wskazywało na brak skuteczności BCG. Według autorów główne konkluzje zostały Według autorów główne konkluzje

Copyright © StatSoft Polska 2011, [email protected]

58

Q wyznacza się również T2 estymator wariancji rzeczywistych efektów, oraz I2

statystykę, która przedstawia udział procentowy zmienności rzeczywistej do łącznej.

W rozważanym przykładzie interesujący jest nie tylko efekt łączny, ale również, jeśli nie

przede wszystkim, znaczna wariancja efektów leczenia, które zmieniają się od RR równego

0,198 (80% zmniejszenie ryzyka) do 1,562 (56% zwiększenie ryzyka). Statystyka Q

wynosi 152,233 (df = 12), a p jest mniejsze od 0,0001, w związku z czym możemy stwier-

dzić, że wyniki badań istotnie się od siebie różnią. Wariancja rzeczywistych efektów T2 jest

równa 0,309 i stanowi 92% obserwowanej zmienności (I2 = 92,12). Duża zmienność

powoduje, że 95% przedział predykcji dla efektu jest szeroki. W zakresie (0,135; 1,769),

oznaczonym na wykresie leśnym przerywaną linią spodziewalibyśmy się z dużym praw-

dopodobieństwem uzyskać wartość RR w kolejnym badaniu.

Do graficznej oceny niejednorodności badań, oprócz wykresu leśnego, można wykorzystać

szereg wykresów przedstawiających różne aspekty zmienności. Przykładem może być

wykres L’Abbego, przedstawiający w tym przypadku zależność między ryzykiem wystą-

pienia gruźlicy w grupie pacjentów szczepionych BCG a ryzykiem gruźlicy w grupie

kontrolnej. Linia ciągła odpowiada poziomowi równowagi (RR = 1,00), a linia przerywana

wyznaczonemu w metaanalizie efektowi łącznemu (RR = 0,49). Wielkość znaczników jest

proporcjonalna do udziału danego badania w metaanalizie. Znaczny rozrzut punktów

wokół przerywanej prostej sugeruje zwykle dużą zmienność wyników badań. Naszą uwagę

zwraca jednak badanie Stein & Aronson 1953. Co prawda jego wynik nie odbiega znacznie

od obliczonego efektu łącznego, ale charakteryzuje się ono największym odsetkiem

zachorowań na gruźlicę, zarówno wśród osób zaszczepionych, jak i grupie kontrolnej.

Dodatkowo możemy zaobserwować, że wartości RR większe od obliczonego efektu łącz-

nego występują w badaniach oznaczonych ciemniejszym kolorem, w których ryzyko

wystąpienia gruźlicy w grupie kontrolnej jest stosunkowo wysokie.

Page 10: Metaanaliza i metaregresja w programie Statistica Zestaw ... · i wskazywało na brak skuteczności BCG. Według autorów główne konkluzje zostały Według autorów główne konkluzje

`

Copyright © StatSoft Polska 2011, [email protected]

59

Analiza niejednorodności badań nie kończy się zwykle na samym stwierdzeniu istnienia

zmienności. Z praktycznego punktu widzenia bardziej przydatne jest wskazanie jej poten-

cjalnych źródeł. Wykorzystujemy w tym celu między innymi analizę w grupach i meta-

regresję, szukając powiązań między charakterystykami badania i wartością efektu.

Analiza w grupach

Analizę w grupach (subgroup analyses) wykonujemy w sytuacji, gdy chcemy porównać

wyniki metaanalizy przeprowadzanej na różnych grupach badań. W analizie w grupach na

obserwowaną zmienność efektu wpływają: zmienność międzygrupowa, rzeczywista zmien-

ność efektu w grupach i błąd próby. W przypadku modelu z efektem zmiennym wariancję

rzeczywistych efektów T2 możemy szacować dla każdej z grup oddzielnie lub wspólnie.

Dodatkowo przeprowadza się testy porównujące efekty łączne między grupami.

Szukając przyczyn zmienności wyników poszczególnych badań, Colditz i wsp. [4] rozwa-

żali m.in. użycie różnych szczepów BCG, występowanie innych zakażeń prątkowych w ba-

danej populacji, genetyczne lub związane z wiekiem różnice w badanych populacjach,

zmniejszoną złośliwość niektórych szczepów gruźlicy itp. Rozpatrywano również błędy

merytoryczne oraz różnice metodyczne powodujące obciążenie wyników poszczególnych

badań. Uwzględnili przykładowo zmienną określającą sposób przypisania pacjentów do

porównywanych grup. W 7 badaniach pacjentów przypisano w sposób losowy (random

allocation), w 4 zastosowano losowanie systematyczne (systematic allocation), a w 2

Page 11: Metaanaliza i metaregresja w programie Statistica Zestaw ... · i wskazywało na brak skuteczności BCG. Według autorów główne konkluzje zostały Według autorów główne konkluzje

Copyright © StatSoft Polska 2011, [email protected]

60

pseudorandomizację (alternate allocation). Poniżej przedstawiono wyniki analizy w tak

zdefiniowanych grupach.

Istotny statystycznie okazał się jedynie współczynnik ryzyka w grupie z przydziałem loso-

wym, RR = 0,366 (0,180; 0,745). Analizując wykres leśny dla analizy w grupach, nie

możemy powiedzieć, że metoda przypisania pacjentów do grup wyjaśnia zróżnicowanie

wyników badań. Również test oparty na statystyce Q nie wykazał istotnych różnic między

trzema grupami badań (p = 0,4638).

Metaregresja

Metaregresja (meta-regression) to kolejne podejście powszechnie stosowane w analizie

niejednorodności badań. Stanowi ona połączenie technik metaanalizy i regresji liniowej.

Krótko mówiąc, metaregresja ocenia czy istnieje liniowa zależność między zmiennymi na

poziomie badania a odpowiednimi efektami leczenia i określa kierunek tej zależności.

W porównaniu do analizy w grupach jest to metoda bardziej zaawansowana, pozwalająca

włączyć do analizy jednocześnie większą liczbę zmiennych, zarówno ilościowych, jak

i jakościowych.

Warto zaznaczyć, że metaregresja nie powinna być wykonywana jedynie ze względu na

wyniki metaanalizy sugerujące, że powiązanie może istnieć, lub ze względu na dostępność

danych w uwzględnionych badaniach. Idealnie byłoby, gdyby możliwe źródła zmienności

zostały zidentyfikowane przed połączeniem wyników w metaanalizie, co jest niewątpliwie

utrudnione ze względu na obserwacyjny charakter metaanalizy. Co więcej, powinien

istnieć przekonujący mechanizm biologiczny lub farmakologiczny, pozwalający uzasadnić

Page 12: Metaanaliza i metaregresja w programie Statistica Zestaw ... · i wskazywało na brak skuteczności BCG. Według autorów główne konkluzje zostały Według autorów główne konkluzje

`

Copyright © StatSoft Polska 2011, [email protected]

61

wyniki metaregresji. Powiązań odkrytych w metaregresji nie uważa się za dowód istnienia

związku przyczynowo-skutkowego. Nawet dla zmiennych definiowanych a priori uzys-

kiwane w metaregresji wyniki traktuje się bardziej jako hipotezy czy sugestie co do

możliwych rzeczywistych zależności.

Berkey i wsp. [2] przypuszczali, że szczepionka może mieć inną skuteczność w różnych

strefach klimatycznych. Swoją hipotezę opierali na założeniach, że w chłodniejszym klima-

cie skłonność do wytwarzania naturalnej odporności na gruźlicę jest słabsza, wyższe tem-

peratury mogą osłabiać działanie BCG, a bezpośrednie działanie promieni słonecznych

zabija część bakterii niezbędnych do prawidłowego działania szczepionki. Z braku lep-

szych predyktorów (np. danych o warunkach przechowywania szczepionki w każdym z ba-

dań), autorzy oparli się na odległości od równika, która miała być surogatem warunków

klimatycznych. Odkryto, że spośród siedmiu uwzględnionych w analizie zmiennych, od-

ległość miejsca badania od równika i ocena jakości badania charakteryzują się najsilniej-

szym związkiem ze skutecznością BCG. Ze względu na charakter post hoc tej analizy uzys-

kane wyniki nie są definitywne, mogą natomiast sugerować kierunek dodatkowych badań.

W metaregresji, podobnie jak w metaanalizie, istnieją dwa powszechnie stosowane modele

statystyczne. Model z efektem stałym zakłada jeden wspólny efekt dla każdego zestawu

wartości predyktorów, a różnice między obserwowanymi wynikami tłumaczy błędem loso-

wym. Alternatywnie: model z efektem zmiennym zakłada, że efekt leczenia nie jest stały

w badaniach o jednakowych wartościach zmiennych objaśniających. Prognoza metaregresji

wskazuje wtedy położenie wartości oczekiwanej rozkładu mierzonego efektu przy okreś-

lonym zestawie wartości predyktorów.

Page 13: Metaanaliza i metaregresja w programie Statistica Zestaw ... · i wskazywało na brak skuteczności BCG. Według autorów główne konkluzje zostały Według autorów główne konkluzje

Copyright © StatSoft Polska 2011, [email protected]

62

Ponieważ mierzony efekt wyrażono w postaci współczynnika ryzyka RR, przed utworze-

niem modelu program logarytmuje wartości RR, podobnie jak w przypadku metaanalizy.

Uzyskana w ten sposób zmienna log RR, gdzie log oznacza logarytm naturalny, będzie

zmienną zależną w metaregresji. Wyniki metaregresji dla modelu z efektem zmiennym

przedstawiono poniżej. Dla każdego uwzględnionego predyktora testowana jest istotność

współczynnika regresji. Współczynnik regresji dla zmiennej Szerokość wynosi -0,0292

i jest istotnie różny od zera, o czym mówi wartość prawdopodobieństwa testowego p =

0,00001 dla testu Z opartego na rozkładzie normalnym. Do oceny jednoczesnego wpływu

wielu zmiennych objaśniających wykorzystuje się test oparty na statystyce Q. W naszym

przykładzie uwzględniliśmy tylko jedną zmienną, dlatego zarówno test Q, jak i test

Z prowadzą do tych samych wyników.

Wyniki sugerują powiązanie szerokości geograficznej ze skutecznością szczepionki BCG.

Większa skuteczność szczepionki występowała w badaniach prowadzonych dalej od rów-

nika. Zależność między log RR a zmienną Szerokość możemy zapisać w postaci:

𝑙𝑜𝑔𝑅𝑅 = 0,2595 − 0,0292 ∙ 𝑆𝑧𝑒𝑟𝑜𝑘𝑜ść.

Prezentując wyniki metaregresji staramy się pokazać zależność między rozważaną zmienną

a wyznaczonym efektem. W przeciwieństwie do wykresów leśnych, wykresy tworzone

w metaregresji nie przedstawiają przedziałów ufności dla poszczególnych badań, ponieważ

kierują one uwagę na badania o mniejszej precyzji. Na wykresie każdy punkt wskazuje

parę (Szerokość, log RR) dla danego badania. Pole znacznika jest proporcjonalne do wagi

badania w metaregresji. Ponieważ analiza oparta jest na modelu z efektem zmiennym, wagi

uwzględniają zmienność wewnątrz badań powiększoną o wariancję pomiędzy badaniami

T2. Pozioma linia oznacza poziom odniesienia równy 0. Na wykresie zaznaczono również

przebieg dopasowania liniowego. W przypadku badań przeprowadzanych bliżej równika

oczekiwana wartość efektu jest bliższa zeru, co odpowiada współczynnikowi ryzyka RR =

1,00, oznaczającemu brak skuteczności szczepienia. Z kolei dla największych rozpatry-

wanych tu szerokości oczekiwana wartość log RR wynosi około -1,50, co daje RR około

0,20 i 80% zmniejszenie ryzyka gruźlicy.

Badając część zmienności niewyjaśnionej przez model opieramy się na odpowiedniku

współczynnika determinacji R2 dla zwykłej regresji. W modelu z efektem zmiennym

zakładamy, że łączna wariancja pochodzi ze zmienności wewnątrz badań i zmienności

pomiędzy badaniami. Predyktory określane na poziomie badania wyjaśniają jedynie część

zmienności między badaniami. Z tego względu odpowiednik współczynnika determinacji

Page 14: Metaanaliza i metaregresja w programie Statistica Zestaw ... · i wskazywało na brak skuteczności BCG. Według autorów główne konkluzje zostały Według autorów główne konkluzje

`

Copyright © StatSoft Polska 2011, [email protected]

63

w metaregresji bazuje jedynie na wartościach T2. Wariancja wartości niewyjaśniona w mo-

delu wynosi 0,063. Badając niejednorodność badań, oszacowaliśmy wariancję rzeczywis-

tych efektów T2 = 0,309. Stanowi ona 92% obserwowanej zmienności (I2 = 92,12).

Obliczony w metaregresji współczynnik determinacji R2 wynosi 0,7950, co oznacza, że

spośród 92% obserwowanej zmienności model wyjaśnił około 80%.

Wśród pozostałych czynników rozważanych jako zmienne objaśniające uwzględniono

m.in. sposób przydzielenia pacjentów do grup oraz średni wiek szczepionych. Żadna z nich

nie poprawiła jakości modelu. Metaregresja jest często używana do badania relacji między

efektami leczenia a zmiennymi zawierającymi dane zagregowane, jak np. średni wiek

w badaniu. Dane zagregowane mogą być użyteczne do oceny zmienności w ramach czyn-

ników na poziomie badania. Do interpretacji takich analiz należy jednak podchodzić z dużą

ostrożnością, ponieważ średni wiek wewnątrz badania nie oddaje prawdziwego wieku

poszczególnych pacjentów. Uzyskany w ten sposób wynik może być obarczony tzw.

błędem agregacji (błędem ekologicznym).

Podsumowanie

Wyniki metaanalizy wykonanej przez Colditza i wsp. [4] i metaregresji przeprowadzonej

przez Berkeya i wsp. [2] rzuciły nowe światło na ocenę skuteczności szczepienia BCG

w profilaktyce gruźlicy. Analiza nie skupiła się wyłącznie na uzyskanym efekcie łącznym.

Obserwując stosunkowo dużą wariancję wyników badań, wykorzystano narzędzia pozwa-

lające ocenić tę zmienność i podjąć próbę jej wyjaśnienia. W przedstawionych powyżej

rozdziałach zobaczyliśmy m.in. przykłady wykonania metaanalizy, analizy w grupach

i metaregresji w module Metaanaliza programu STATISTICA Zestaw Medyczny.

Page 15: Metaanaliza i metaregresja w programie Statistica Zestaw ... · i wskazywało na brak skuteczności BCG. Według autorów główne konkluzje zostały Według autorów główne konkluzje

Copyright © StatSoft Polska 2011, [email protected]

64

Literatura

1. Baker W.L., White C.M., Cappelleri J.C. i wsp. (2009), Understanding heterogeneity

in meta-analysis: the role of meta-regression, The International Journal of Clinical

Practice, 63, 10, 1426-1434.

2. Berkey C.S., Hoaglin D.C., Mosteller F., Colditz G.A. (1995), A random-effects regre-

ssion model for meta-analysis. Statistics in Medicine, 14, 395-411.

3. Borenstein M., Hedges L.V., Higgins J.P.T., Rothstein H.R. (2009), Introduction to

Meta-Analysis, John Wiley and Sons Ltd.

4. Colditz G.A., Brewer T.F., Berkey C.S. i wsp. (1994), Efficacy of BCG vaccine in the

prevention of tuberculosis. Meta-analysis of the published literature. Journal of the

American Medical Association, 271, 698-702.

5. Gajewski P., Jaeshke R., Brożek J. (2008), Podstawy EBM czyli medycyny opartej na

danych naukowych dla lekarzy i studentów, Medycyna Praktyczna, Kraków.

6. Hartung J., Knapp G., Sinha B.K. (2008), Statistical Meta-Analysis with Applications,

John Wiley and Sons Inc.