Analýza dat v neurologii
XLII. Simpsonův paradox a faktory modifikující účinek v analýze asociačních studií

Česká verzia

Autoři: L. Dušek; T. Pavlík; Jiří Jarkovský ; J. Koptíková
Působiště autorů: Masarykova univerzita, Brno ; Institut biostatistiky a analýz
Vyšlo v časopise: Cesk Slov Neurol N 2013; 76/109(6): 783-787
Kategorie: Okénko statistika

V předchozím díle seriálu jsme popsali velmi zajímavý jev, který dovede překvapit nejednoho analytika dat. Tzv. Simpsonův paradox označuje situaci, kdy výsledky analýz dílčích či menších datových souborů naznačují určitý efekt, ale po jejich spojení do většího souboru dat dostaneme výsledek opačný. Simpsonův paradox tak můžeme například pozorovat v situacích, kdy za nějakým účelem spojujeme dílčí soubory dat. Vždy jde o situaci vyžadující další rozbor a nelze ji přejít bez zvýšené pozornosti. Pokud totiž v konkrétním případě pozorujeme Simpsonův paradox, ukazuje to buď na vážné problémy s designem studie, nebo na vliv silného zavádějícího faktoru, který ovlivňuje výsledky dílčích sledování, a při spojení dat je jeho vliv maskován. Takové výsledky je nutné interpretovat s maximální opatrností, neboť existuje velké riziko jejich zkreslení.

Připomeňme si výklad předchozího dílu na dvou odlišných příkladech uvedených v tab. 1. Z jejich výsledku je bohužel patrné, že u Simpsonova paradoxu nelze paušálně prohlásit, že správný výsledek poskytují vždy dílčí pozorování anebo spojená data. Záleží totiž na typu řešeného problému a na příčinách zkreslení. Pokud jde o spojení dílčích souborů o malém počtu pozorování, pak relevantní výsledek poskytnou spíše spojená data. Avšak nerespektuje‑li spojení dat důležité klasifikační (stratifikační) faktory (např. členění dle pohlaví, věku, stadia nemoci apod.), pak spojená data nemohou reprezentovat a relevantně odrážet skutečné vztahy mezi sledovanými veličinami.

#tab:1#

Nyní přistoupíme k vysvětlení významu interakce zavádějících a expozičních faktorů v asociačních studiích. I zde se vliv zavádějícího faktoru projevuje jako rozpor mezi dílčími pozorováními a výsledkem získaným na celkovém souboru. Připomeňme si hlavní typy možného vlivu zavádějících faktorů při studiu vztahu (asociace) mezi expozicí rizikovým faktorem a výskytem klinické události. Pro jednoduchost uvažujme expozici pouze jedním faktorem a vliv jednoho zavádějícího faktoru; např. v retrospektivní studii zkoumáme vliv léčby v domácím prostředí (expozice) na výskyt vážných komplikací sledované choroby (událost), přičemž možným zavádějícím faktorem je u této choroby diabetes jako významná komorbidita. Výstupem studie je v nejjednodušším případě tabulka četností 2 × 2 a z ní provedený odhad poměru šancí (OR). Vliv diabetu budeme zkoumat ve čtyřech kategoriích (stratech) dle jeho tíže (diabetes žádný, mírný, těžký, velmi těžký). Získáme tak čtyři dílčí, specifické odhady OR (strata ‑⁠ specific OR estimates, conditional OR estimates) a zároveň adjustovaný odhad metodou dle Mantela ‑⁠ Haenszela (OR_MH), který podrobíme testu hypotézy OR_MH = 1 (test dle Cochrana ‑⁠ Mantela ‑⁠ Haenszela, viz díly 39 –⁠ 40 seriálu). Možné varianty výsledku jsou následující:

Dílčí odhady OR provedené přes jednotlivá strata daná tíží diabetu jsou homogenní a bez statisticky významného rozdílu (test Breslowa a Daye) a odhad OR_MH se neliší od hrubého odhadu OR kalkulovaného na celkové tabulce četností bez uvažování vlivu diabetu. Při takovém výsledku diabetes nepůsobí jako významný a vlivný zavádějící faktor a nezkresluje výsledky studie. To může být mimo jiné důsledkem faktu, že výskyt různých kategorií diabetu je mezi případy (v domácí léčbě) a kontrolami stejný. Výsledkem studie může být statisticky významná hodnota OR (např. při OR > 1 je domácí léčba rizikovým faktorem pro komplikace) nebo hodnota statisticky nevýznamná (domácí léčba výskyt komplikací neovlivňuje).
Hrubý (neadjustovaný) odhad OR vyjde statisticky významný a ukazuje na rizikový vliv domácí léčby (OR > 1), avšak odhad adjustovaný na vliv diabetu (OR_MH) významný není. Původní hodnotu v tomto případě zřejmě zkreslil rozdíl ve výskytu diabetu mezi případy a kontrolami. Podobný závěr učiníme i při opačném výsledku, kdy hrubý odhad OR je statisticky nevýznamný, ale adjustovaný odhad OR_MH významný je. Pokud v obou případech ukazují dílčí odhady pro jednotlivá strata na stejný „směr“ vlivu domácí léčby (protektivní anebo rizikový), můžeme prezentovat adjustovaný odhad OR_MH, neboť vliv diabetu je významný a nesmíme ho pominout.
Odhad OR_MH adjustovaný na vliv diabetu vyjde blízký hodnotě 1 a je statisticky nevýznamný v důsledku protichůdných výsledků v jednotlivých stratech daných diabetem. Např. u pacientů bez diabetu a s lehkým diabetem může domácí léčba působit protektivně (dílčí odhady OR < 1), zatímco u pacientů se silným diabetem se může domácí léčba projevit jako rizikový faktor komplikací (dílčí OR > 1). Takový výsledek by sám o sobě stál za studium, samozřejmě shrnutí studie v jediný odhad OR postrádá smysl a je zavádějící. V tomto případě jsme svědky významné interakce faktorů ovlivňujících výskyt komplikací, tedy diabetu a sledované léčby.

Čtenář jistě tuší, že zejména výše popsané varianty 2 a 3 mají k projevu Simpsonova paradoxu nejblíže. V těchto variantách pozorujeme výsledek, kdy celková sumarizace výsledků je v rozporu s dílčími pozorováními. Nejsložitější je ovšem varianta 3, neboť protichůdný vliv zavádějícího faktoru v rámci různých kategorií celkového souboru je vůbec obtížné objevit, a pokud se tak stane, pak se zásadně mění interpretace celé analýzy (aplikace adjustovaného odhadu OR_MH není smysluplná). Hovoříme o nehomogenitě ukazatelů asociace zkoumaných jevů v dílčích tabulkách, která je důsledkem interakce daného stratifikačního faktoru (v příkladu výše jde o tíži diabetu) a expozice, jíž je v našem příkladu domácí léčba. Takto působící stratifikační (zavádějící) faktor se nazývá faktor modifikující účinek (effect modulating factor).

Identifikace a kvantifikace vlivu faktorů, které modifikují účinek zkoumané experimentální (léčebné) intervence, patří jistě mezi nejzajímavější a zároveň nejobtížnější oblasti biostatistiky. Analýza dat zde má velkou šanci objevit zcela nové a pro praxi velmi podstatné vztahy mezi sledovanými veličinami. Jelikož výsledné vztahy mohou být velmi komplikované, má na tomto místě velký význam přehledné grafické znázornění výsledku. Zvláštní formu takových interakčních grafů navrhl ve své publikaci z roku 1985 Minja Paik a my jejich význam přibližujeme v příkladu 1. V podstatě jde o vykreslení odhadů šancí (nikoliv však jejich poměrů, tedy OR) na výskyt zkoumaného jevu v závislosti na hodnotách působící expozice. Tento vztah je vykreslen jednak pro hrubé odhady kalkulované na celém souboru dat a jednak zvlášť pro strata daná kategoriemi zavádějícího faktoru. I při relativně vysokém počtu kategorií (strat) tak na první pohled poznáme faktor, který významně ovlivňuje účinek expozice, a je tedy faktorem modifikujícím účinek.

#other:1#

Velkou roli zde hraje fakt, o němž jsme ve výše uvedeném výčtu tří možných výsledků analýzy vůbec neuvažovali, a sice relativní váha jednotlivých podskupin (strat). Schematické obrázky v příkladu 1 zachycují i velikost strat; vzájemný poměr ploch kruhů u datových bodů odráží poměr počtu pozorování v různých kombinacích kategorií expozice × zavádějící faktor. Jedná se o velmi užitečnou dimenzi zobrazení, neboť strata vytvářená kategoriemi hodnot zavádějícího faktoru budou v praxi jen ojediněle stejně velká, a zejména u retrospektivních studií můžeme čekat velké rozdíly v jejich velikosti. Logicky potom na výpočet výsledného adjustovaného OR_MH budou mít větší vliv strata s větším počtem opakování.

Samotné grafické zviditelnění ovšem jako statistický důkaz významné interakce faktorů nestačí. Komplikovaný vliv faktoru modifikujícího účinek je nutné prokázat statistickými testy. Postup v tomto případě není příliš odlišný od normální asociační analýzy, kterou jsme již představili v dílech 39 –⁠ 40 našeho seriálu. Po odhadu hrubého poměru šancí (OR), při znalosti pravděpodobného vlivu zavádějícího faktoru, rozdělíme soubor do dílčích podskupin a budeme směřovat k odhadu adjustovaného OR_MH. Pokud ale test homogenity dílčích odhadů OR mezi straty (test dle Breslowa a Daye) prokáže významnou nehomogenitu dílčích odhadů OR, studujeme detailně, jak se vliv expozice na sledovaný klinický jev mezi straty liší. A v této fázi můžeme pomocí výše popsaného grafického znázornění odhalit i rozdílný „směr“ tohoto vlivu, a tedy interakci vedoucí například i k Simpsonovu paradoxu, kdy stratifikované a nestratifikované odhady vedou k protichůdným závěrům.

Identifikaci faktoru modifikujícího účinek detailně dokumentují příklady 2 a 3. V příkladu 2 prokazujeme vliv faktoru modifikujícího účinek, který má pouze dvě kategorie, a celkový soubor je tak dělen na dvě strata. Příklad 3 pracuje se složitějším zadáním při dělení souboru na čtyři strata. Zejména u takového problému je možnost přehledného grafického znázornění velmi cenná. Zvláštní výstup těchto analýz způsobený typickým projevem Simpsonova paradoxu přibližuje příklad 4, kde dílčí analýzy stratifikovaného souboru společně ukazují na určitý účinek léčby, ale po spojení dílčích souborů v celek získáváme výsledek opačný.

#other:2#

#other:3#

#other:4#

Na závěr zdůrazněme jeden velmi podstatný fakt, který se sice zdá samozřejmostí, nicméně bývá ve světě moderní vědy často opomíjen. Identifikace faktoru modifikujícího účinek samozřejmě předpokládá, že tento faktor experimentátor zná a o jeho účinku buď předem ví anebo jej předpokládá. Jen tak může být daný faktor zahrnut mezi sledované proměnné a správně zapojen do analýzy. Pokud výsledky ovlivňuje faktor, jenž není sledován vůbec, a tudíž ani zaznamenán v datovém souboru, pak jeho vliv samozřejmě odhalit nelze. Závažného zkreslení výsledku asociační analýzy se přitom můžeme při nevybalancovaném designu studie dočkat i od naprosto „obyčejného“ parametru, jako je např. body mass index, pohlaví či věk pacientů. Je tedy velmi důležité, aby u asociačních studií byla data o zařazených pacientech co nejkomplexnější a subjekty byly řádně popsány, a to i běžnými demografickými, diagnostickými a klinickými charakteristikami. Tím umožníme prověření jejich možného vlivu na konečný výsledek studie. Jakkoli se tato poznámka v době nabité molekulárními a genetickými markery může jevit jako redundantní, stále ještě nejsme v poznání podstaty většiny jevů (onemocnění) tak daleko, abychom mohli zanedbat poctivý popis souboru dat. Právě progresivní genetické asociační studie, jež hledají vztahy mezi zcela novými markery a klinickými jevy, musí být schopny doložit, že jejich nálezy nejsou zkreslené zavádějícími faktory.

doc. RNDr. Ladislav Dušek, Dr.

Institut biostatistiky a analýz

MU, Brno

e-mail: dusek@cba.muni.cz