Analýza dat v neurologii

Česká verzia

Autoři: L. Dušek; T. Pavlík;  j. Jarkovský; J. Koptíková
Působiště autorů: Institut biostatistiky a analýz, LF MU, Brno
Vyšlo v časopise: Cesk Slov Neurol N 2017; 80(6): 730-733
Kategorie: Okénko statistika

LXVI. Statistická analýza studií s jedním zařazeným pacientem („N of 1 trials“)

Od dílu č. LXIV našeho seriálu probíráme problematiku studií s jediným zařazeným pacientem (N1 studie) jako téma nabývající na významu v souvislosti s personalizací medicíny. Srovnáním s „klasickými“ studiemi jsme v díle LXV vymezili velmi široké pole uplatnění pro N1 protokoly, zejména v časných fázích klinického hodnocení (jako pilotní experimenty zaměřené na typologii léčených pacientů, optimalizaci dávky léků, řešení nežádoucích efektů léčby či toxicity). Rostoucí význam nabývají N1 studie rovněž jako experimenty verifikující závěry randomizovaných kontrolních studií v klinické praxi. N1 studie se uplatňují v situacích, kdy z objektivních důvodů nelze získat dostatečný počet subjektů pro komparativní randomizované studie. Jde zejména o:

výzkum vzácných onemocnění;
výzkum nemocí nebo klinických situací charakterizovaných vysokým počtem markerů, které by si vynutily nerealizovatelný počet ramen „klasické“ studie;
výzkum léčebných postupů v klinických situacích, kdy extrémní heterogenita neumožňuje nezkreslené postavení kontrolní a experimentální skupiny (např. optimalizace dávky léků tišících bolest v paliativní medicíně).

Výhodou N1 studií je, že zkoumáme vývoj sledované veličiny na jediném subjektu v čase, přičemž tento subjekt prochází různými etapami experimentu –⁠ např. „placebo –⁠ lék –⁠ placebo“. Subjekt se tak stává sám sobě kontrolou. Pokud pomocí N1 protokolu nastavujeme léčebný postup pro pacienta, pak je jeho léčba řízena na základě informací generovaných z jeho vlastních dat. Tímto se N1 protokoly principiálně odlišují od běžných statistických analýz, kde postupy u konkrétního jedince nastavujeme dle poznatků získaných na reprezentativním vzorku jiných jedinců. N1 studie tak lépe reflektují postupy klinické praxe, která vždy léčí konkrétního pacienta. Proto jsme v minulém díle uvedli, že koncept N1 studií sbližuje výzkum a klinickou praxi. Plány N1 studií přitom mohou být velmi flexibilní a lze je realizovat téměř v plné škále experimentálních modelů jako klasické studie. Design N1 studií může být prospektivní, průřezový i retrospektivní, jednotlivé N1 profily lze slučovat, srovnávat i kombinovat na základě metaanalýz, plány mohou zahrnovat randomizaci intervencí, jejich „switch“ či dávkový gradient u farmakoterapie.

V tomto a příštím díle seriálu navazujeme na předchozí výklad a pokusíme se čtenářům přiblížit hlavní postupy statistických hodnocení N1 studií.

Připomeňme si typický datový výstup z N1 experimentu. Jak ukazuje Příklad 1, jde o časovou řadu hodnot, které získáváme v různých fázích (etapách) experimentu. Pořadí etap může být v závislosti na konkrétní situaci určováno různě, nejčastěji připadají v úvahu tři zásadní přístupy:

etapy se střídají podle plánu studie, který je pevně určen již na počátku; plán tak naplňuje definici protokolem kontrolované prospektivní studie;
jednotlivé intervence jsou střídány náhodně (s využitím randomizace, která se nejlépe uplatní u dlouhodobějších studií, kde je prostor pro opakované nasazování různých intervencí); náhodné střídání intervencí musí být v souladu s klinickými a etickými principy –⁠ nelze například dopustit náhodnou kumulaci etap agresivní léčby v čase apod;
intervence jsou nasazovány v průběhu experimentu jako reakce na aktuální vývoj a možnosti léčby.

**Příklad 1. Ukázka datových výstupů a běžného statistického shrnutí N1 studie.**

Výše uvedené možnosti činí z N1 experimentů velmi silný nástroj pro sledování široké škály klinických situací. Plán N1 studie tak může například:

striktně sledovat protokol psychologické studie, kdy jsou po sobě pevně střídány fáze klidu s fázemi psychologické intervence a je sledována udržitelnost jejich efektu v čase;
na základě randomizačního plánu nasazovat po sobě tři různé léky a sledovat jejich vzájemné interakce a úhrnný vliv na sledovanou veličinu;
nasadit léčbu a v této pokračovat až do situace, kdy dojde k eskalaci toxicity –⁠ následně v reálném čase na situaci operativně reagovat a léčbu vysadit po dobu nezbytnou k zvládnutí komplikací.

Měření prováděná v rámci jednotlivých etap (E₁ –⁠ E_k) generují základní soubor dat N1 studie. Předpokládáme, že z každé etapy vznikne více dílčích měření. Počet měření zde představuje velikost statistického vzorku (n_E₁, …, n_Ek), zatímco u „klasických“ klinických studií je velikost vzorku dána počtem zařazených jedinců. Úkolem statistického hodnocení N1 pokusu většinou je:

Sumární statistika hodnot získaných v jednotlivých etapách. Za celou etapu můžeme souhrnně odhadovat např. průměr, medián, standardní chybu odhadu průměru, percentily, min. –⁠ max., apod. Jakákoli statistická veličina zde může být odhadnuta, pokud to dovolí počet měření odebraných v rámci etapy.
Statistické srovnání hodnot jednotlivých etap je principiálním cílem N1 studií. Nejde přitom o úkol, který by se jakkoli vymykal standardní statistické analýze, v podstatě můžeme pro srovnání využít jakýkoli statistický test, který vyhovuje typu sbíraných dat a jejich variabilitě. Rovněž můžeme pracovat s různými vstupními hypotézami, které zde však stanovují vstupní otázky pro srovnání výstupů jednotlivých etap měření. Předpokládejme srovnání etapy podávající již zavedený lék 1(L1) s následnou experimentální etapou podání nového léku 2 (L2). Plán N1 studie pak může pracovat zejména s následujícími hypotézami:

superiorita –⁠ předpokládá průkaz vyšší účinnosti L2 proti L1, přičemž jako významný bude označen klinicky významný rozdíl v účinnosti;
non-inferiorita –⁠ hypotéza předpokládající, že účinnost L2 není významně nižší (horší) než L1; jako významně nižší by opět byl označen klinicky významný rozdíl v účinnosti;
ekvivalence –⁠ testována je shoda L1 a L2, hypotéza předpokládá, že absolutní rozdíl v účinnosti L1 a L2 není vyšší než klinicky významný rozdíl.

Analýza celkového trendu, který zachycujeme přes více měřených etap. K takovému zadání je důvod zejména u studií sledujících dlouhodobější efekt léčebné intervence či kumulativní efekt více po sobě aplikovaných intervencí. Statisticky jde opět o standardní úlohu, ve které můžeme např. kvantifikovat dosažený rozdíl hodnot mezi dvěma body měření, hodnotit relativní index růstu či poklesu hodnot v čase nebo aplikovat regresní analýzu hodnotící vývoj sledované veličiny v závislosti na čase. Kvantifikaci trendu v časové řadě N1 studií využíváme zvláště v následujících situacích:

kvantifikace trendu v měřené veličině pod vlivem aplikace rostoucích dávek zkoumaného léku, kdy sledujeme odpověď pacienta v závislosti na dávce léku (dose-response design);
analýza pozaďového trendu ve sledované veličině, která se může u pacienta měnit v čase nezávisle na experimentálních etapách; tento jev hrozí zejména u dlouhodobějších N1 studií, kde mohou pozaďové změny v měřené veličině silně zkreslit závěry výzkumu.

Je patrné, že ačkoli působí studie o jednom pacientovi na první pohled značně kuriózně, ve skutečnosti směřují k verifikaci zcela běžných hypotéz a aplikují přitom běžné statistické postupy. A tedy ačkoli se řada běžných učebnic zaměřených na klinický výzkum (např. Chow et al 2003; Chow a Liu 2004) N1 studiím nijak významně nevěnuje, není to zásadní problém. V podstatě všechna obecná pravidla platná pro klasické studie lze při respektování určitých specifik aplikovat na N1 experimenty. Specifika N1 studií neovlivňují přímo statistické zpracování dat, ale mají velký význam při interpretaci výsledků. Ve stručném výčtu zde probereme ta nejpodstatnější.

Variabilita hodnot

Zdrojem variability u N1 studií nejsou rozdíly mezi jedinci, tak jako u klasických studií pracujících např. s kontrolním a experimentálním ramenem. Variabilitu zde generují změny měřených hodnot v čase a ty mohou být způsobeny náhodnými fluktuacemi, náhlými změnami vývoje či trendovou složkou, kterou nutně nemusí vyvolat sama léčebná intervence. Proto je u N1 studií klíčové zahájit měření kontrolní (bazální) fází, kdy je bez ovlivnění pouze měřena sledovaná veličina. Získáme tak reprezentativní data o jejím klidovém chování i očekávatelných fluktuacích v čase. K těmto vstupním datům lze vztahovat výsledky následných etap experimentu (pacient se stává sám sobě kontrolou).

Reprezentativnost a statistická síla

Je zřejmé, že čím více měření pořídíme v rámci jednotlivých etap N1 studie, tím spolehlivější výsledek získáme. Počet měření v etapách experimentu je zásadní a měl by být dobře nastaven s ohledem na typ sledované veličiny a její výkyvy v čase. U některých parametrů má smysl provádět minutová měření, u jiných je postačující denní frekvence apod. Příliš vysoká četnost měření může maskovat relevantní změnu a naopak nízká četnost měření může vést ke ztrátě informace. Počet získatelných hodnot samozřejmě souvisí s časovou délkou jednotlivých etap, která tak určuje rozsah získaného souboru dat.

Zavádějící faktory či faktory maskující efekt zkoumané intervence

Také N1 studie se potýkají s tímto problémem, nicméně v poněkud jiné podobě než studie klasické. Prostor pro uplatnění těchto vlivů vzniká totiž v závislosti na délce trvání studie. U dlouhodobých N1 studií hrozí, že nesledované pozaďové faktory (např. související s životním stylem pacienta) změní významně své hodnoty a ovlivní chování veličiny sledované ve studii. Řešení je podobné jako u klasických studií, tedy co nejkomplexnější popis charakteristik pacienta a nemoci, sledování všech potenciálně významných parametrů souběžně se sledovanou veličinou a zařazení více měřených etap v čase. Dlouhotrvající N1 studie ovšem také čelí riziku ztráty pacienta ze sledování podobně jako studie klasické.

Po sobě jdoucí etapy N1 studie nejsou vzájemně nezávislé

Vzájemná závislost měření je očekávatelná, neboť sledujeme vývoj hodnot u téhož pacienta, ale zároveň představuje jeden z potenciálně nejzávažnějších zdrojů zkreslení výsledků N1 studií. Představme si typický plán N1 studie jako „placebo (P1) –⁠ léčba (L1) –⁠ placebo (P2) –⁠ léčba (L2) –⁠ placebo (P3)“. Fáze L1 může ve svém účinku nebo vedlejšími efekty ovlivnit podstatnou část měření ve fázi P2 a tento efekt může následně kulminovat ve fázi P3. Zanedbání vzájemné závislosti měření v čase může vést například k nadhodnocení vlivu léčby L2. Vzájemný vliv etap měření je v literatuře nazýván carryover effect. Pokud víme, že tento zdroj zkreslení hrozí, je nezbytné tomu přizpůsobit plán studie. K dispozici přitom máme následující možnosti:

Nastavit dostatečnou délku jednotlivých etap měření tak, aby bylo možné přesah účinku mezi nimi odfiltrovat; např. tím, že počáteční hodnoty každé nové etapy měření nebudeme zařazovat do analýzy.
Umožní-li to daná situace, zařazovat kontrolní a intervenční etapy po sobě opakovaně, aby byl přesah účinku lépe kvantifikovatelný. Jiným řešením může být randomizace opakovaných střídání experimentálních a kontrolních etap.
Zařazení přestávek v měření, například v sekvenci „placebo –⁠ léčba –⁠ přestávka –⁠ placebo –⁠ přestávka –⁠ léčba“. Periody s přestávkami bývají u lékových studií někdy nazývané washout periods. Tento postup může významně snížit vzájemný překryv účinku jednotlivých etap experimentu, ne vždy ale jeho realizaci dovolí léčebný protokol či povaha nemoci.

Rovněž metodika statistického hodnocení musí reflektovat výše uvedená specifika N1 studií. Metodické možnosti jsou zde bohaté a dostupná literatura nabízí množství postupů: od prostého popisu a grafického znázornění výsledků až po složitou analýzu trendů a periodicity v časových řadách. Účelem tohoto textu není zavalit čtenáře výčtem možných statistických testů, spíše se pokusíme stručně shrnout základní principy, které musí být při analýze výsledků N1 studií vždy respektovány (Spiegelhalter 1988; Rochon 1990; Lillie et al 2011):

Při srovnání sumárních statistik mezi dvěmaetapami studie jde vždy o srovnání párové, tedy srovnávající hodnoty získané měřením na témže jedinci. Nelze pominout vzájemnou vazbu jednotlivých měření, a to po celou dobu trvání studie.
Zejména hodnoty získané měřením po sobě jdoucích časových bodů mohou být vzájemně významně závislé. Tedy např. je-li hodnota měřená v bodě t vyšší než v bodě t –⁠ 1, pak je velká pravděpodobnost, že rovněž hodnota v bodě t + 1 bude mít rostoucí tendenci. Tento jev se odborně nazývá autokorelace hodnot a zde popsaný příklad by vyjadřoval tzv. pozitivní autokorelaci, při které po sobě jdoucí měření vykazují stejný trend. V datech ale není nijak vzácná ani autokorelace negativní, kdy jsou trendy po sobě jdoucích měření opačné. Autokorelace může provazovat jen dvě nejbližší hodnoty měření (autokorelace 1. řádu) anebo se může projevit přes dva a více bodů (autokorelace 2. a vyššího řádu). Vzájemná závislost měření samozřejmě ztěžuje interpretaci a zejména komplikuje odlišení skutečných výsledků jednotlivých etap experimentu (carryover effect).
Výskyt autokorelace v podstatě vylučuje použití přímých srovnávacích testů, například srovnání odhadu průměrů hodnot mezi dvěma etapami experimentu párovým t-testem. Taková srovnání mohou být velmi zavádějící. Řešením je sofistikovaná analýza časových řad, která dovede vliv autokorelace odfiltrovat. Výklad těchto metod je v tuto chvíli mimo prostorové možnosti tohoto dílu seriálu, nicméně existují i jiné možnosti, jak omezit zkreslující vliv autokorelace v časové řadě –⁠ např. nezahrnutí několika prvních hodnot z každé etapy do analýzy apod.

Čtenář, který pročetl výklad v předchozím a tomto díle našeho seriálu, bude jistě souhlasit se závěrem, že N1 studie jsou metodickou základnou pro individualizaci hodnocení v klinickém výzkumu. Z tohoto pohledu je zajímavý ještě jeden aspekt, který N1 studie odlišuje od klasických studií. Zatímco v klasických protokolech jsou odlehlé hodnoty či subjekty s netypickým klinickým projevem (nulová odpověď na léčbu, významné komplikace léčby, omezená spolupráce pacienta apod.) často vylučovány z hodnocení, N1 studie se právě na takové případy primárně zaměřují. Smyslem N1 protokolu pak může např. být nalezení léčebného postupu, který zabere u pacientů s nulovou odpovědí na léčbu (tzv. non-responders). Vzhledem k očekávatelné heterogenitě charakteristik u takové kohorty je ideálním nástrojem sada N1 studií, jejichž poznatky lze následně srovnávat a hledat nějaký společný prvek.

doc. RNDr. Ladislav Dušek, Ph.D.

Institut biostatistiky a analýz,

LF MU,

Brno

e‑mail: dusek@iba.muni.cz

Zdroje

1. Chow S, Liu J. Design and analysis of clinical trial 2nd edition. New Jersey: John Wiley&Sons 2004.

2. Chow S, Shao J, Wang H. Sample size calculations. In: Clinical Research. 1st ed. New York: Marcel Dekker 2003.

3. Lillie EO, Patay B, Diamant J, et al. The n-of-1 clinical trial: the ultimate strategy for individualizing medicine? Per Med 2011;8(2):161 –⁠ 173.

4. Spiegelhalter DJ. Statistical issues in studies of individual response. Scand J Gastroenterol Suppl 1988;147 : 40 –⁠ 5.

5. Rochon J. A statistical model for the “N-of-1” study. J Clin Epidemiol 1990;43(5):499 –⁠ 508.

6. Zucker DR, Schmid CH, McIntosh MW, et al. Combining single patient (n-of-1) trials to estimate population treatment effects and to evaluate individual patient responses to treatment. J Clin Epidemiol 1997;50(4):401 –⁠ 10.