Analýza dat v neurologii
XL. Studium vlivu zavádějících faktorů na odhad poměru šancí a relativního rizika

Stáhnout PDF

Autoři: L. Dušek; T. Pavlík; Jiří Jarkovský ; J. Koptíková
Působiště autorů: Institut biostatistiky a analýz, Masarykova univerzita, Brno
Vyšlo v časopise: Cesk Slov Neurol N 2013; 76/109(4): 519-523
Kategorie: Okénko statistika

Podle slibu, který jsme dali v předchozím díle seriálu, se v následujícím textu budeme podrobně zabývat posuzováním vlivu tzv. zavádějících faktorů (chybových faktorů či kovariančních faktorů) na odhad poměru šancí („odds ratio“, OR) a relativního rizika („relative risk“, RR) z tabulek četností 2 × 2. Připomeňme, že zavádějící faktory mohou vážně zkreslit výsledný odhad OR nebo RR a mohou dokonce vést k zcela chybnému závěru jinak správně provedených experimentů. Příkladem může být výzkum rizikových faktorů na vznik zhoubného nádoru plic v retrospektivní studii případů a kontrol, kde při výběru probandů nekontrolujeme výskyt kuřáků v obou skupinách. Rozdíl ve výskytu kuřáctví, jako silného faktoru eskalujícího riziko plicních nádorů, mezi srovnávanými skupinami může závěry studie zcela znehodnotit. Ideální situací je, pokud o zavádějícím faktoru víme předem a můžeme jeho vlivu přizpůsobit design studie; pokud toto možné není, aplikujeme zpětně korekci (adjustaci) výsledků. Význam korekčních postupů spočívá především v tom, že zdaleka ne vždy můžeme mít všechny zavádějící faktory pod kontrolou při nabírání probandů do studie. Kromě toho může být identifikace a poznání vlivu zavádějících faktorů přímo předmětem výzkumu, jak dále v tomto díle doložíme.

V předchozím díle seriálu jsme popsali tzv. Mantelovu ‑⁠ Haenszelovu metodu (MH) odhadu váženého (adjustovaného) OR nebo RR u souborů dat, které mohou být pod vlivem zavádějícího faktoru. Ve stručnosti připomeňme základní postup; původní tabulku četností 2 × 2 rozdělíme (stratifikujeme) podle k úrovní zkoumaného zavádějícího faktoru (strata) na sadu k 2 × 2 tabulek. Původní výpočet OR nebo RR z tabulky 2 × 2 označujeme jako hrubý odhad („crude estimate“), výpočet metodou MH nazýváme „Mantel ‑⁠ Haenszel OR (RR)“ (OR_MH, RR_MH). Je‑li vliv zavádějícího faktoru významný, pak se hrubý odhad od výsledného adjustovaného výpočtu podstatně liší. Příklad 1a dokládá význam adjustace odhadu OR metodou MH, která odhalila statisticky významnou asociaci zkoumaných jevů; původní hrubý odhad OR vlivem zavádějícího faktoru tento vztah nedetekoval. A naopak v příkladu 1b dokumentujeme adjustaci odhadu OR metodou MH, která změnila statisticky významný hrubý odhad OR na výslednou statisticky nevýznamnou hodnotu.

**Příklad 1. Korekce odhadu poměru šancí (OR) metodou dle Mantela-Haenszela.**

Je ovšem nutné si uvědomit, že Mantelova ‑⁠ Haenszelova metoda směřuje k váženému odhadu OR, resp. k váženému průměru dílčích odhadů OR vypočítaných v jednotlivých stratech. Výsledkem je společný odhad OR, včetně příslušného intervalu spolehlivosti, v zahraniční literatuře také nazývaný „Mantel ‑⁠ Haenszel estimate of common odds ratio“. Tento společný odhad je generován za předpokladu platnosti nulové hypotézy shody dílčích odhadů OR, resp. RR v jednotlivých stratech. Pokud prokážeme, že se dílčí odhady OR (RR) počítané v rámci strat daných zavádějícím faktorem statisticky významně liší, pak je žádoucí vedle společného adjustovaného odhadu prezentovat také dílčí odhady OR (RR) pro jednotlivá strata.

Změna interpretace společného odhadu OR (RR) po adjustaci původních výsledků není v žádném případě prohrou vědeckého bádání, naopak. Adjustace pomohla v obou příkladech 1a, b odhalit významný vliv zavádějícího faktoru. Je‑li tento vliv sám o sobě klinicky zajímavý, pak jej můžeme dále kvantifikovat a studovat. Oba příklady dokládají takový následný rozbor grafickou formou pomocí tzv. forest plotu (viz díl XXXVIII seriálu), který dokumentuje dílčí odhady OR podle úrovní zavádějícího faktoru. Z rozdílů v zastoupení kategorií zavádějícího faktoru mezi případy a kontrolami také vidíme, jakým způsobem daný faktor statistickou významnost hrubého odhadu OR maskoval (příklad 1a) anebo chybně nadhodnocoval (příklad 1b). Takto publikované výsledky správně upozorní badatele na existenci a vliv zavádějícího faktoru a další studie s ním již mohou pracovat prospektivně.

Standardním testem homogenity více odhadů OR (RR) je v předchozím díle představený test Breslowa ‑⁠ Daye (BD test). Test využívá již provedený vážený odhad OR (RR) dle Mantela ‑⁠ Haenszela a hodnotí odchylky dílčích odhadů v jednotlivých stratech proti hodnotě předpokládané při platnosti hypotézy o homogenitě dílčích OR. Kromě průkazu statisticky významných rozdílů mezi dílčími odhady OR (RR) lze BD test také využít k identifikaci podskupin strat, jejichž dílčí odhady OR (RR) jsou vzájemně homogenní (příklad 1a, b).

Metoda odhadu společného OR (RR) dle Mantela ‑⁠ Haenszela je univerzální a robustní, nemá téměř žádné omezující předpoklady a lze ji s úspěchem použít i za situace, kdy jsme limitováni velikostí vzorku a některá políčka dílčích tabulek četností jsou i nulová. Jedinou podmínkou je, aby souhrnný součet ve jmenovateli vztahu pro výpočet OR_MH (RR_MH) byl nenulový. Výhodou je rovněž možnost kalkulace intervalu spolehlivosti pro odhad společného OR (RR). Již víme, že podle toho, zda interval spolehlivosti zahrnuje referenční hodnotu 1, můžeme posuzovat statistickou významnost odhadu OR (RR); pokud je hodnota 1 zahrnuta, pak jde o statisticky nevýznamný vztah a naopak. Tento přístup ale bývá kritizován, neboť neposkytuje přímo odhad dosažené hladiny statistické významnosti („p value“). Hodnotitelé zahraničních odborných časopisů se často nespokojí s konstatováním statistické významnosti dle 95% intervalu spolehlivosti a chtějí přímo vyčíslit hodnotu p, které daný odhad OR (RR) dosáhnul.

Naštěstí i tento požadavek lze relativně lehce splnit, a sice testem dle Cochrana ‑⁠ Mantela ‑⁠ Haenszela (CMH test), který hodnotí platnost nulové hypotézy: OR_MH = 1, resp. RR_MH = 1. Tuto hypotézu lze také formulovat tak, že v žádné z k podskupin daných úrovněmi zavádějícího faktoru neexistuje vztah mezi zkoumanými znaky, tedy mezi expozicí a sledovanou událostí. Výpočet CMH testu přibližuje příklad 2. Testová statistika má chí ‑⁠ kvadrát rozdělení s jedním stupněm volnosti. Výpočet celkem logicky srovnává reálnou hodnotu četností v k dílčích tabulkách četností (k strat pro výpočet OR_MH) s hodnotou očekávanou při platnosti nulové hypotézy. Výsledkem je závěr o statistické významnosti váženého (adjustovaného) odhadu OR_MH (RR_MH), včetně kvantifikované hladiny statistické významnosti (p).

**Příklad 2. Cochran-Mantel-Haenszelův test (CMH) statistické významnosti adjustovaného odhadu poměru šancí.**

Z výpočtů v příkladu 2 je zřejmé, že testová statistika dle Cochrana ‑⁠ Mantela ‑⁠ Haenszela je zobecněním „běžné“ statistiky χ² pro tabulku četností 2 × 2. Tímto testem hodnotíme hypotézu nezávislosti výskytu dvou jevů. CMH test posuzuje nezávislost expozice faktorem a výskytu sledované události, avšak při současné kontrole vlivu zavádějícího faktoru. Jde tedy o hodnocení podmíněné vzhledem k podskupinám vytvořeným kategoriemi zavádějícího faktoru. Proto se také v zahraničních článcích často objevuje termín „test of common conditional odds ratio“.

Výklad výpočtu CMH testu zde doplníme technickou poznámkou o tzv. korekci na kontinuitu (také Yatesova korekce). Tato bývá využívána při výpočtech chí ‑⁠ kvadrát statistiky s jedním stupněm volnosti, typicky tedy u 2 × 2 tabulek četností. Její aplikace se projeví jako odečítaná hodnota 0,5 v čitateli zlomku pro výpočet hodnoty χ². Smysl této korekce je ve zlepšení aproximace vypočítané statistiky χ² na teoretické rozdělení, a to zejména v případě, kdy je v některé buňce tabulky četností menší počet pozorování než 5. Příklad výpočtu této korekce uvádíme v příkladu 3. Korekci jsme zmínili zejména proto, že její použití v CMH testu musí být při publikování výsledků explicitně uvedeno. Nicméně nejlepším řešením je zajistit dostatečnou velikost vzorku, tedy v každém poli souhrnné tabulky četností alespoň hodnotu 5 (Mantel a Fleiss, 1980).

**Příklad 3. Výpočet Cochranova-Mantelova-Haenszelova (CMH) testu s korekcí na kontinuitu.**

Vraťme se nyní ve výkladu k zavádějícím faktorům v asociačních studiích. Mantelova ‑⁠ Haenszelova metoda pro odhad adjustovaného OR (RR) umožňuje identifikovat vliv zavádějícího faktoru srovnáním adjustovaného odhadu s hrubým odhadem z původní tabulky četností. Pokud se oba odhady mezi sebou neliší, je vliv zavádějícího faktoru zanedbatelný, a naopak. Následný CMH test může rovněž přispět k odhalení vlivu zavádějícího faktoru na asociaci mezi zkoumanými jevy. CMH test vyjde jako statisticky nevýznamný v zásadě ve dvou modelových situacích:

Výsledný adjustovaný odhad OR_MH nebo RR_MH je skutečně statisticky nevýznamný a neliší se od hodnoty 1; zde uzavíráme, že asociace zkoumaných jevů neexistuje.
Při velkých rozdílech mezi dílčími hodnotami OR (RR) v rámci jednotlivých strat, tzn. za situace, kdy zavádějící faktor způsobuje heterogenitu dílčích odhadů v rámci strat.

První výše uvedenou modelovou situaci přiblížil příklad 1b. Pokud nastane druhá ze zmíněných variant, můžeme objevit velmi překvapující skutečnosti. Statisticky nevýznamné hodnoty χ²_(CMH) totiž získáme i v situaci, kdy v některých stratech pozorujeme asociaci v jednom směru a v jiných přesně opačnou. Jakoby zkoumaná expozice byla při některých hodnotách zavádějícího faktoru riziková a při jiných protektivní. Výsledek tedy indikuje možnou interakci zavádějícího faktoru a samotného účinku expozice. Takový zavádějící faktor nazýváme faktorem modifikujícím účinek („effect modifier“). Čtenáři budou jistě souhlasit, že za této situace má studium vlivu zavádějícího faktoru na účinek expozice největší prioritu a odhad společného (adjustovaného) OR (RR) pomocí Mantelovy ‑⁠ Haenszelovy metody postrádá smysl, neboť by kombinoval protichůdné dílčí odhady v různých stratech. Dále tedy postupujeme aplikací Breslowova ‑⁠ Dayova testu a hledáme vzájemně shodná (homogenní) strata, jejichž dílčí odhady OR (RR) se neliší. K prezentaci výsledků lze rovněž použít forest plot. Tento typ analýz je doložen v příkladu 4.

**Příklad 4. Analýza vztahu rizikového faktoru a výskytu události za přítomnosti zavádějícího faktoru s modifikujícím účinkem.**

Výsledek příkladu 4 dokumentuje, že pokud začneme studovat vliv zavádějícího faktoru na expozici rizikovým či protektivním faktorem, původní úloha se rozpadne do analýzy dílčích frekvenčních tabulek a obecný odhad OR (RR) víceméně ztratí smysl.
Stratifikace podle zavádějícího faktoru velmi často vede k ordinálně seřazeným kategoriím (např. nekuřák → bývalý kuřák → aktivní kuřák nebo nízký věk → střední věk → vysoký věk). Při takovém zadání má smysl analyzovat nejen celkovou asociaci zavádějícího faktoru s jinými znaky, ale i její trendovou složku. Těmto metodám se budeme věnovat v některém z dalších dílů seriálu.

Doufáme, že se nám podařilo přesvědčit čtenáře o potřebnosti a významu Mantelovy ‑⁠ Haenszelovy metody, a také o její jednoduché aplikovatelnosti. O významu této metodiky svědčí i fakt, že její původní publikace patří k jedné z nejcitovanějších vědeckých prací světa. Původní koncept byl v 50. letech minulého století představen na retrospektivním modelu studie případů a kontrol, následně již další autoři rozpracovali metodu i pro prospektivní kohortové studie, a tedy pro odhad Mantelova ‑⁠ Haenszelova relativního rizika. Pro jednoduchost jsme při výkladu využívali příklady s nejjednoduššími čtyřpolními tabulkami četností, avšak metodika hodnocení adjustovaných odhadů OR (RR) je rozpracována i pro složitější asociační tabulky s více řádky a sloupci. Tento výklad by překročil možný rozsah našeho článku, proto čtenáře odkazujeme na relevantní literaturu, např. Kuritz et al (1988) nebo Agresti (1990). Dalším omezením našeho výkladu je jeho zaměření pouze na jednorozměrné problémy (expoziční faktor je pro tabulku četností 2 × 2 vždy pouze jeden) a na kategoriální zavádějící faktory. Pokud bychom chtěli studovat současný vliv více expozičních faktorů na výskyt nějaké klinické události nebo zavádějící faktor zařadit jako spojitou proměnnou (např. věk), pak bychom s výpočty dle Mantela ‑⁠ Haenszela již nevystačili. Pro tyto komplexnější problémy lze doporučit metodu logistické regrese, které se budeme věnovat v některém z příštích dílů seriálu.

Na závěr alespoň stručně zmiňme něco z historie probíraného testu dle Cochrana ‑⁠ Mantela ‑⁠ Haenszela. Tento postup byl nejprve v roce 1954 navržen Cochranem a následně modifikován Mantelem a Haenszelem. I z toho důvodu v literatuře najdeme i zkrácený název Mantelův ‑⁠ Haenszelův test. Název testu bychom ale neměli zaměňovat s Mantelovou ‑⁠ Haenszelovou metodou, neboť ta jako metodický koncept odhaduje adjustované hodnoty OR_MH, zatímco test pomocí statistiky χ²_(CMH) ověřuje platnost hypotézy OR_MH = 1. Všechny tři vědce, kteří se na vývoji této metodiky podíleli, lze označit za jedny z nejvýznamnějších osobností biostatistiky a aplikované matematiky minulého století:

William G. Cochran (1909 –⁠ 1980), původem Skot, významný matematik a statistik působící v USA,
Nathan Mantel (1919 –⁠ 2002), významný matematik a biostatistik pracující převážnou část své kariéry pro National Cancer Institute, USA,
William M. Haenszel (1910 –⁠ 1998), biostatistik a epidemiolog, který mimo jiné v USA založil jeden z nejvýznamnějších onkologických registrů světa (tzv. SEER: Surveillance Epidemiology and End Results).

doc. RNDr. Ladislav Dušek, Dr.

Institut biostatistiky a analýz

MU, Brno

e-mail: dusek@cba.muni.cz

Zdroje

1. Agresti A. Categorical Data Analysis. New York: Wiley 1990.

2. Cochran WG. Some methods for strengthening the common χ² tests. Biometrics 1954; 10 : 417 –⁠ 451.

3. Kuritz SJ, Landis JR, Koch GG. A general overwiew of Mantel ‑⁠ Haenszel methods: application and recent developments. Ann Rev Pub Health 1988; 9 : 123 –⁠ 160.

4. Mantel N, Fleiss JL. Minimum expected cell requirements for the Mantel ‑⁠ Haenszel one degree of freedom chi ‑⁠ square test and a related rapid procedure. Am J Epidem 1980; 112 : 129 –⁠ 134.

5. Mantel N, Haenszel W. Statistical aspects of the analysis of data from retrospective studies of disease. J Natl Cancer Inst 1959; 22(4): 719 –⁠ 748.