Analýza dat v neurologii
LIV. Koncept atributivního rizika v analýze populačních studií – I. Aplikace v různých typech studií

Stáhnout PDF

Autoři: L. Dušek; T. Pavlík; J. Jarkovský ; J. Koptíková
Působiště autorů: Masarykova univerzita, Brno ; Institut biostatistiky a analýz
Vyšlo v časopise: Cesk Slov Neurol N 2015; 78/111(6): 717-720
Kategorie: Okénko statistika

V předchozím díle seriálu jsme jako nové téma otevřeli populační hodnocení rizika v asociačních studiích, kde studujeme vliv expozičního faktoru a jeho následku, např. nemoci. Rozšířili jsme dosud probíraný poměr šancí (OR) a relativní riziko (RR) o další ukazatele (atributivní riziko, atributivní frakce, atributivní počet), které mohou podstatně rozšířit interpretaci získaných dat. V tomto díle se pokusíme dané téma dále rozpracovat a přiblížit tyto pojmy více pomocí ukázek aplikací.

Nejprve připomeneme nově probírané ukazatele a jejich interpretaci formou jednoduchého číselného příkladu. Zkoumáme v prospektivní kohortové studii vliv rizikového faktoru v anamnéze pacientů na následné komplikace léčby. Číselným výstupem studie je tabulka četností 2 × 2 (tab. 1). K výpočtu všech parametrů lze z této tabulky využít vztahy vysvětlené v předchozím díle seriálu; zde tyto postupy doplňujeme pomocí značení buněk tabulky a, b, c, d. Jde o poměrně užitečný nástroj, podle kterého lze výpočty rychle technicky provádět a snadno realizovat i bez znalosti matematického aparátu.

**Tab. 1. Výsledky kohortové studie zkoumající vliv určitého rizikového faktoru v anamnéze pacientů na komplikace určité léčby*.**

Nejprve odhadneme incidenci jevu (komplikace léčby) ve skupině exponované faktorem (I_E) a neexponované faktorem (I_NE):

I_E = a/ (a + b) = 700/ 1 000 = 0,7;
I_NE = c/ (c + d) = 300/ 1 000 = 0,3.

Hodnoty incidence rizikového jevu také někdy nazýváme rizikem (R), zde tedy jde o riziko komplikací v exponované (R_E) a neexponované (R_NE) skupině.

Hodnotu incidence rizikového jevu v celém souboru, tedy odhad incidence v celé populaci (I_P), spočítáme takto:

I_P = (a + c)/ (a + b + c + d) = 0,5.

V dalším kroku odhadneme relativní riziko (RR), atributivní riziko (AR), atributivní frakci vyjádřenou v procentech (ARF%), populační atributivní riziko (PAR) a populační atributivní frakci vyjádřenou v procentech (PAF%):

RR = R_E/R_NE = [a/ (a + b)]/[c/(c + d)] = 0,7/ 0,3 = 2,33;
AR = R_E – R_NE = [a/ (a + b)] – [c/ (c + d)] = 0,7 –⁠ 0,3 = 0,4;
PAR = I_P – I_NE = [(a + c)/ N] – [c/ (c + d)] = 0,5 –⁠ 0,3 = 0,2;
ARF% = [(R_E – R_NE)/ R_E] × 100 = [(0,7 –⁠ 0,3)/ 0,7] × 100 = 57,1 %;
PAF% = [(I_P – I_NE)/ I_P] × 100 = [(0,5 –⁠ 0,3)/ 0,5] × 100 = 40 %.

Ve shodě s předchozím dílem tohoto seriálu zde ještě nabízíme ukázku alternativních vztahů využívajících znalosti hodnoty RR. Jde pouze o alternativní výpočet, který musí samozřejmě vést ke stejným výsledkům. Tyto vztahy uvádíme zejména proto, že se v literatuře objevují často bez dalších vysvětlení, a mohou tak působit zmatečně:

ARF = (RR –⁠ 1)/ RR = (2,33 –⁠ 1)/ 2,33 = 0,571;
PAF = P_E (RR –⁠ 1)/ [1 + P_E (RR –⁠ 1)] = (0,5 × 1,33)/ [1 + (0,5 × 1,33)] = 0,4;

kde P_E je prevalence rizikového faktoru v celém vzorku (populaci), a tedy P_E = 1 000/ 2 000 = 0,5.

Pro praxi není ovšem rozhodující forma výpočtu, ale především správná interpretace výsledků. Zásadní závěry výše uvedených výsledků shrnujeme v následujících bodech, přičemž interpretaci vždy řadíme ke konkrétním parametrům:

R: pacienti s pozitivní anamnézou mají vyšší riziko výskytu komplikací než osoby bez rizikového faktoru v anamnéze (0,7 vs. 0,3);
RR: pacienti s pozitivní anamnézou mají 2,33× vyšší riziko výskytu komplikací než osoby bez rizikového faktoru v anamnéze;
AR: na 1 000 pacientů s pozitivní anamnézou připadá 400 komplikací vzniklých v důsledku rizikového faktoru v anamnéze;
ARF%: ze všech komplikací v souboru pacientů s pozitivní anamnézou jich 57,1 % bylo způsobeno působením rizikového faktoru, tedy 57,1 % ze 700 komplikací je 400;
PAR: na 1 000 lidí v celém souboru (populaci) připadá 200 komplikací vzniklých v důsledku výskytu rizikového faktoru v anamnéze;
PAF%: ze všech komplikací v celém souboru (v celé populaci) jich 40 % je způsobeno vlivem rizikového faktoru v anamnéze.

Odhad AR nachází uplatnění v různých typech studií. Výše uvedený příklad pracuje s daty prospektivní observační studie, ve které se dostáváme k věrohodným odhadům incidence jevu v exponované i v neexponované skupině. U těchto studií jsme schopni objektivně kvantifikovat incidenci sledovaných jevů, a tudíž také exaktně kvantifikovat populační dopad zkoumaných expozičních faktorů. Ve výše uvedeném případě byli jedinci nabráni podle faktoru v anamnéze (řádky tabulky) a odhad výskytu komplikací byl proveden následným sledováním v čase. Odhad incidence tak není zkreslen vlastním náběrovým plánem. U těchto studií lze objektivně odhadnout RR a všechny výše uvedené parametry, vč. AR a PAR.

Čtenáři mohou vnést legitimní námitku, že při analýze relativně jednoduché tabulky četností není nutné kalkulovat tak vysoký počet statistických ukazatelů. Samozřejmě je i zde určující cíl výzkumu a požadovaná interpretace výsledků, uvedené parametry nejsou povinné a nemusí být vždy využity všechny. Nicméně souběžný odhad více ukazatelů je pro výstupy prospektivních studií velkým přínosem, jak dále dokumentujeme v příkladu 1. Zpracováváme v něm sledování expozice pracovníků chemického provozu toxickou sloučeninou, která kauzálně způsobuje jistý druh zhoubného nádoru. Naším cílem je nejen posoudit sílu vztahu mezi tímto faktorem a danou nemocí, ale také kvantifikovat skutečný populační efekt dané expozice. Expozici danou látkou potom srovnáváme s dalšími, významně častějšími rizikovými faktory, jako je kouření, alkoholizmus a obezita. Silný kauzální vztah mezi expozicí toxickou látkou a nemocí vede k velmi vysokým hodnotám RR. Srovnáme‑li odhady RR toxické látky s jinými, méně specifickými, rizikovými faktory daného typu malignity, např. s vlivem kouření, alkoholu nebo obezity, jsou až řádově vyšší. Avšak nespecifické rizikové faktory se týkají mnohem větší populace (mají větší prevalenci) a z hlediska populačního významu tak generují mnohem větší počet nemocných než toxická látka, která exponuje pouze malou populaci profesionálů chemického průmyslu. Doplníme‑li odhad relativního rizika atributivním rizikem a zejména kvantifikací pomocí PAR, dostáváme komplexnější obraz významu sledované expozice.

**Příklad 1. Interpretační význam atributivního rizika (AR) a populačního atributivního rizika (PAR) v prospektivní studii.**

Přesuňme nyní pozornost od prospektivních studií ke studiím retrospektivním. Ukazatele typu AR lze s jistým omezením využít i tady, např. u studií případů a kontrol, ve kterých nemůžeme přímo odhadovat incidenci jevů. Náběr jedinců zde totiž provádíme právě podle toho, zda u nich daný jev nastal nebo nenastal, a odhad RR tak nemá smysl. V takovém případě odhadneme hodnotu relativního rizika přepočtem či aproximací z poměru šancí (OR) a z výše uvedených parametrů lze vypočítat pouze ARF% nebo PAF% (Cole, MacMahon, 1971). V příkladu 2 dokumentujeme takový odhad ARF% a PAF% na učebnicovém příkladu retrospektivní studie zkoumající vliv kouření na výskyt karcinomu plic.

**Příklad 2. Atributivní frakce (ARF%) a populační atributivní frakce (PAF%) v retrospektivní studii.**

Na závěr tohoto dílu doplníme dané téma příkladem 3, který ukazuje výpočet intervalu spolehlivosti pro odhady AR a PAR. Tak jako např. RR lze i AR doplnit hranicemi spolehlivosti, které usnadňují jeho interpretaci. Výpočet je v tomto případě bohužel složitější a je založen na permutačních metodách, kterým se budeme v našem seriálu věnovat později. Příklad 3 dále shrnuje pro případné zájemce podstatné zdroje literatury. K výpočtu je nutné využít specializovaný software, např. knihovnu attribrisk v software R, modul epitab, somersd v software Stata nebo software StatsDirect. Zájemcům o tyto výpočty doporučujeme velmi kvalitní a hojně citovanou práci Mezzettiho et al z roku 1996.

**Příklad 3. Interval spolehlivosti pro atributivní riziko (AR) a populační atributivní riziko (PAR).**

doc. RNDr. Ladislav Dušek, Ph.D.

Institut biostatistiky a analýz

MU, Brno

e‑mail: dusek@iba.muni.cz

Zdroje

1. Benichou J. Methods of adjustment for estimating the attributable risk in case ‑⁠ control studies. A Rev Stat Med 1991; 10(11): 1753 –⁠ 1773.

2. Benichou J, Gail M. Variance calculations and confidence intervals for estimates of the attributable risk based on logistic models. Biometrics 1990; 46(4): 991 –⁠ 1003.

3. Cole P, MacMahon B. Attributable risk percent in case ‑⁠ control studies. Br J Prev Soc Med 1971; 25(4): 242 –⁠ 244.

4. Kahn M, O‘Fallon W, Sicks J. Technical report series No. 54, generalized population attributable risk estimation. Rochester, Minnesota: Department of Health Science Research, Mayo Clinic 2000.

5. Miettinen OS, Nurminen M. Comparative analysis of two rates. Stat Med 1985; 4(2): 213 –⁠ 226.

6. Walter S.D. Calculation of attributable risks from epidemiologic data. Int J Epidemiol 1978; 7(2): 175 –⁠ 182.

7. Mezzetti M, Ferraroni M, Decarli A, La Vecchia C, Benichou J. Software for attributable risk and confidence interval estimation in case ‑⁠ control studies. Comput Biomed Res 1996; 29(1): 63 –⁠ 75.