Analýza dat v neurologii
LIV. Koncept atributivního rizika v analýze populačních studií –  I. Aplikace v různých typech studií


Autoři: L. Dušek;  T. Pavlík;  J. Jarkovský ;  J. Koptíková
Působiště autorů: Masarykova univerzita, Brno ;  Institut bio­statistiky a analýz
Vyšlo v časopise: Cesk Slov Neurol N 2015; 78/111(6): 717-720
Kategorie: Okénko statistika

V předchozím díle seriálu jsme jako nové téma otevřeli populační hodnocení rizika v asociačních studiích, kde studujeme vliv expozičního faktoru a jeho následku, např. nemoci. Rozšířili jsme dosud probíraný poměr šancí (OR) a relativní riziko (RR) o další ukazatele (atributivní riziko, atributivní frakce, atributivní počet), které mohou podstatně rozšířit interpretaci získaných dat. V tomto díle se pokusíme dané téma dále rozpracovat a přiblížit tyto pojmy více pomocí ukázek aplikací.

Nejprve připomeneme nově probírané ukazatele a jejich interpretaci formou jednoduchého číselného příkladu. Zkoumáme v prospektivní kohortové studii vliv rizikového faktoru v anamnéze pacientů na následné komplikace léčby. Číselným výstupem studie je tabulka četností 2 × 2 (tab. 1). K výpočtu všech parametrů lze z této tabulky využít vztahy vysvětlené v předchozím díle seriálu; zde tyto postupy doplňujeme pomocí značení buněk tabulky a, b, c, d. Jde o poměrně užitečný nástroj, podle kterého lze výpočty rychle technicky provádět a  snadno realizovat i bez znalosti matematického aparátu.

Tab. 1. Výsledky kohortové studie zkoumající vliv určitého rizikového faktoru v anamnéze pacientů na komplikace určité léčby*.
Výsledky kohortové studie zkoumající vliv určitého rizikového faktoru v anamnéze pacientů na komplikace určité léčby*.
* Označením a, b, c, d se typicky označují buňky čtyřpolní tabulky četností a platí N = a + b + c + d.

Nejprve odhadneme incidenci jevu (komplikace léčby) ve skupině exponované faktorem (IE) a neexponované faktorem (INE):

  • IE = a/ (a + b) = 700/ 1 000 = 0,7;
  • INE = c/ (c + d) = 300/ 1 000 = 0,3.

Hodnoty incidence rizikového jevu také někdy nazýváme rizikem (R), zde tedy jde o riziko komplikací v exponované (RE) a neexponované (RNE) skupině.

Hodnotu incidence rizikového jevu v celém souboru, tedy odhad incidence v celé populaci (IP), spočítáme takto:

  • IP = (a + c)/ (a + b + c + d) = 0,5.

V dalším kroku odhadneme relativní riziko (RR), atributivní riziko (AR), atributivní frakci vyjádřenou v procentech (ARF%), populační atributivní riziko (PAR) a populační atributivní frakci vyjádřenou v procentech (PAF%):

  • RR = RE/RNE = [a/ (a + b)]/[c/(c + d)] =  0,7/ 0,3 = 2,33;
  • AR = RE – RNE = [a/ (a + b)] – [c/ (c + d)] = 0,7 –  0,3 = 0,4;
  • PAR = IP – INE = [(a + c)/ N] – [c/ (c + d)] = 0,5 –  0,3 = 0,2;
  • ARF% = [(RE – RNE)/ RE] × 100 = [(0,7 –  0,3)/ 0,7] × 100 = 57,1 %;
  • PAF% = [(IP – INE)/ IP] × 100 = [(0,5 –  0,3)/ 0,5] × 100 = 40 %.

Ve shodě s předchozím dílem tohoto seriálu zde ještě nabízíme ukázku alternativních vztahů využívajících znalosti hodnoty RR. Jde pouze o alternativní výpočet, který musí samozřejmě vést ke stejným výsledkům. Tyto vztahy uvádíme zejména proto, že se v literatuře objevují často bez dalších vysvětlení, a mohou tak působit zmatečně:

  • ARF = (RR –  1)/ RR = (2,33 –  1)/ 2,33 = 0,571;
  • PAF = PE (RR –  1)/ [1 + PE (RR –  1)] = (0,5 × 1,33)/ [1 + (0,5 × 1,33)] = 0,4;

kde PE je prevalence rizikového faktoru v celém vzorku (populaci), a tedy PE = 1 000/ 2 000 = 0,5.

Pro praxi není ovšem rozhodující forma výpočtu, ale především správná interpretace výsledků. Zásadní závěry výše uvedených výsledků shrnujeme v následujících bodech, přičemž interpretaci vždy řadíme ke konkrétním parametrům:

  • R: pacienti s pozitivní anamnézou mají vyšší riziko výskytu komplikací než osoby bez rizikového faktoru v anamnéze (0,7 vs. 0,3);
  • RR: pacienti s pozitivní anamnézou mají 2,33× vyšší riziko výskytu komplikací než osoby bez rizikového faktoru v anamnéze;
  • AR: na 1 000 pacientů s pozitivní anamnézou připadá 400 komplikací vzniklých v důsledku rizikového faktoru v anamnéze;
  • ARF%: ze všech komplikací v souboru pa­cientů s pozitivní anamnézou jich 57,1 % bylo způsobeno působením rizikového faktoru, tedy 57,1 % ze 700 komplikací je 400;
  • PAR: na 1 000 lidí v celém souboru (populaci) připadá 200 komplikací vzniklých v důsledku výskytu rizikového faktoru v anamnéze;
  • PAF%: ze všech komplikací v celém souboru (v celé populaci) jich 40 % je způsobeno vlivem rizikového faktoru v anamnéze.

Odhad AR nachází uplatnění v různých typech studií. Výše uvedený příklad pracuje s daty prospektivní observační studie, ve které se dostáváme k věrohodným odhadům incidence jevu v exponované i v neexponované skupině. U těchto studií jsme schopni objektivně kvantifikovat incidenci sledovaných jevů, a tudíž také exaktně kvantifikovat populační dopad zkoumaných expozičních faktorů. Ve výše uvedeném případě byli jedinci nabráni podle faktoru v anamnéze (řádky tabulky) a odhad výskytu komplikací byl proveden následným sledováním v čase. Odhad incidence tak není zkreslen vlastním náběrovým plánem. U těchto studií lze objektivně odhadnout RR a všechny výše uvedené parametry, vč. ARPAR.

Čtenáři mohou vnést legitimní námitku, že při analýze relativně jednoduché tabulky četností není nutné kalkulovat tak vysoký počet statistických ukazatelů. Samozřejmě je i zde určující cíl výzkumu a požadovaná interpretace výsledků, uvedené parametry nejsou povinné a nemusí být vždy využity všechny. Nicméně souběžný odhad více ukazatelů je pro výstupy prospektivních studií velkým přínosem, jak dále dokumentujeme v příkladu 1. Zpracováváme v něm sledování expozice pracovníků chemického provozu toxickou sloučeninou, která kauzálně způsobuje jistý druh zhoubného nádoru. Naším cílem je nejen posoudit sílu vztahu mezi tímto faktorem a danou nemocí, ale také kvantifikovat skutečný populační efekt dané expozice. Expozici danou látkou potom srovnáváme s dalšími, významně častějšími rizikovými faktory, jako je kouření, alkoholizmus a obezita. Silný kauzální vztah mezi expozicí toxickou látkou a nemocí vede k velmi vysokým hodnotám RR. Srovnáme‑li odhady RR toxické látky s jinými, méně specifickými, rizikovými faktory daného typu malignity, např. s vlivem kouření, alkoholu nebo obezity, jsou až řádově vyšší. Avšak nespecifické rizikové faktory se týkají mnohem větší populace (mají větší prevalenci) a z hlediska populačního významu tak generují mnohem větší počet nemocných než toxická látka, která exponuje pouze malou populaci profesionálů chemického průmyslu. Doplníme‑li odhad relativního rizika atributivním rizikem a zejména kvantifikací pomocí PAR, dostáváme komplexnější obraz významu sledované expozice.

Příklad 1. Interpretační význam atributivního rizika (AR) a populačního atributivního rizika (PAR) v prospektivní studii.
Příklad 1. Interpretační význam atributivního rizika (AR) a populačního atributivního rizika (PAR) v prospektivní studii.

Přesuňme nyní pozornost od prospektivních studií ke studiím retrospektivním. Ukazatele typu AR lze s jistým omezením využít i tady, např. u studií případů a kontrol, ve kterých nemůžeme přímo odhadovat incidenci jevů. Náběr jedinců zde totiž provádíme právě podle toho, zda u nich daný jev nastal nebo nenastal, a odhad RR tak nemá smysl. V takovém případě odhadneme hodnotu relativního rizika přepočtem či aproximací z poměru šancí (OR) a z výše uvedených parametrů lze vypočítat pouze ARF% nebo PAF% (Cole, MacMahon, 1971). V příkladu 2 dokumentujeme takový odhad ARF%PAF% na učebnicovém příkladu retrospektivní studie zkoumající vliv kouření na výskyt karcinomu plic.

Příklad 2. Atributivní frakce (ARF%) a populační atributivní frakce (PAF%) v retrospektivní studii.
Příklad 2. Atributivní frakce (ARF%) a populační atributivní frakce (PAF%) v retrospektivní studii.

Na závěr tohoto dílu doplníme dané téma příkladem 3, který ukazuje výpočet intervalu spolehlivosti pro odhady ARPAR. Tak jako např. RR lze i AR doplnit hranicemi spolehlivosti, které usnadňují jeho interpretaci. Výpočet je v tomto případě bohužel složitější a je založen na permutačních metodách, kterým se budeme v našem seriálu věnovat později. Příklad 3 dále shrnuje pro případné zájemce podstatné zdroje literatury. K výpočtu je nutné využít specializovaný software, např. knihovnu attribrisk v software R, modul epitab, somersd v software Stata nebo software StatsDirect. Zájemcům o tyto výpočty doporučujeme velmi kvalitní a hojně citovanou práci Mezzettiho et al z roku 1996.

Příklad 3. Interval spolehlivosti pro atributivní riziko (AR) a populační atributivní riziko (PAR).
Příklad 3. Interval spolehlivosti pro atributivní riziko (AR) a populační atributivní riziko (PAR).

doc. RNDr. Ladislav Dušek, Ph.D.

Institut biostatistiky a analýz

MU, Brno

e‑mail: dusek@iba.muni.cz


Zdroje

1. Benichou J. Methods of adjustment for estimating the attributable risk in case‑ control studies. A Rev Stat Med 1991; 10(11): 1753– 1773.

2. Benichou J, Gail M. Variance calculations and confidence intervals for estimates of the attributable risk based on logistic models. Biometrics 1990; 46(4): 991– 1003.

3. Cole P, MacMahon B. Attributable risk percent in case‑ control studies. Br J Prev Soc Med 1971; 25(4): 242– 244.

4. Kahn M, O‘Fallon W, Sicks J. Technical report series No. 54, generalized population attributable risk estimation. Rochester, Minnesota: Department of Health Science Research, Mayo Clinic 2000.

5. Miettinen OS, Nurminen M. Comparative analysis of two rates. Stat Med 1985; 4(2): 213– 226.

6. Walter S.D. Calculation of attributable risks from epidemiologic data. Int J Epidemiol 1978; 7(2): 175– 182.

7. Mezzetti M, Ferraroni M, Decarli A, La Vecchia C, Benichou J. Software for attributable risk and confidence interval estimation in case‑ control studies. Comput Biomed Res 1996; 29(1): 63– 75.

Štítky
Dětská neurologie Neurochirurgie Neurologie

Článek vyšel v časopise

Česká a slovenská neurologie a neurochirurgie

Číslo 6

2015 Číslo 6

Nejčtenější v tomto čísle
Přihlášení
Zapomenuté heslo

Zadejte e-mailovou adresu, se kterou jste vytvářel(a) účet, budou Vám na ni zaslány informace k nastavení nového hesla.

Přihlášení

Nemáte účet?  Registrujte se