Processing math: 100%
  • Mesures et test d’association
    • Corrélation linéaire
    • Différence de moyennes standardisée
    • Odds-ratio
  • Modèle à effet fixe pour données continues
    • Packages R
    • Application 1 :
    • Application 2 : Effects of antihistamines on cold severity
    • Application 3 : Low dosage antidepressants
  • Modèle à effet fixe pour données binaires
    • Application 4 : BCG and tuberculosis
    • Application 5 : Hypertension in women
    • Références
## Loading 'meta' package (version 4.9-2).
## Type 'help(meta)' for a brief overview.

Mesures et test d’association

Cet section constitue essentiellement des rappels sur les principales mesures d’association et les tests associés.

Corrélation linéaire

Le coefficient de corrélation linéaire de Pearson s’obtient avec la commande cor, tandis que la commande cor.test fournit à la fois la valeur du coefficient de corrélation et son intervalle de confiance (par défaut à 95 %). Un coefficient de corrélation quantifie l’ampleur et qualifie la direction de l’effet d’association entre deux variables numériques. C’est en soi une mesure de taille d’effet et il n’est pas nécessaire d’appliquer une quelconque transformation. La version non-paramétriques est le coefficient de Spearman et repose sur les rangs des observations plutôt que les valeurs mesurées. Il existe d’autres variantes selon la nature des variables étudiées : coefficient point-bisérial (variable binaire versus variable numérique), coefficient ϕ (deux variables binaires), etc. Ces coefficients peuvent généralement être ramenés à des formes qui les apparentent au coefficient d de Cohen décrit plus bas. Par exemple, dans le cas du coefficient point-bisérial, on montre que rb=dd2+4 (Rosenthal, 1984).

Différence de moyennes standardisée

La moyenne arithmétique d’une série de mesures numériques s’obtient avec mean sous R. Il existe des calculateurs en ligne pour calculer différentes variations de taille d’effet, mais pour les méta-analyses il est généralement préférable d’utiliser des logiciels spécialisés (R ou Stata).

Une différence standardisée de moyennes se construit généralement à partir du rapport entre deux moyennes estimées et (a) l’écart-type du groupe contrôle (coefficient δ de Glass (Glass & Smith, 1981)), (b) une estimation de la variance commune entre les deux groupes – on appelle cela le d de Cohen (Cohen, 1988), ou (c) un estimateur plus élaboré reposant également sur la variance commune et appelé g de Hodges (Hedges, 1981). Sa définition est la suivante, les indices k, e et c désignant le numéro d’étude, le groupe expérimental et le groupe contrôle, respectivement : ˆgk=(134nk9)ˆμekˆμck((nek1)s2ek+(nck1)s2ck)/(nk2). Le facteur de correction apparaissant en début de cette formule permet de fournir un estimateur sans biais de d (Hedges & Olkin, 1985).

Les règles d’interprétation de ce type de coefficient, en particulier le d de Cogen et le g de Hodges varie d’un domaine à l’autre (p.ex., psychology, éducation ou biologie) mais en règle générale on s’accorde à dire que des tailles d’effet d<0.2 sont faibles, 0.4<d<0.6 intermédiaires et d>0.8 élevées (Cohen, 1988).

Notons qu’il est également possible d’exploiter le résultat d’un test de Student pour estimer une taille d’effet (la commande R permettant de réaliser un test de Student est t.test). Dans ce cas, on considèrera (Rosenthal & Rosnow, 2008) : d=t(ne+nc)(ne+nc2)(nenc).

Voici une illustration sur des données numériques qui proviennent d’une méta-analyse sur l’effet d’un traitement par anti-dépresseur à faible dose de tricycliques (Furukawa, McGuire, & Barbui, 2003), traitée plus en détails dans l’application 2 :

##             author Ne   Me   Se Nc   Mc   Sc
## 1  Blashki(75%150) 13  6.4  5.4 18 11.4  9.6
## 2   Hormazabal(86) 17 11.0  8.2 16 19.0  8.2
## 3 Jacobson(75-100) 10 17.5  8.8  6 23.0  8.8
## 4      Jenkins(75)  7 12.3  9.9  7 20.0 10.5
## 5   Lecrubier(100) 73 15.7 10.6 73 18.7 10.6
## 6      Murphy(100) 26  8.5 11.0 28 14.5 11.0
##            author Ne  Me  Se Nc   Mc  Sc
## 1 Blashki(75%150) 13 6.4 5.4 18 11.4 9.6
##           Me
## 1 -0.5208333
##          Me
## 1 -0.641976
##           Me
## 1 -0.6150334
##           Me
## 1 -0.5989657

Outre le calcul d’effets standardisés, le package MBESS fournit également des routines de calcul de puissance statistiques.

Odds-ratio

L’odds-ratio peut être calculé manuellement ou à l’aide d’une petite fonction si l’on dispose d’un tableau 2x2, mais il est souvent plus commande d’utiliser un package, comme par exemple vcd qui fournit la commande oddsratio. Attention, dans la plupart des cas on travaille avec le logarithme (naturel) de l’odds-ratio, en particulier pour construire l’intervalle de confiance.

Modèle à effet fixe pour données continues

Dans un modèle dit à effet fixe, on considère que les effets ont la même espérance mathématique et une variance connue. En d’autres termes, il n’y a pas de variabilité entre les études. On peut formaliser le modèle de la manière suivante :

Yi=θ+εi,εiN(0,Vi)

Comme dans le cas des modèles de régression à effets fixes, le modèle ci-dessus ne rend compte que des résultats observés et ne peut être généralisé à d’autres études. Au contraire, dans un modèle à effet aléatoire, on considère que les moyennes des effets sont spécifiques à chaque étude (θi), c’est-à-dire qu’il existe une variance inter-études :

Yi=θ+θi+εi,θiN(0,τ2)etεiN(0,Vi)

Un tel modèle présente l’avantage d’être plus réaliste en tenant compte de possibles fluctuations entre les études, en plus des fluctuations d’échantillonnage, et de permettre d’inférer les résultats à une population plus large d’études.

Packages R

Le package meta fournit la fonction metacont pour l’estimation de ce type de modèle, tandis que dans le cas des variables binaires il s’agit de metabin. Avec le package metafor, la même commande rma permet de modéliser les deux types de variables réponse. Par défaut, metacont estime les paramètres d’un modèle à effet fixe et à effet alétoire, sauf si l’on spécifie l’option method=. Avec rma, un seul modèle peut être ajusté à la fois. En revanche, il est possible de déférer le calcul des tailles d’effet à la fonction escalc avant d’appeler la fonction rma. Dans le cas des variables continues, la mesure de taille d’effet estimée peut consister en la différence de moyennes (option measure="MD") ou la différence de moyennes standardisées (option measure="SMD"). Concernant les méthodes d’estimation des effets, celles-ci sont dénommées : “FE” = Fixed Effects, “DL” = DerSimonian-Laird, “HE” = Hedges estimator, “ML” = Maximum Likelihood, “REML” = Restricted ML.

Application 1 :

Spooner, C., Saunders, L.D., Rowe, B.H.: Nedocromil sodium for preventing exercise-induced bronchoconstriction. Cochrane Database Syst. Rev. (1) (2002).

Le chargement des données ne pose pas de problème car celles-ci sont déjà tabulées au format CSV (les données sont tirées de l’ouvrage de Schwarzer, Carpenter, & Rücker (2015) et sont disponibles sur le site compagnon du livre):

##         author  year Ne    Me    Se Nc    Mc    Sc
## 1        Boner  1988 13 13.54 13.85 13 20.77 21.46
## 2        Boner  1989 20 15.70 13.10 20 22.70 16.47
## 3       Chudry  1987 12 21.30 13.10 12 39.70 12.90
## 4        Comis  1993 12 14.50 12.20 12 31.30 15.10
## 5 DeBenedictis 1994a 17 14.40 11.10 17 27.40 17.30
## 6 DeBenedictis 1994b  8 14.80 18.60  8 31.40 20.60

La commande metacont permet de fournir directement le calcul de la différence standardisée de moyenne (SMD) ainsi que son intervalle de confiance :

##      SMD            95%-CI     z p-value
##  -0.3877 [-1.1649; 0.3895] -0.98  0.3283
## 
## Details:
## - Inverse variance method
## - Hedges' g (bias corrected standardised mean difference)

La commande metacont fournit l’essentiel du travail d’estimation si l’on fournit l’ensemble des K résultats individuels, et non pas une seule étude comme ci-dessus :

##                          MD               95%-CI %W(fixed) %W(random)
## Boner 1988          -7.2300 [-21.1141;   6.6541]       2.8        3.1
## Boner 1989          -7.0000 [-16.2230;   2.2230]       6.4        6.6
## Chudry 1987        -18.4000 [-28.8023;  -7.9977]       5.0        5.3
## Comis 1993         -16.8000 [-27.7835;  -5.8165]       4.5        4.8
## DeBenedictis 1994a -13.0000 [-22.7710;  -3.2290]       5.7        5.9
## DeBenedictis 1994b -16.6000 [-35.8326;   2.6326]       1.5        1.6
## DeBenedictis 1995  -13.9000 [-27.6461;  -0.1539]       2.9        3.1
## Debelic 1986       -18.2500 [-30.6692;  -5.8308]       3.5        3.8
## Henriksen 1988     -29.7000 [-41.6068; -17.7932]       3.8        4.1
## Konig 1987         -14.2000 [-25.0013;  -3.3987]       4.7        4.9
## Morton 1992        -22.5300 [-33.5382; -11.5218]       4.5        4.8
## Novembre 1994f     -13.0400 [-19.5067;  -6.5733]      13.0       12.1
## Novembre 1994s     -15.1000 [-23.8163;  -6.3837]       7.1        7.3
## Oseid 1995         -14.8000 [-23.7200;  -5.8800]       6.8        7.0
## Roberts 1985       -20.0000 [-36.9171;  -3.0829]       1.9        2.1
## Shaw 1985          -24.1600 [-33.1791; -15.1409]       6.7        6.9
## Todaro 1993        -13.4000 [-18.7042;  -8.0958]      19.3       16.6
## 
## Number of studies combined: k = 17
## 
##                            MD               95%-CI      z  p-value
## Fixed effect model   -15.5140 [-17.8435; -13.1845] -13.05 < 0.0001
## Random effects model -15.6436 [-18.1369; -13.1502] -12.30 < 0.0001
## 
## Quantifying heterogeneity:
## tau^2 = 2.4374; H = 1.05 [1.00; 1.35]; I^2 = 8.9% [0.0%; 45.3%]
## 
## Test of heterogeneity:
##      Q d.f. p-value
##  17.57   16  0.3496
## 
## Details on meta-analytical method:
## - Inverse variance method
## - DerSimonian-Laird estimator for tau^2

Notons que l’instruction summary(m) ne renvoit que les paramètres estimés pour les modèles à effets fixes et aléatoires. La commande ci-dessus indique également les principales mesures d’hétérogénéité (τ2) retrouvées dans la littérature (Qχ2K1 sous H0:τ2=0, H2=QK1 et I2=(H21)/H2 si Q>K1, 0 autrement). Enfin, les résultats individuels ainsi que l’estimation sur l’ensemble (ponctuelle et par intervalle) peuvent être visualisés sous la forme d’un “forest plot” :

L’option prediction=TRUE permet de rajouter une estimation par intervalle pour la prévision.

Application 2 : Effects of antihistamines on cold severity

Les données ci-dessous ont été collectées lors d’une étude par D’Agostino & Weintraub (1995) et portent sur l’effet de l’administration d’anti-histaminiques pour le traitement des symptômes de rhynites (nez qui coule etc.). Il s’agit des résultats de 9 essais cliniques randomisés dans lesquels les patients fraichement diagnostiqués ont été assignés à l’un des deux groupes de traitement, incluant un groupe placebo. L’effet du traitement est défini comme le changement dans la sévérité des symptômes après un jour de traitement. Plusieurs échelles ont été utilisées pour quantifier ce changement, d’où l’utilisation de différences standardisées de moyennes.

  1. Assembler les données dans un format acceptable pour R et le package metan ou metafor.
  2. Produire un graphique de type “funnel plot” synthétisant les résultats d’une analyse globale des effets standardisés par la méthode de Cohen et donner un intervalle de confiance à 95 % pour l’effet moyen global. Conclure sur l’effet du traitement.

Application 3 : Low dosage antidepressants

Furukawa, T.A., McGuire, H., Barbui, C.: Low dosage tricyclic antidepressants for depression. Cochrane Database Syst. Rev. (3) (2003).

This is a systematic review comparing low dosage tricyclic antidepressants with placebo for the treatment of depression. They reported the effect on presence/absence of depression and on depression severity. Here we focus on the latter outcome. Unfortunately, different studies used different scores to measure depression severity, e.g. 19 studies used some version of the Hamilton Depression Rating Scale and five studies used the Montgomery-Åsberg Depression Rating Scale. Accordingly, it is not possible to pool the estimated effects directly.

Les données sont disponibles dans le fichier dataset02.csv.

  1. Produire un résumé graphique des résultats.
  2. Calculer les différences standardisées de moyenne (SMD).
  3. Réaliser une estimation de l’effet commun à l’aide d’une analyse à effet fixe à partir de ces SMD.
  4. Comparer avec les résultats d’une analyse à effets aléatoires.

Modèle à effet fixe pour données binaires

Avec le package metafor, c’est la même fonction rma qui est utilisée pour modéliser des variables binaires. Avec meta, on utilisera metabin. A peu de choses près, dans les deux cas les mêmes méthodes d’estimation sont proposées. Les mesures acceptées sont en particulier les odds-ratio (“OR”) et les risques relatifs (“RR”).

Application 4 : BCG and tuberculosis

The aim of the analysis was to quantify the efficacy of BCG vaccine against tuberculosis, and data from 11 trials are included here (Colditz et al., 1994). There was considerable between-trial heterogeneity in the effect of the vaccine; it has been suggested that this might be explained by the latitude of the region in which the trial was conducted.

Les données sont disponibles dans le fichier bcgtrial.dta. Les variables *cases et *noncases désignent le nombre de malades et de non malades, le préfixe indiquant le groupe de traitement (t* = traité, c* = contrôle).

  1. Examiner le tableau 2x2 pour la première entrée (on doit retrouver 6 cas traités et 274 individus non malades et soumis à un placebo) et calculer le rapport de risque et son intervalle de confiance à 95 %.
  2. Peut-on considérer qu’il existe une hétérogénité entre études ?
  3. Réaliser une analyse à effet aléatoire et conclure quant à l’effet protecteur de la vaccination sur la survenue de la maladie.
  4. Réaliser une analyse stratifiée en considérant trois groupes d’études définis à partir de la latitude à laquelle ont été réalisés les essais (> 40°, 23.5-40°, < 23.5°) et estimer l’intervalle de prévision de l’effet du traitement (à comparer à celui estimé en 3).

Application 5 : Hypertension in women

Quan, A., Kerlikowske, K., Gueyffier, F., Boissel, J.P., for the INDANA Investigators: Pharmacotherapy for hypertension in women of different races. Cochrane Database Syst. Rev. 2, CD002,146 (2000).

To evaluate whether the benefit of treating hypertension in women differed between younger and older women, as well as between white and African-American women. In the systematic review, the Peto method, i.e. a fixed effect estimate using the odds ratio as effect measure, was used for pooling. The primary outcome was the occurrence of fatal cerebrovascular events—-a rare event in hypertension. Here, we only look at the subgroup of women older than 55 years.

Les données sont disponibles dans le fichier dataset08.csv. Les suffixes *e et *c désignent comme dans les autres cas les participantes du groupe expérimental et contrôle, respectivement. Les préfixes E* et N* désignent le nombre d’événements positifs et le nombre total d’événements.

  1. Calculer le log(OR) de chaque étude ainsi que le poids de l’étude pour une méta-analyse. Que se passe t-il dans le cas de l’étude australienne ?
  2. Appliquer un facteur de correction tel que les cellules à 0 se voit ajouter la valeur 0.5 et calculer l’effet moyen (OR) sur l’ensemble des études.
  3. Comparer avec une analyse à effet fixe à l’aide de la commande metabin (cf. l’option addincr= et celle active par défaut pour traiter ces cas limites) et conclure.
  4. Greenland & Salvan (1990) ont montré que l’estimateur de Péto, qui constitue une bonne alternative à l’odds-ratio usuel, n’est pas recommendé dans le cas de groupes à peu près équilibrés (en termes d’effectifs) car cet estimateur n’est alors plus consistent. Vérifier les sorties fournies par metabin avec cette approche et comparer avec les résultats obtenus en 3.

Références

Cohen, J. (1988). Statistical Power Analysis for the Behavioral Sciences (2ᵉ éd.). Hillsdale : Lawrence Erlbaum.

Colditz, G. A., Brewer, T. F., Berkey, C. S., Wilson, M. E., Burdick, E., Fineberg, H. V., & Mosteller, F. (1994). Efficacy of BCG vaccine in the prevention of tuberculosis. Meta-analysis of the published literature. Journal of the American Medical Association, 271, 698‑702.

D’Agostino, R. B., & Weintraub, M. (1995). Meta-analysis: A method for synthesizing research. Clinical Pharmacology and Therapeutics, 58, 605‑616.

Furukawa, T., McGuire, H., & Barbui, C. (2003). Low dosage tricyclic antidepressants for depression. Cochrane Database Systematic Review, 3. Repéré à http://bit.ly/2RL5XA2

Glass, M., G.V., & Smith, M. (1981). Meta-Analysis in Social Research. Beverly Hills : Sage.

Greenland, S., & Salvan, A. (1990). Bias in the one-step method for pooling study results. Statistics in Medicine, 9, 247‑252.

Hedges, L., & Olkin, I. (1985). Statistical Methods for Meta-Analysis. London : Academic Press.

Hedges, L. V. (1981). Distribution theory for Glass’s Estimator of effect size and related estimators. Journal of Educational Statistics, 2, 107‑128.

Rosenthal, R. (1984). Meta-Analytic Procedures for Social Research. Newbury Park : Sage.

Rosenthal, R., & Rosnow, R. (2008). Essentials of Behavioral Research: Methods and Data Analysis (3ᵉ éd.). New York : McGraw-Hill.

Schwarzer, G., Carpenter, J. R., & Rücker, G. (2015). Meta-Analysis with R. Heidelberg : Springer.