Exercice d'analyse spatiale

Bio 6077

Pierre Legendre
Avril 1992 / février 1994 / octobre 1996 / Avril 2000

L'exercice qui vous est proposé porte sur des données récoltées le 25 octobre 1988 dans l'étang de Thau. Ces données vous permettront de calculer des corrélogrammes (Moran et Geary), de réaliser des tests de Mantel simples et partiels et de calculer un corrélogramme de Mantel. Les données sont décrites succinctement au paragraphe suivant.

Dans le cadre d'un programme de recherche écologique portant sur un étang saumâtre du sud de la France (Amanieu et al., 1989), un échantillonnage a été réalisé le 25 octobre 1988 à 20 stations d'échantillonnage (profondeur: 0,5 m). Ces stations furent sélectionnées, dans l'étang, à l'aide d'un raisonnement décrit par Legendre et al. (1989). Certaines des variables sont présentées au tableau suivant.

_________________________________________________________________________________
Station   Phyto-      NH4       Phaeo-    ADN       BNA       MA      Coordonnées
no.       plancton               pigments                              X     Y 
          ln(x + 1)  (ln)      (ln)       (ln)                         (km)  (km)
          [1]        [2]                  [3]       [4]       [5]         [6]
_________________________________________________________________________________
1        0.30770     0.307     0.184     0.274     4.615    10.003     3     10
2       -0.30775     0.207     0.212     0.213     5.226     9.999     5      9
3       -0.37908     0.14      0.229     0.134     5.081     9.636     6      8
4       -0.88542     1.371     0.287     0.177     5.278     8.331     6     10
5       -1.08561     1.447     0.242     0.091     5.756     8.929     8      9
6       -0.42767     0.668     0.531     0.272     5.328     8.839     9     10
7        0.49338     0.3       0.948     0.46      4.263     7.784    10      7
8        0.88899     0.329     1.389     0.253     5.442     8.023    11      6
9        0.40783     0.207     0.765     0.235     5.328     8.294    12      5
10       0.22656     0.223     0.737     0.362     4.663     7.883    12      7
11      -0.23230     0.788     0.454     0.824     6.775     9.741    12      9
12      -0.0649      1.112     0.395     0.419     5.442     8.657    13      8
13      -0.51491     1.273     0.247     0.398     5.421     8.117    15      2
14       0.46696     0.956     0.449     0.172     5.602     8.117    15      4
15       0.34135     0.708     0.457     0.141     5.442     8.487    15      5
16       0.10075     0.637     0.386     0.36      5.303     7.955    16      1
17       0.23298     0.519     0.481     0.261     5.602    10.545    16      2
18       0.48226     0.247     0.468     0.45      5.505     9.687    16      4
19      -0.10754     1.664     0.321     0.287     6.019     8.7      17      6
20       0.05642     0.182     0.38      0.51      5.464    10.24     18      4
_________________________________________________________________________________
[1] La quantité de phytoplancton est estimée par la densité de chlorophylle a, exprimée en mg/L, transformée par élimination de l'effet de la circulation (courants) (Legendre & Troussellier, 1993). Cette variable a été normalisée à l'aide d'une transformation logarithmique [x' =ln(x + 1)].

[2] La variable NH4, exprimée en µmol/L, a été normalisée par une transformation log [x' =ln(x)].

[3] L'ADN bactérien fut mesuré par l'incorporation de thymidine tritiée dans les cellules en culture.

[4] BNA = bactéries hétérotrophes aérobies croissant sur milieu Nutrient Agar

[5] MA = bactéries hétérotrophes aérobies croissant sur milieu Marine Agar

[6] La position géographique des stations d'échantillonnage est exprimée par leurs coordonnées sur un plan; les axes X et Y sont mesurés en km.

Données

Vous pouvez réaliser l'exercice, soit à partir du tableau ci-dessus, soit à partir du fichier de données correspondant qui est à votre disposition dans le présent dossier.

Thau_Data_(20x8): Fichier ASCII contenant les 8 variables décrites dans le tableau ci-haut, à importer dans le Progiciel R version 4 (options d'importation: matrice rectangulaire, séparée par des espaces, noms d'objets: oui, noms de variables: oui, ignorer la première valeur: oui).
Préparez tout d'abord les matrices de distance suivantes à l'aide du module SIMIL; si vous utilisez une mesure de similarité plutôt qu'une distance, transformez ensuite votre matrice de ressemblance en distances à l'aide du module CONVERSION:
2) Esp/D1: Matrice de distances euclidiennes [ou toute autre distance de votre choix] entre les stations, à partir des données d'espèces de la matrice. Ces données sont comprises dans les colonnes BNA et MA.

3) Env/D1: Matrice de distances euclidiennes entre les stations, à partir des données environnementales de la matrice, soit les colonnes NH4, Phaeopigments et ADN.

4) Spatial/D1: Matrice de distances géographiques (euclidiennes) entre les stations, à partir des coordonnées géographiques de la matrice, soit les colonnes X et Y.

Attention!

Pour calculer ces matrices de distance en ne tenant compte que de certaines colonnes de la matrice de données, il est essentiel d'exclure toutes les colonnes qui ne doivent pas faire partie du calcul. Voir le guide de l'usager de R 4.0 (section 4.7) pour plus de détails.

Programme Autocorrélation

La variable à analyser se trouve dans la première colonne de la matrice, soit "Phytoplancton", les données de Chlorophylle a; ces données sont quantitatives et non nominales. Les relations de distance entre les points sont fournies par la matrice SIMIL de distances géographiques (4) que vous aurez calculée; celle-ci vous permettra de calculer vos classes de distance. Vous aurez à choisir entre des classes équidistantes ou équifréquentes, et à décider du nombre de classes le plus approprié; rappelez-vous que pour un ensemble de n points, il y a n (n-1)/2 distances dans la demi-matrice.

Demandez au programme de conserver la matrice de CLASSES DE DISTANCE; cette matrice constituera votre fichier (5). Vous en aurez besoin pour calculer le corrélogramme de Mantel.

Test de Mantel simple

Le module MANTEL vous permettra de comparer les distances dans les matrices (2) et (3), (2) et (4) ou (3) et (4). Les deux matrices jouent le même rôle dans cette analyse et peuvent donc, indifféremment, être déclarées comme matrice A ou B. Puisqu'il s'agit de deux petites matrices, vous pouvez demander 499 ou 999 permutations pour ce problème, même sur un ordinateur peu puissant.

Test de Mantel partiel

Dans ce calcul, il importe de bien déclarer quelle matrice joue le rôle de matrice A, B et C, car le calcul de la statistique de Mantel partiel (méthode de Smouse, Long & Sokal) réalise le calcul A*B|C, c'est-à-dire la corrélation partielle entre A et B après avoir éliminé l'effet de C. Vous pourrez utiliser pour ce calcul les trois matrices de distance que vous avez calculées, (2), (3) et (4), dans l'ordre que vous jugerez opportun.

Corrélogramme de Mantel

Ici encore, l'ordre des matrices est d'importance capitale. Vous déclarerez que la matrice B est une matrice "de classes de distance" (pour corrélogramme); il s'agira de la matrice de classes de distance (5) que vous aurez obtenue lors du calcul de vos corrélogrammes de Mantel et de Geary. La matrice A sera l'une ou l'autre des autres matrices de distance que vous avez calculées: (2), (3) ou (4).

N'oubliez pas que le nombre de permutations que vous demanderez sera réalisé pour chacune des classes de distance; sur un ordinateur de faible puissance, il serait prudent de ne demander que 99 permutations, lors d'un premier essai.

Le corrélogramme apparaîtra à l'écran en format texte et graphique, si vous l'avez demandé. Comme le programme vous le signale, le signe des coefficients d'autocorrélation est inversé si votre matrice A est une matrice de Distances; autrement dit, un signe négatif indique une autocorrélation positive, et vice-versa. Par contre, si votre matrice A est de type Similarités, alors un signe positif indique de l'autocorrélation positive. Pouvez-vous dire pourquoi?

Références

Amanieu, M., P. Legendre, M. Troussellier & G.-F. Frisoni. 1989. Le programme Écothau: théorie écologique et base de la modélisation. Oceanologica Acta 12: 189-199.

Legendre, P. & M. Troussellier. 1993. Origin of spatial structures in aquatic bacterial communities: From hypotheses to numerical solutions. Pp. 353-358 in: Guerrero, R. & C. Pedrós-Alió (eds.) Trends in Microbial Ecology. Proc. 6th Intern. Symp. Microbial Ecology (ISME-6), Barcelona, 6-11 September 1992. Spanish Society for Microbiology.

Legendre, P., M. Troussellier, V. Jarry & M.-J. Fortin. 1989. Design for simultaneous sampling of ecological variables: from concepts to numerical solutions. Oikos 55: 30-42.