SDM avec mapSpecies

La première série de modèles (en vert) est faite à partir de données iNaturalist ou Atlas (atlas). Je ne me souviens plus exactement des options utilisées pour ces modèles et ça varie probablement un peu d’un modèle à l’autre. Je crois que pour la majorité des cas, l’effort est pris en compte selon la 2e méthode décrite plus bas (eff).

Je veux surtout attirer votre attention sur la deuxième série de modèles (en bleu). Ces modèles sont tous effectués avec des données iNaturalist. Au préalable, je retire les observations multiples d’une même espèce par un même observateur dans des cellules 5km X 5km. Autrement dit, je ne conserve qu’une observation par observateur, par espèce et par cellule. Cela permet d’éviter les distorsions associées aux observateurs qui se mettent à signaler tous les Hêtre à grandes feuilles autour de leur maison par exemple.

Dans la première colonne, l’effort n’est pas pris en compte (none) et les points sont pris tel quel pour faire un point process avec un effet spatial. La carte reflète surtout les endroits où l’espèce est signalée et où il y a beaucoup d’observateurs.

Dans la seconde colonne, l’effort est pris en compte un peu à la manière d’un offset (eff). Pour ce faire, j’utilise l’ensemble des observations d’un groupe donné (par exemple, j’utilise toutes les espèces de plantes pour modéliser une espèce de plante) pour créer une grille qui servira à quantifier l’effort par l’intermédiaire d’un offset/weight dans l’estimation d’un modèle. Ici, on s’attendrait à ce que le nombre d’observations pour une espèce soit proportionnel à l’effort pour le groupe (i.e. le nombre d’obervations total). En général, cette méthode permet de relativement bien estimer le contour des aires de distributions et dans certains cas, les cartes font du sens. Toutefois, la variation en intensité à travers les aires de distributions semble surtout être due aux particularités de l’effort concernant chaque espèce. Par exemple, si qqun ne signale qu’une espèce ou seulement les arbres à un endroit où il y a très peu d’effort, cela crée des distortions importantes en intensité à travers l’aire de distribution (e.g. Pinus banksiana, Pin gris, Jack Pine). En fait, j’ai l’impression que c’est ce qui drive la majorité de la variation à l’intérieur des aires de distributions.

Dans la troisième colonne (speff), je tente de pallier à ce problème avec une méthode super hacky. Je réutilise la grille d’effort produite précédemment, mais je pondère l’effort pour chaque espèce en fonction du nombre d’espèces détectées dans chaque cellule de la grille. Si plusieurs espèces sont observées dans une cellule, l’effort reste presque le même. Par contre, si peu d’espèces sont observées (ou une seule), l’effort sera multiplié par un facteur augmentant avec une diminution du nombre d’espèces observées. L’idée est de corriger l’effort général avec un effort plus spécifique à l’espèce. Par exemple, si qqun ne fait que signaler des Pin gris à un endroit où il y a très peu d’observateurs, on veut prendre en compte que l’effort envers les Pins gris est très élevé même si l’effort général est faible. Généralement, les cartes produites avec cette méthode font beaucoup de sens. Toutefois, elles débordent largement à l’extérieur des aires connues des espèces (particulièrement vers le nord…) et j’ai l’impression que ça estompe beaucoup de la variabilité (réelle) qui devrait exister à l’intérieur des aires de distributions. On n’est par contre pas très loin d’une méthode qui fonctionne, car dans la plupart des cas, on pourrait choisir un contour qui délimite pas mal les aires de distributions connues des espèces.

Pour l’instant, l’utilisation de prédicteurs ne semble pas changer grand-chose aux prédictions. En fait, une augmentation dans le nombre de prédicteurs semble être associée à une augmentation dans le nombre de modèles produisant des résultats aberrants. Les priors (sur la partie spatiale) semblent avoir très peu d’influence sur les résultats, à moins de les fixer à des valeurs extrêmes.

Arbres

Amphibiens reptiles