Mieux que l'original : Un nouveau service basé sur SQL permet de télécharger des cubes de données d'occurrence

Avec le soutien du projet B-Cubed financé par l'UE, le GBIF introduit un nouveau format de résumé adapté à la modélisation et aux indicateurs de la biodiversité

hero-cubes

Le GBIF a mis en place un service simple et facile à utiliser pour créer et télécharger des species occurrence cubes basés sur les données du GBIF. Ce service permet aux utilisateurs de sélectionner les dimensions géographiques, temporelles et taxonomiques qui les intéressent afin de générer des rapports personnalisés résumant les occurrences dans un format adapté aux modèles et indicateurs de biodiversité. Sa mise en œuvre fait partie du Work Package 2 pour B-Cubed (Biodiversity Building Blocks for Policy), dirigé par l'Institut de recherche sur la nature et la forêt (RIOB).

Le nouveau service de cubes de données normalise l'accès aux données sur la biodiversité pour la production de variables essentielles sur la biodiversité (EBV) ainsi que de flux de travail et de modèles d'indicateurs pour le changement climatique et l'utilisation des terres créés par les partenaires de B-Cubed. Des études de cas spécifiques permettront de tester la capacité des flux d'indicateurs à saisir les aspects pertinents des changements de la biodiversité sur la base de différents objectifs politiques.

En fournissant des mesures d'occurrence des espèces à travers des dimensions et des résolutions définies par l'utilisateur, les cubes augmentent de manière significative la possibilité d'utiliser les données du GBIF. La possibilité pour les utilisateurs de définir les dimensions de la biodiversité dans le temps, l'espace et les taxons et d'obtenir le nombre d'espèces présentes à ces résolutions améliorera l'intégration avec d'autres sources de données.

Par exemple, les occurrences d'espèces jouent un rôle important dans l'étalonnage et la validation des modèles de biodiversité dérivés de l'imagerie satellitaire, mais jusqu'à présent, les différences de résolutions temporelles et spatiales ont nécessité un traitement considérable des données. En faisant mieux correspondre les échelles et les résolutions, les cubes de données peuvent aider les utilisateurs à construire plus efficacement des modèles plus robustes de distribution des espèces et de changement de la biodiversité, à améliorer les bases de référence de la biodiversité et à surveiller les changements au fil du temps.

Contexte technique

Un cube d'occurrence est un fichier csv séparé par des tabulations contenant des mesures d'occurrence d'espèces (par exemple un comptage) résumées par dimensions taxonomiques, temporelles et/ou spatiales (par exemple une année donnée, un rang taxonomique spécifique, etc.). Un exemple simple pourrait être un cube résumant les enregistrements des espèces de lagomorphes européens par année, une requête pour laquelle le cube produit réduit plus de 1,5 million d'occurrences en un 23 KB résumé d'un peu plus de 1000 lignes, chacune représentant le nombre d'individus d'une espèce donnée au cours d'une année donnée, par ex.

espèces année occurrences
Prolagus sardus 1830 8
Anoema oeningensis 1963 1
Anoema oeningensis 1966 7
Prolagus sardus 1966 4
Lepus granatensis 1975 121

Comme pour les autres formats de téléchargement du GBIF, des DOI uniques et permanents sont attribués à toutes les requêtes réussies afin de permettre une citation FAIR qui permet d'attribuer le crédit aux éditeurs de données et de faciliter la reproductibilité des analyses en aval.

Basé sur une extension de l'API de téléchargement des occurrences du GBIF qui permet des requêtes écrites en Structured Query Language (SQL), le service de téléchargement des cubes est accessible dans l'interface GBIF.org, où les utilisateurs sélectionnent les données focales en utilisant les filtres habituels pour la taxonomie, la géographie et les dates, entre autres. En sélectionnant Cube comme format de téléchargement souhaité, l'utilisateur dispose de paramètres pour définir les dimensions taxonomiques, temporelles et spatiales du cube. Avant de lancer le téléchargement, l'utilisateur peut également inspecter la requête SQL qui construit le cube, ce qui permet aux utilisateurs avancés de personnaliser davantage la demande.

Le développement des cubes d'occurrence des espèces par le GBIF fait partie du Work Package 2 de B-Cubed (Biodiversity Building Blocks for Policy), dirigé par l'Institut de Recherche sur la Nature et la Forêt (INBO) et financé par le Programme de Recherche et d'Innovation Horizon Europe de l'Union Européenne (ID No 101059592).