Pour remplir son objectif principal, faciliter l’accès aux données de biodiversité et permettre leur utilisation, le SINP vise à standardiser, qualifier sa fiabilité puis partager la donnée naturaliste sur le territoire. Les données naturalistes, au cœur du dispositif, sont les données d’occurrence, de taxon et d’habitat.

Les données sont produites par une grande diversité d’acteurs (associations naturalistes, collectivités, fédérations de chasse ou de pêche, établissements publics, entreprises privées, citoyens, BE, bénévoles, etc.), lors de la réalisation de projets et d’actions variés (suivis naturalistes, études d’impact, inventaires, recherches bibliographiques, etc.) ou lors d’observations opportunistes. Le SINP doit faciliter le partage des données tout en tenant compte de leur origine publique * ou privée et de leur sensibilité ( Données sensibles).

L’intégration des données au sein du SINP se réalise à différents niveaux : plateformes régionales, thématiques ou nationale. Le dispositif se voulant fortement décentralisé, il favorise l’échelle régionale pour la mise en réseau des acteurs et le partage des données. Ainsi, les plateformes régionales sont les points d’entrée privilégiés des données naturalistes *. Elles assurent ensuite les échanges avec la plateforme nationale (INPN).

Pour intégrer le SINP, les données doivent respecter le standard * national, afin de permettre l’interopérabilité des différentes bases de données et ainsi faciliter les échanges d’informations entre ces dernières. Ce standard se compose de champs ou attributs (obligatoires, recommandés, facultatifs) à remplir selon des règles définies : référentiels, format des valeurs (nombre, date, texte), taille (nombre maximal de caractères), systèmes de projection, encodage… Il peut être complété par un standard régional ajoutant des champs d’informations additionnels, ou pouvant rendre obligatoires certains champs nationaux facultatifs.

En région

En Hauts-de-France, un standard régional unique de données, n’a pas été défini à ce jour. Chaque acteur et outil dispose actuellement de son propre standard qui se doit cependant d’être interopérable avec le standard national. En effet, le SINP régional repose principalement sur quatre bases de données différentes ( Objectif et organisation ), qui regroupent plusieurs millions de données naturalistes. Elles collectent ces données grâce aux salariés, aux bénévoles de leurs réseaux et auprès de différents partenaires locaux (privés, associatif ou collectivités). Ces derniers partagent avec les bases leurs données (aux formats hétérogènes) et métadonnées associées après la signature d’une convention d’échanges. Les pôles les intègrent et assurent leur transformation de données sources * en données standardisées.

Validation des données

Toutes les données naturalistes intégrées au SINP sont soumises à une validation technique (la forme) et scientifique (le fond). Ces processus de validation sont réalisés par les plateformes régionales qui s’assurent, en premier lieu, de la validation technique des données. Identique entre chaque plateforme et composé de plusieurs étapes (voir ci-dessous), cette validation est un pré-requis indispensable à l’intégration des données au SINP.

Les informations, une fois validées techniquement, intègrent ensuite les bases de données des plateformes régionales, selon les standards de ces bases, et sont partagées, sous un autre format standardisé (DEE *), avec la plateforme nationale du SINP.

Les données validées techniquement font ensuite l’objet d’une validation scientifique, qui leur adjoint un indice de fiabilité. Ce processus de validation scientifique peut différer selon les régions, mais respecte une trame commune dictée par le SINP.

La validation des données et des métadonnées a fait l’objet d’un GT (Groupe de Travail) SINP «   Validation des données d’observation d’occurrences de taxon  ». Chaque plateforme régionale intègre dans son processus de validation les recommandations du GT national.

Validation technique – de forme

La validation technique des données peut être découpée en deux étapes :

  • Une première permet la gestion des doublons. L’objectif est d’éviter qu’une même donnée intègre plusieurs fois le SINP.


  • La seconde étape a pour objet de vérifier la conformité et la cohérence (voir encart) des données et des métadonnées associées.


À chaque étape, en cas de non-respect, un rapport est envoyé aux fournisseurs de données, stoppant ainsi le processus de validation et d’intégration des données. Dans le cas contraire, une fois la validation technique passé les données se voient attribuer un identifiant national unique (quand elles n’en sont pas encore pourvues) et intègrent la plateforme. Une fois les données intégrées elles peuvent passer une validation scientifique.

Conformité : La conformité désigne le respect des règles fixées dans le cadre de la mise en œuvre des standards de données et de métadonnées autant sur le format que conceptuellement (renseignement des champs obligatoires, format, utilisation des référentiels et des listes de valeurs/nomenclatures).

Exemple : la date transmise est de type date norme ISO8601 comme spécifié par le standard de données élémentaires d’échange (DEE). L’attribut X est renseigné avec des valeurs conformes à la nomenclature définie dans le standard dédié. L’attribut Y est renseigné avec le type d’information spécifié dans le standard (un nombre par exemple).

Cohérence : La cohérence désigne le respect de la logique combinatoire des informations transmises au sein des données, au sein des métadonnées et entre les données et les métadonnées.

Exemple : la date de début de l’observation est inférieure ou égale à la date de fin de l’observation.

Quid des informations facultatives ?
En plus des champs obligatoires à renseigner, des informations additionnelles et facultatives peuvent compléter ces champs. Celles-ci sont aussi soumises aux standards SINP et donc à validation. Cependant, de par leur caractère facultatif, ces informations ne seront conservées, si ces dernières se révèlent non-conformes ou non-cohérentes (cf. schéma ci-dessous).

Validation scientifique – de fond

La validation scientifique a pour objet de qualifier la fiabilité d’une donnée, c’est-à-dire le degré de confiance que l’on peut lui accorder. Cette dernière ne s’applique pas aux métadonnées associées aux données et ne concerne que les données d’occurrence. Le résultat des opérations de validation scientifique (lorsqu’elles ont eu lieu) est véhiculé au sein des DEE. Les opérations en elles-mêmes sont réalisées par la plateforme régionale une fois les données validées techniquement. Les fournisseurs également valider directement leurs données sources et faire remonter cette validation à la plateforme lors de l’intégration de celles-ci.

La circulation de données entre les plateformes régionales et la plateforme nationale est indépendante de la validation scientifique de la donnée. Cette dernière est donc une opération facultative pour l’intégration des données au SINP et leur diffusion.

En région
Des processus de validation scientifique ont été mis en place par chaque pôle, et ont été présentés en CSRPN. La définition d’un tronc et de principes communs en région est en cours d’ élaboration. Il sera soumis à la validation du CSRPN afin de veiller à la rigueur du processus puis diffusé. Les processus de validation s’attachent essentiellement à vérifier l’identification du taxon, habitat. Ils concernent cependant aussi les autres attributs (sexe ou stade de vie notamment). À l’issue d’un processus de validation, la donnée source reçoit un indice de confiance :

• « Très probable » et « Probable » pour les données dont l’identification paraît certaine ;

• « Douteuse » pour les données présentant un doute ;

• « Invalide » pour les données non validées car non fiables ;

• « Non réalisable » pour les données dont la validation ne peut être menée (ex : absence de critères permettant de vérifier l’identification du taxon, absence d’expert dans le domaine).

La donnée ayant intégré le SINP sans avoir passé de validation scientifique reçoit, quant à elle, l’étiquette « En attente de validation ». Elle pourra être soumise à une validation scientifique à tout moment. Suivant la nature des taxons, habitats (rareté régionale, difficulté de détermination…) la validation scientifique de la donnée peut être automatique ou manuelle. Elle repose alors sur un collège d’experts.


La validation automatique est un processus informatisé basé sur des connaissances avérées (données de références, bases de connaissances, modèles probabilistes, etc.) qui permettent la mise en place de critères et filtres de validation. Ceux-ci sont soumis à l’approbation du CSRPN. Cette méthode permet un premier contrôle des données voire le traitement rapide de celles concernant les espèces communes ou facilement reconnaissables, tel que les merles ou les écureuils.

À l’issue de ce filtrage automatique (cf. schéma ci-dessous), toutes les données intègrent le SINP avec une étiquette de fiabilité. Les données présentant des doutes seront réexaminées par un collège d’experts.


La validation manuelle repose sur des collèges d’experts. Ces collèges sont organisés par chaque pôle thématique et composés d’experts naturalistes issus de leurs réseaux. Leur composition varie pour chaque groupe taxonomique. Des spécialistes extérieurs peuvent être contactés en l’absence de compétence locale pour certains taxons. Les groupes d’experts ont en charge la validation des données ne pouvant passer par la validation automatique ou celles rejetées par cette méthode. À l’issue de cette étape, la donnée est validée, invalidée ou douteuse (cf. schéma ci-dessous). Ces étiquettes servent à avertir l’usager de la qualité des informations mise à sa disposition.