Projet 4 / 5

Identification

Cartographier la difficulté d'identification des Lépidoptères et produire les outils pour la lever

Programme

IDENT

Coordination scientifique

PatriNat (MNHN)

Approche

5 axes de travail

Coordination

14 bénévoles + salariée

Pyrgus malvoides (Elwes & Edwards, 1897), Ariège — Hespérie d'un complexe critique du genre Pyrgus, l'identification certaine repose sur l'examen des armures génitales
Pyrgus malvoides (Elwes & Edwards, 1897) — Ariège, gr. T5 — armures génitales nécessaires © D. Demergès

Toute donnée d'observation commence par une identification. Et toute identification n'a pas la même difficulté : certaines espèces se reconnaissent au premier coup d'œil, d'autres exigent un examen morphologique fin, d'autres encore ne sont distinguables que par séquençage génétique. Cette difficulté varie aussi dans l'espace : telle espèce est inconfondable dans un département, mais sympatrique avec une espèce-sœur dans un autre.

Le projet IDENT vise à structurer toute cette information : identifier les complexes d'espèces problématiques, documenter les critères de distinction, produire les guides et tutoriels, et rendre cette connaissance accessible à tous les observateurs, dès la saisie de leurs données sur Artemisiae.

Pour comprendre

Singletons, agrégats, sympatrie

Pour structurer la difficulté d'identification, PatriNat a développé deux concepts complémentaires.

Un singleton est une espèce considérée comme inconfondable en France métropolitaine : aucune autre espèce ne lui ressemble suffisamment pour qu'il y ait risque de confusion. Le Machaon, le Citron, le Vulcain, le Sphinx tête-de-mort sont des exemples typiques. Pour ces espèces, l'identification est immédiate, accessible aux débutants, et ne nécessite aucune investigation particulière.

Un agrégat, à l'inverse, est un ensemble d'espèces susceptibles d'être confondues entre elles. Les Hespéries du genre Pyrgus, plusieurs Mélitées, de nombreuses Noctuelles du genre Euxoa, des géomètres du genre Eupithecia sont autant d'exemples d'agrégats où la distinction demande un examen attentif, voire la dissection des armures génitales ou le séquençage moléculaire.

Mais ce qui rend la question vraiment intéressante, c'est que la difficulté d'identification varie dans l'espace. Une espèce peut être inconfondable dans un département où elle est seule, et devenir difficile à distinguer dès qu'on entre dans la zone de sympatrie d'une espèce-sœur. C'est pourquoi le projet IDENT articule en permanence la documentation des agrégats avec les cartes de répartition départementales, mises à jour dans le cadre du programme ABDSM (Atlas de la Biodiversité Départementale et des Secteurs Marins) de PatriNat.

Architecture

Cinq niveaux de difficulté d'identification

La typologie développée par PatriNat structure l'effort d'identification en cinq niveaux d'investigation croissants. Chaque espèce, à chacun de ses stades biologiques, peut être positionnée sur cette échelle.

T1 Inconfondable

Aucune investigation

L'espèce est évaluée comme inconfondable après expertise. Singleton.

T2 Facile

Investigation à vue, sans manipulation

Distinction possible sur photo ou observation directe, sans capture.

T3 Modérée

Investigation à vue, avec manipulation

Capture nécessaire pour observer certains critères (face ventrale, dessous des ailes, etc.).

T4 Difficile

Examen de la morphologie interne

Examen des armures génitales nécessaire (dissection). Exige une expertise spécialisée.

T5 Moléculaire

Séquençage génétique

Identification par barcoding moléculaire (CO1) ou marqueurs nucléaires complémentaires.

Une typologie appliquée à chaque stade biologique. La difficulté d'identification n'est pas la même selon que l'on observe un imago, une chenille, une chrysalide ou une mine foliaire. Le projet IDENT documente la difficulté pour chaque stade pertinent. À ce jour, les mines foliaires de 11 espèces de Lépidoptères sont par exemple considérées par expertise comme des singletons : elles permettent une identification certaine sans avoir besoin d'observer le papillon adulte. Pour la déclinaison opérationnelle de cette typologie dans Artemisiae, voir le référentiel des niveaux de détermination.

L'enjeu

Pourquoi structurer cette information

La qualité d'une donnée naturaliste se joue dès la phase d'identification. Une espèce mal identifiée à la saisie est, dans le meilleur des cas, signalée par les validateurs et corrigée. Dans le pire, elle reste dans la base et fausse les analyses ultérieures : cartes de répartition, suivis temporels, modèles de distribution. Structurer la connaissance sur la difficulté d'identification permet d'agir au moment de l'acquisition, pas seulement en aval.

L'enjeu est aussi pédagogique. Distinguer clairement les espèces faciles (singletons, T1-T2) des complexes nécessitant une expertise permet d'orienter les programmes de science participative et les nouveaux bénévoles vers des espèces accessibles, sans les décourager par des identifications trop ardues. C'est un levier essentiel pour élargir et fidéliser le réseau d'observateurs.

Au-delà de l'usage interne à oreina, ce travail bénéficie à l'ensemble des dispositifs de suivi naturaliste. Le dispositif européen EU-PoMS (European Pollinator Monitoring Scheme), qui intègre désormais les Lépidoptères nocturnes au suivi standardisé des pollinisateurs, repose lui aussi sur la fiabilité des identifications de terrain — et oreina, en tant que structure de référence désignée pour les Lépidoptères nocturnes, y apporte le socle qu'IDENT construit.

Le rôle d'oreina

Un comité technique dédié, un corpus documentaire en construction

oreina pilote au sein de PatriNat le volet Lépidoptères de la base de connaissance sur la difficulté d'identification. Le travail est porté par un comité technique interne (COTECH IDENT) qui rassemble 14 bénévoles experts, spécialistes de différents groupes taxonomiques, appuyés par la coordinatrice scientifique salariée. Le projet est étroitement articulé avec le projet QUALIF, dont il est l'ingrédient méthodologique central pour la qualification des données acquises sur Artemisiae.

Le travail d'oreina s'organise autour de quatre volets complémentaires :

  • la cartographie des agrégats : recensement systématique des complexes d'espèces problématiques, en priorisant ceux qui concernent les espèces suivies par EU-PoMS et les Macrohétérocères ;
  • la typologie de la difficulté : classement de chaque espèce, à chacun de ses stades biologiques, dans les cinq niveaux de la typologie PatriNat ;
  • la production de guides et tutoriels : rédaction de fiches descriptives, clés d'identification illustrées, guides de dissection pour les groupes nécessitant un examen morphologique interne ;
  • la mise à jour des cartes de répartition : actualisation des cartes départementales dans le cadre du programme ABDSM, pour identifier précisément les zones de sympatrie qui génèrent les vraies difficultés d'identification.
  • l'opérationnalisation pour la saisie sur Artemisiae : déclinaison de la typologie en une grille d'exigences documentaires concrètes — le référentiel des niveaux de détermination, qui définit, taxon par taxon et stade par stade, la nature de la preuve à fournir et le niveau de validité atteignable ;

Toutes ces ressources sont diffusées en libre accès via le portail Artemisiae, qui est conçu comme le vecteur principal de ce corpus documentaire.

Un bien commun

Une démarche qui transcende l'humain et profite à toute la communauté naturaliste

Le travail conduit dans le projet IDENT n'a de sens que s'il dépasse les murs d'oreina. Typologie de la difficulté, agrégats identifiés, cartes de répartition, fiches diagnostiques : tout ce qui sort de ce travail d'expertise est pensé comme un bien commun, librement réutilisable par les bases de données naturalistes, les bureaux d'étude, les gestionnaires d'espaces, les chercheurs, les programmes de science participative et les enseignants.

Pour les bases naturalistes

Faune-France, GBIF, SINP régional, INPN… La typologie IDENT et les cartes ABDSM sont mobilisables par toutes les plateformes pour fiabiliser leur validation, sans avoir à reconstruire le travail.

Pour les bureaux d'étude et gestionnaires

Diagnostics ZNIEFF, études d'impact, plans de gestion d'espaces protégés : les agrégats et niveaux de difficulté éclairent l'effort d'inventaire nécessaire et le degré de confiance attribué aux observations de terrain.

Pour la recherche

Les jeux de données qualifiés grâce à IDENT constituent des références pour la modélisation de distribution, les études phénologiques, l'analyse des dynamiques de populations.

Pour la formation et la science participative

Programmes de sciences participatives, formations de naturalistes, ateliers de détermination : orienter les apprentis vers des espèces accessibles avant les complexes ardus, c'est le levier qui fidélise les nouveaux observateurs.

Une validation qui peut servir partout. Une donnée qualifiée selon les référentiels IDENT — bon stade, bon niveau de difficulté, bonne sympatrie, bons critères mobilisés — est une donnée universellement défendable. Que cette donnée vienne d'Artemisiae, d'une autre plateforme nationale ou régionale, d'un inventaire conventionné : la même grille s'applique. C'est ce qui fait que le travail d'oreina, conduit pour qualifier ses propres données, se traduit aussi par un référentiel partagé pour tous ceux qui validateront, demain, n'importe quelle observation de Lépidoptère en France.

Libre

Diffusion en accès libre, sans inscription préalable.

Citable

Référentiels et fiches référencés, citables dans les publications et rapports d'étude.

Évolutif

Mise à jour continue par le COTECH IDENT au fil des connaissances acquises par le réseau.

Chiffres-clés

IDENT en chiffres

État du chantier en cours et objectifs à l'horizon 2028.

14

bénévoles experts mobilisés au sein du comité technique IDENT

6 141

taxons attribués dans le référentiel des niveaux de détermination d'Artemisiae

5

niveaux de difficulté dans la typologie PatriNat (T1 à T5)

~10

guides et fiches d'identification à produire d'ici 2028

839

cartes ABDSM de répartition départementale déjà réalisées pour les Lépidoptères

115

cartes ABDSM mises à jour en 2024 (Rhopalocères et Zygènes principalement)

100 %

des agrégats d'espèces du suivi européen EU-PoMS pris en charge d'ici 2028

Sources : documents projet IDENT et bilan d'activité 2024 d'oreina.

Sur Artemisiae

Une aide à la saisie, une aide à l'apprentissage

Le travail d'IDENT n'a pas vocation à rester confiné dans une base de données institutionnelle : il est conçu pour irriguer directement la pratique des observateurs sur Artemisiae.

Au moment de la saisie

Lorsqu'un observateur saisit une donnée sur Artemisiae, la plateforme peut désormais lui signaler que l'espèce déclarée appartient à un agrégat connu, et lui indiquer la nature des risques de confusion dans son département. Selon la difficulté typologique, elle peut suggérer une confirmation par photo de critères spécifiques, signaler la nécessité d'un examen morphologique, ou orienter vers un guide dédié.

Cette aide contextuelle évite des erreurs en amont et renforce la qualité de la donnée dès l'origine, sans alourdir le processus de saisie pour les espèces inconfondables.

Pour progresser dans son apprentissage

Pour les naturalistes en formation continue, IDENT fournit une véritable cartographie progressive de la difficulté. Un débutant peut consulter la liste des singletons (T1) et des espèces faciles (T2) de sa région : autant d'objectifs accessibles pour acquérir une première compétence solide. Un naturaliste plus avancé peut s'attaquer aux agrégats T3-T4 avec les guides illustrés produits par l'association.

Les fiches taxons d'Artemisiae intègrent désormais ces informations : niveau de difficulté, agrégats associés, critères distinctifs, lien vers les guides. C'est un outil unique en France pour comprendre, espèce par espèce, le degré de fiabilité qu'on peut accorder à une identification de terrain.

Le cycle vertueux entre identification, apprentissage et qualité de la donnée

1. Cartographie

Recensement des agrégats et typologie de la difficulté par les experts du COTECH.

2. Production des guides

Rédaction des fiches, clés et guides de dissection. Diffusion via Artemisiae.

3. Aide à la saisie

Signalement automatique des risques de confusion lors de la saisie sur Artemisiae.

4. Donnée qualifiée

Données plus fiables, validation facilitée, et le cycle alimente en retour la cartographie.

Outil phare

Les Labo Lépidos

Documenter un complexe d'espèces ne suffit pas : encore faut-il que les critères, les pièges et les cas-limites soient transmis aux observateurs et aux validateurs. Les Labo Lépidos sont le format pédagogique d'oreina pour cela : des sessions courtes, animées par un spécialiste, qui prennent un agrégat précis et le décortiquent pas à pas.

Chaque Labo Lépido associe un webinaire en direct (avec questions du public) et un support téléchargeable réutilisable, pensé comme un véritable outil de travail pour la saisie sur Artemisiae.

Webinaires courts

30 à 40 minutes pour traiter un agrégat ou un complexe d'espèces, animé par un référent du COTECH.

Supports téléchargeables

Diaporama et synthèse PDF, librement réutilisables pour la formation et la validation des données.

Ouverts à tous

Adhérents et non-adhérents bienvenus. Les replays restent accessibles en libre accès après la session.

Vous proposez le sujet

Spécialistes ou observateurs : la communauté propose les agrégats à traiter et peut animer ses propres sessions.

Premier Labo Lépido en ligne : le complexe Hoplodrina. Sept espèces en France, dont une redécouverte en 2020, un taux d'erreur d'identification estimé supérieur à 30 % sur Artemisiae : un cas d'école pour ouvrir la série. Diaporama, replay et clés pratiques sont disponibles sur la page dédiée.

Vers de nouveaux outils

IDENT et l'intelligence artificielle

Les outils d'identification automatique par intelligence artificielle se développent rapidement. Leur fiabilité dépend toutefois des données d'entraînement : la plupart des modèles disponibles aujourd'hui ont été développés à partir de corpus dominés par les contributions nord-européennes, et leurs performances chutent sensiblement sur les faunes méridionales, alpines, pyrénéennes ou corses, sous-représentées dans les jeux de données.

oreina a fait le choix de contribuer activement à l'amélioration de ces outils, plutôt que de les rejeter. Le projet IDENT prévoit le partage des bases de données photographiques de l'association pour augmenter la performance des modèles sur la faune française, accompagné d'une expertise nationale d'évaluation. L'idée n'est pas de remplacer le validateur humain par un algorithme, mais de fournir aux développeurs d'IA les corpus représentatifs qui leur manquent, et de mettre en place les protocoles d'évaluation indépendants permettant de mesurer la fiabilité réelle des modèles, espèce par espèce et région par région.

À terme, l'articulation idéale est claire : l'IA pour les espèces inconfondables et pour suggérer une première identification, l'expertise humaine pour les agrégats critiques et la validation des cas sensibles.

Contribuer

Vous pouvez contribuer

Le projet IDENT mobilise une diversité de compétences : expertise taxonomique, pédagogie, photographie, illustration. Plusieurs voies de contribution sont ouvertes.

Apporter une expertise taxonomique

Vous êtes spécialiste d'un groupe (Géomètres, Noctuelles, Microlépidoptères, Hespéries...) et vous identifiez régulièrement les agrégats critiques de votre groupe ? Rejoignez le COTECH IDENT pour contribuer à la documentation des complexes d'espèces.

Partager des illustrations

Photographies de critères distinctifs, schémas d'armures génitales, illustrations comparatives : tous les documents iconographiques de qualité enrichissent les guides. Une mention systématique de l'auteur est intégrée à chaque support.

Tester les clés d'identification

Avant publication, les clés sont testées par des naturalistes de différents niveaux pour vérifier leur clarté et leur ergonomie. Si vous avez du temps pour quelques sessions de relecture critique, votre regard est précieux.

Animer un Labo Lépido ou proposer un sujet

Vous souhaitez animer une session sur un agrégat que vous maîtrisez, ou suggérer un complexe d'espèces qui mériterait d'être traité ? Tout est centralisé sur la page Labo Lépidos, où vous pouvez consulter les sessions disponibles et déposer votre proposition.

Rejoindre le projet

Participer à IDENT

Que vous souhaitiez intégrer le COTECH, partager des illustrations, tester des clés ou participer aux ateliers, votre contribution renforce la qualité des identifications et l'autonomie des observateurs.

Découvrir les autres projets

IDENT est l'un des cinq projets scientifiques que conduit oreina pour la connaissance des Lépidoptères de France. Il est étroitement articulé avec le projet QUALIF, dont il est l'ingrédient méthodologique central.