Monday, March 2, 2026
HomeHealth & FitnessExperts warn open access bio-data could help AI design dangerous pathogens

Experts warn open access bio-data could help AI design dangerous pathogens


Les modèles d’intelligence artificielle (IA) pour la biologie s’appuient fortement sur de grands volumes de données biologiques, notamment des séquences génétiques et des caractéristiques des agents pathogènes. Mais ces informations devraient-elles être universellement accessibles ? Comment garantir son utilisation légitime ?


PUBLICITÉ


PUBLICITÉ

Plus de 100 chercheurs ont averti qu’un accès illimité à certains ensembles de données biologiques pourrait permettre aux systèmes d’intelligence artificielle de contribuer à la conception ou à l’amélioration de virus dangereux, et ont appelé à des garanties plus strictes pour empêcher toute utilisation abusive.

Dans une lettre ouverteDes chercheurs d’institutions de premier plan, notamment l’Université Johns Hopkins, l’Université d’Oxford, l’Université Fordham et l’Université Stanford, affirment que même si les données scientifiques en libre accès ont accéléré les découvertes, un petit sous-ensemble de nouvelles données biologiques présente des risques en matière de biosécurité s’il est mal utilisé.

“Les enjeux sont importants en matière de gouvernance des données biologiques, car les modèles d’IA pourraient contribuer à créer de graves menaces biologiques”, écrivent les auteurs.

Les modèles d’IA utilisés en biologie peuvent prédire les mutations, identifier des modèles et générer des variantes plus transmissibles d’agents pathogènes pandémiques.

Les auteurs décrivent cela comme une « capacité préoccupante » qui pourrait accélérer et simplifier la création d’agents pathogènes biologiques transmissibles susceptibles de provoquer des pandémies humaines ou des événements similaires chez les animaux, les plantes ou l’environnement.

Les chercheurs ont noté qu’en général, les données biologiques devraient être librement accessibles, mais que les « données sur les agents pathogènes » nécessitent des contrôles de sécurité plus stricts.

“Notre objectif est de définir et de gouverner les ensembles de données les plus préoccupants avant qu’ils ne soient mis à la disposition des développeurs d’IA”, écrivent-ils dans le document, proposant un nouveau cadre pour réglementer l’accès.

“À une époque dominée par les modèles biologiques d’IA open source développés dans le monde entier, limiter l’accès aux données sensibles sur les agents pathogènes aux chercheurs légitimes pourrait être l’une des voies les plus prometteuses pour réduire les risques”, a déclaré Moritz Hanke, co-auteur de la lettre de l’Université Johns Hopkins.

Que font les développeurs ?

Actuellement, aucun cadre universel ne réglemente ces ensembles de données. Alors que certains développeurs excluent volontairement les données à haut risque, les chercheurs soutiennent que des règles claires et cohérentes devraient s’appliquer à tous.

Les développeurs des principaux modèles d’IA biologique, Evo, créé par des chercheurs de l’Arc Institute, de Stanford et TogetherAI, et ESM3, d’EvolutionaryScale, ont caché certaines séquences virales de leurs données d’entraînement.

En février 2025, l’équipe EVO 2 a annoncé qu’elle avait exclu de ses ensembles de données les agents pathogènes qui infectent les humains et d’autres organismes complexes en raison de risques éthiques et de sécurité, et pour « empêcher l’utilisation d’Evo pour le développement d’armes biologiques ».

EVO 2 est un modèle d’IA open source pour la biologie qui peut prédire les effets des mutations de l’ADN, concevoir de nouveaux génomes et découvrir des modèles de code génétique.

“À l’heure actuelle, il n’existe pas de conseils d’experts sur les données qui présentent des risques importants, ce qui laisse certains développeurs de pointe faire leurs meilleures suppositions et exclure volontairement les données virales de la formation”, a écrit l’auteur de l’étude, Jassi Panu, co-auteur de la lettre, sur LinkedIn.

Différents types de données à risque

Les auteurs notent que le cadre proposé s’applique seulement à une petite fraction des ensembles de données biologiques.

Il introduit un niveau de données de biosécurité (BDL) à cinq niveaux pour catégoriser les données sur les agents pathogènes, en les classant par niveau de « risque » en fonction de leur potentiel pour permettre aux systèmes d’IA d’apprendre les modèles viraux généraux et les menaces biologiques pour les animaux et les humains. Comprend :

BDL-0 : données biologiques quotidiennes. Il ne devrait avoir aucune restriction et peut être partagé librement.

BLD-1 : composants de base du virus, tels que les séquences génétiques. Vous n’avez pas besoin de contrôles de sécurité approfondis, mais la connexion et l’accès doivent être surveillés.

BLD-2 : Données sur les caractéristiques des virus animaux, telles que les espèces sauteuses ou la survie en dehors de l’hôte.

BLD-3 : Données sur les caractéristiques du virus humain, telles que la transmissibilité, les symptômes et la résistance aux vaccins.

BLD-4 : Virus humains améliorés, tels que des mutations du virus COVID-19 qui le rendent plus contagieux. Cette catégorie serait confrontée aux restrictions les plus strictes.

Garantir un accès sécurisé

Pour garantir un accès sécurisé, la charte nécessite des outils techniques spécifiques permettant aux fournisseurs de données de vérifier les utilisateurs légitimes et de suivre les abus.

Les outils proposés incluent le filigrane (intégration d’identifiants uniques et cachés dans des ensembles de données pour suivre facilement les fuites), la provenance des données et les journaux d’audit qui enregistrent les accès et les modifications avec des signatures inviolables, et la biométrie comportementale qui peut suivre les modèles d’interaction uniques des utilisateurs.

Les chercheurs affirment qu’il sera essentiel de trouver le juste équilibre entre l’ouverture et les restrictions de sécurité nécessaires sur les données à haut risque à mesure que les systèmes d’IA deviennent plus puissants et plus largement disponibles.

RELATED ARTICLES

LEAVE A REPLY

Please enter your comment!
Please enter your name here

Most Popular

Recent Comments