L’IA peut-elle remplacer les experts en cybersécurité ?

décembre 20, 2025 On décembre 20, 2025

Posted by Techno Info

ARTEMIS : quand un agent IA rivalise avec des pentesters humains

L’intelligence artificielle ne se contente plus d’aider à rédiger des rapports ou à trier des alertes : elle commence à agir dans des missions techniques longues, complexes et proches du terrain. C’est exactement ce que montre une étude menée par des chercheurs de Stanford (avec des co-auteurs affiliés à Carnegie Mellon et d’autres structures), où un agent IA baptisé ARTEMIS a été comparé directement à des professionnels de la cybersécurité lors d’un test de pénétration (“pentest”) sur un réseau universitaire réel.

Le résultat a fait du bruit : ARTEMIS arrive 2ᵉ au classement, identifie 9 vulnérabilités valides, et dépasse la performance de 9 participants humains sur 10 selon les métriques de soumissions valides. arXiv+2Business Insider+2
Mais le papier met aussi en évidence des limites importantes : faux positifs, difficultés sur des tâches “GUI” (interface graphique), et même un cas où l’agent manque une faille évidente repérée rapidement par plusieurs humains.

Alors, faut-il conclure que l’IA va remplacer les experts cyber ? Pas si vite. En revanche, il devient difficile d’ignorer que la cybersécurité entre dans une phase “agentique” : plus rapide, plus automatisée, plus scalable… et potentiellement plus dangereuse si ces outils tombent du mauvais côté.

1) Que dit exactement l’étude de Stanford ?

Le papier (publié sur arXiv le 10 décembre 2025) présente une évaluation “réaliste” : des humains et plusieurs agents IA sont confrontés au même type de mission, sur un réseau conséquent, avec des règles de soumission et de validation. arXiv+1

Un environnement proche du réel

Les chercheurs parlent d’un réseau universitaire de grande taille : environ 8 000 hôtes répartis sur 12 sous-réseaux. arXiv+1
L’objectif n’est pas juste de “scanner”, mais de découvrir et soumettre des vulnérabilités, avec un processus de tri et de qualité comparable à celui d’un audit offensif. arXiv

Un agent conçu pour les missions longues

Les auteurs décrivent ARTEMIS comme un cadre multi-agents (capable de créer des sous-agents), avec génération dynamique de prompts et triage automatique des vulnérabilités. arXiv+1
En clair : plutôt qu’un seul “cerveau” qui fait tout, ARTEMIS peut déléguer (reconnaissance, validation, rédaction, priorisation), ce qui l’aide à gérer plusieurs pistes en parallèle. arXiv

2) Les chiffres qui ont marqué

Voici les éléments les plus cités (et les plus importants) :

Classement : ARTEMIS se place 2ᵉ au global, et surperforme 9 humains sur 10 dans cette évaluation.
Vulnérabilités : l’agent trouve 9 vulnérabilités valides avec 82% de “valid submission rate” (taux de soumissions jugées valides). arXiv+1
Temps : des comparaisons mettent en avant une fenêtre de 10 heures (là où certains récits indiquent qu’ARTEMIS a travaillé plus longtemps au total). Business Insider+1
Qualité / erreurs : un article du Wall Street Journal souligne 18% de faux positifs et le fait que l’agent a raté un bug évident que des humains ont détecté. Wall Street Journal

La variable qui change la discussion : le coût

Plusieurs sources rapportent un coût d’exécution autour de 18 $/heure pour certaines variantes d’ARTEMIS, et des comparaisons avec les tarifs/salaires humains (souvent cités autour de 125 000 $/an dans certains articles). Business Insider+1
Même en prenant des variantes plus coûteuses, la logique économique est claire : le coût marginal de “tester plus” devient très bas.

3) Pourquoi ARTEMIS peut dépasser des humains sur certains aspects

Ce que l’étude met en évidence, ce n’est pas seulement “l’IA est forte”, mais où elle l’est.

a) L’énumération systématique (sans fatigue)

Un humain peut être brillant, mais il est limité par le temps, l’attention et la fatigue. L’agent, lui, peut dérouler une exploration méthodique, sans baisse de concentration. Le papier parle d’avantages en systematic enumeration. arXiv

b) Le parallélisme (multi-agents)

ARTEMIS est décrit comme capable d’exécuter des sous-tâches en parallèle via des sous-agents. Résultat : plus de pistes testées, plus vite. arXiv+1

c) Une rédaction “industrielle”

Sur une mission de pentest, trouver une faille ne suffit pas : il faut produire une soumission claire et exploitable. L’étude insiste sur la submission quality comparable aux meilleurs participants sur certains points. arXiv

4) Ses limites : pourquoi l’humain reste indispensable

Les performances d’ARTEMIS ne sont pas une “preuve” que la cybersécurité humaine est dépassée. Au contraire, les limites observées sont très instructives.

a) Faux positifs : 18% peut coûter très cher

Un faux positif dans un rapport peut déclencher une perte de temps énorme, détourner la priorité d’un vrai risque, ou créer du bruit dans un SOC déjà saturé. Le WSJ met en avant ce chiffre dans le cas d’ARTEMIS.

b) Difficultés sur les interfaces graphiques

Le papier identifie des écarts de capacités : les agents IA “struggle with GUI-based tasks”. En pratique, beaucoup d’environnements réels reposent encore sur des interfaces et workflows où l’humain garde l’avantage. arXiv+1

c) L’intuition métier et le contexte

Un pentest n’est pas qu’un exercice technique : on priorise selon l’impact métier, on échange avec les équipes, on prend des décisions sous contraintes (temps, budget, risques). Là, l’IA peut aider, mais la responsabilité et le jugement restent humains.

5) Le “côté sombre” : ce progrès aide aussi les attaquants

C’est l’autre lecture incontournable : si un agent IA peut améliorer la défense, il peut aussi industrialiser l’attaque.

L’étude elle-même souligne que ces agents offrent des avantages en énumération et exploitation parallèle, exactement ce qu’un acteur malveillant recherche. arXiv+1
Le débat public s’intensifie : Stanford Law a relayé le sujet via un billet presse lié à ces travaux (“AI hackers…”), preuve que l’enjeu dépasse le laboratoire. law.stanford.edu

Autrement dit : le vrai risque n’est pas “un hacker génie IA”, mais des attaques plus nombreuses, plus rapides, plus automatisées, menées par des acteurs de niveau moyen… devenus très efficaces grâce aux agents.

6) Impact sur les métiers : remplacement ou transformation ?

La trajectoire la plus réaliste n’est pas “IA contre humains”, mais humains + IA.

Ce que l’IA va automatiser massivement

reconnaissance, inventaire, tri de pistes
enrichissement d’alertes (corrélation, hypothèses)
génération de rapports et de recommandations standardisées
tests répétitifs et contrôles d’hygiène

Ce qui restera “humain” au cœur du métier

stratégie de sécurité, arbitrages business
investigations complexes (preuves, chaînes causales)
gestion de crise et communication
gouvernance, conformité, décisions à haut risque
créativité offensive de haut niveau (et créativité défensive)

En clair : les équipes cyber qui savent piloter des agents IA deviendront plus productives, et cela changera les profils recherchés (plus de “pilotage + validation”, moins de tâches répétitives).

7) Comment utiliser des agents IA en cybersécurité sans se brûler

Voici une approche prudente (et efficace) côté entreprise :

Humain dans la boucle : validation obligatoire avant toute action à impact (changements système, accès sensibles, exfiltration de données de test, etc.).
Moindre privilège : l’agent n’a accès qu’à ce qui est nécessaire, avec des tokens et permissions compartimentés.
Journalisation complète : tout ce que l’agent fait doit être traçable (audit interne, conformité, forensic).
Mesure de performance : taux de faux positifs / faux négatifs, temps de triage, qualité des recommandations, réduction du backlog SOC.

Cette discipline est importante car les chiffres type “82% de valid submissions” sont impressionnants, mais le coût opérationnel du bruit (faux positifs) peut annuler une partie du gain si on déploie sans gouvernance.

Conclusion

L’expérience autour d’ARTEMIS marque un tournant : un agent IA bien conçu peut rivaliser avec des professionnels sur certaines dimensions (volume, parallélisme, régularité) et obtenir des résultats très compétitifs, à un coût nettement inférieur dans certains scénarios. arXiv+1

Mais l’étude montre aussi pourquoi la cybersécurité ne se résume pas à “trouver des failles” : faux positifs, limites sur des tâches concrètes, besoin de contexte et de responsabilité.

La vraie question devient donc : qui saura construire et piloter une cybersécurité hybride — où l’IA fait le travail lourd, et où l’humain garde le contrôle, la décision, et l’éthique.

FAQ

ARTEMIS remplace-t-il les pentesters ?
Non. Il automatise une partie du travail et peut rivaliser sur certaines métriques, mais il a des limites (dont les faux positifs et des lacunes sur des tâches GUI). Wall Street Journal+1

Pourquoi le coût d’ARTEMIS est-il autant discuté ?
Parce que certaines variantes rapportées tournent autour de 18 $/h, ce qui change l’économie des audits à grande échelle, même si la supervision humaine reste nécessaire. arXiv+1

Est-ce dangereux d’avoir des agents IA offensifs ?
Oui, car les mêmes capacités (énumération, parallélisme) peuvent être utilisées par des attaquants pour industrialiser des campagnes.

Source : arXiv , Wall Street Journal

Laisser un commentaire Annuler la réponse

ecran-gaming-connect-2510c-245-144-hz-fast-ips

Comparer

Aperçu

Liste de souhaits

Écran Gaming CONNECT 2510C 24,5″ 144 Hz Fast IPS

Moniteurs

Note 0 sur 5

En stock

849,00 Dhs

Ajouter au panier

Brand	Connect
Taille d'écran	24,5 pouces
Résolution	Fast IPS avec résolution Full HD, Full HD 1920 × 1080 pixels, Taux de rafraîchissement fluide de 144 Hz
Connectivité	HDMI et DisplayPort

telephone-fixe-gigaset-as690-dect-autonomie-18-heures

Comparer

Aperçu

Liste de souhaits

Téléphone Fixe Gigaset AS690 DECT – Autonomie 18 Heures

Smartphone

Note 0 sur 5

En stock

588,00 Dhs

Ajouter au panier

microsoft-surface-pro-12-snapdragon-x-plus-16go-512go-ocean

Comparer

Aperçu

Liste de souhaits

Microsoft Surface Pro 12 Snapdragon X Plus 16Go 512Go Océan

PC Portables

Note 0 sur 5

En stock

11.900,00 Dhs

Ajouter au panier

Brand	Microsoft
Processeur	Snapdragon X Plus à 8 cœurs
Ram	16 GB
Stockage	512 Go de SSD
Résolution	2196 × 1464 pixels
Taille d'écran	12 pouces

lenovo-thinkpad-e16-gen-3-ultra-7-16-go-ssd-512-go

Comparer

Aperçu

Liste de souhaits

Lenovo ThinkPad E16 Gen 3 Ultra 7, 16 Go, SSD 512 Go

PC Portables

Note 0 sur 5

En stock

9.900,00 Dhs

Ajouter au panier

Brand	Lenovo
Processeur	Intel Core Ultra 7 255H, jusqu’à 5,1 GHz
Ram	16 Go DDR5-5600
Stockage	SSD NVMe PCIe 4.0 de 512 Go
Résolution	WUXGA IPS antireflet, 300 nits
Taille d'écran	16 pouces

Comparer

Aperçu

Liste de souhaits

Apple MacBook Neo 13” A18 Pro 256Go SSD

Macbook

Note 0 sur 5

En stock

7.999,00 Dhs

Ajouter au panier

Brand	Apple
Processeur	Puce Apple A18 Pro avec CPU 6
Carte graphique	GPU 5 cœurs
Ram	8 Go de mémoire unifiée pour une utilisation fluide
Stockage	SSD 256 Go rapide pour fichiers et applications
Taille d'écran	13 pouces
Résolution	Liquid Retina 2408 x 1506 pixels, Luminosité 500 nits
Batterie	Jusqu’à 16 heures d’autonomie
Caméra	FaceTime HD 1080p

ventilateur-nova-glacial-t904-noir-puissant-et-design

Comparer

Aperçu

Liste de souhaits

Ventilateur NOVA GLACIAL T904 Noir – Puissant et Design

Ventilateurs

Note 0 sur 5

En stock

197,00 Dhs

Ajouter au panier

Brand	Nova

ssd-kingston-nv2-250go-m-2-nvme-pcie-4-0-interne

Comparer

Aperçu

Liste de souhaits

SSD Kingston NV2 250Go M.2 NVMe PCIe 4.0 Interne

Accessoire ordinateur

Note 0 sur 5

En stock

649,00 Dhs

Ajouter au panier

cable-hdmi-2-1-8k-10m-ultra-haute-vitesse

Comparer

Aperçu

Liste de souhaits

Cable HDMI 2.1 8K 10M Ultra Haute Vitesse

Accessoires

Note 0 sur 5

En stock

195,00 Dhs

Ajouter au panier

ecran-pc-msi-pro-mp252l-245″-full-hd-100-hz

Comparer

Aperçu

Liste de souhaits

Écran PC MSI PRO MP252L 24,5″ Full HD 100 Hz

Moniteurs

Note 0 sur 5

En stock

899,00 Dhs

Ajouter au panier

Brand	MSI
Résolution	Compatible HDR Ready avec 16,7 millions de couleurs, Full HD 1920 x 1080, IPS offrant des couleurs nettes et des angles de vision larges de 178°, Taux de rafraîchissement 100 Hz, Temps de réponse rapide 1 ms MPRT / 4 ms GTG
Connectivité	câble HDMI, adaptateur secteur et guide rapide, HDMI 1.4b, DisplayPort 1.2a et sortie casque

g-tab-t13-tablette-10-1-android-16-128gb-4g-lte

Comparer

Aperçu

Liste de souhaits

G-Tab T13 Tablette 10.1” Android 16 128GB 4G LTE

Tablettes

Note 0 sur 5

En stock

1.199,00 Dhs

Ajouter au panier

Brand	G-Tab T13
Processeur	octa-core pour une utilisation fluide
Stockage	128 GB
Connectivité	4G LTE double SIM + Wi-Fi
Caméra	2MP et caméra arrière 5MP
Batterie	longue durée pour un usage quotidien
Écran	10,1 pouces

carte-mere-msi-pro-h610m-e-ddr4-intel-lga1700

Comparer

Aperçu

Liste de souhaits

Carte Mère MSI PRO H610M-E DDR4 Intel LGA1700

Carte mère

Note 0 sur 5

En stock

729,00 Dhs

Ajouter au panier

Brand	MSI
Processeur	Compatible avec processeurs Intel Core 14e, 13e et 12e génération
Ram	Support mémoire DDR4 jusqu’à 64 Go en Dual-Channel
Carte graphique	1 slot PCIe 4.0 x16 pour carte graphique
Stockage	1 slot M.2 PCIe 3.0 x4 / SATA pour SSD rapide, 4 ports SATA 6 Gb/s pour stockage supplémentaire
Connectivité	Réseau Gigabit LAN 1Gbps et audio 7.1 HD

boitier-pc-gaming-msi-mag-forge-320r-airflow-blanc

Comparer

Aperçu

Liste de souhaits

Boîtier PC Gaming MSI MAG FORGE 320R AIRFLOW Blanc

PC Gamer

Note 0 sur 5

En stock

789,00 Dhs

Ajouter au panier

Brand	MSI

Disponible 7j/7

L’IA peut-elle remplacer les experts en cybersécurité ?

ARTEMIS : quand un agent IA rivalise avec des pentesters humains

1) Que dit exactement l’étude de Stanford ?

Un environnement proche du réel

Un agent conçu pour les missions longues

2) Les chiffres qui ont marqué

La variable qui change la discussion : le coût

3) Pourquoi ARTEMIS peut dépasser des humains sur certains aspects

a) L’énumération systématique (sans fatigue)

b) Le parallélisme (multi-agents)

c) Une rédaction “industrielle”

4) Ses limites : pourquoi l’humain reste indispensable

a) Faux positifs : 18% peut coûter très cher

b) Difficultés sur les interfaces graphiques

c) L’intuition métier et le contexte

5) Le “côté sombre” : ce progrès aide aussi les attaquants

6) Impact sur les métiers : remplacement ou transformation ?

Ce que l’IA va automatiser massivement

Ce qui restera “humain” au cœur du métier

7) Comment utiliser des agents IA en cybersécurité sans se brûler

Conclusion

FAQ

Articles similaires

Laisser un commentaire Annuler la réponse

Catégories