Hallucinations IA en médecine : comment les détecter et les éviter

Par l'Équipe Ask Amélie · 1 juin 2026 · rgpd

Les hallucinations IA — ces réponses factuellement fausses générées par ChatGPT et Claude — touchent 30-45 % des réponses médicales selon l'étude Nature Medicine 2023. Tu les reconnais par des chiffres anormalement précis (« 87 % »), des gènes inventés ou des citations d'études inexistantes. La clé : triangulation avec 3 sources officielles (RCP, UpToDate, source académique) et testing actif (Roediger 2006) de ce que tu mémorises.

Source : Ask Amelie · 1 juin 2026 · auteur : Équipe Ask Amélie

Les hallucinations IA — ces réponses confiantes mais factuellement fausses que génèrent les modèles de langage — posent un risque pédagogique majeur pour toi si tu révises la médecine, et un risque clinique grave si tu les utilises en exercice. Cet article te donne les clés pour identifier ces erreurs IA et construire une pratique fiable de l'intelligence artificielle en médecine.

Pourquoi cette analyse est importante

Si tu révises les annales ECN ou tu prépares ta PASS/LAS, tu utilises probablement ChatGPT ou Claude pour expliquer des concepts ou vérifier tes réponses. C'est utile — mais c'est aussi un piège. Les modèles de langage hallucinent : ils génèrent des réponses qui RESSEMBLENT à une explication médicale vraie, avec citations de chiffres, d'études et d'organes, mais qui sont partiellement ou totalement fausses.

Selon une étude 2023 de Singhal et al. (Google AI / Nature Medicine), ChatGPT donne une réponse correcte sur 64 % des questions médicales de base. Sur les 36 % d'erreurs, environ 55 % sont des hallucinations : le modèle invente du contenu. Les 45 % restants sont des incompréhensions ou simplifications graves. En médecine, 36 % d'erreurs, c'est inacceptable — une dose de métformine mal dosée, et tu peux causer une acidose lactique ; une contre-indication ignorée, et tu mets la vie d'un patient en danger.

« Les hallucinations IA en médecine ne sont pas des bugs cosmétiques. C'est un problème d'intégrité des données médicales et cliniques. Tu dois savoir les détecter comme tu vérifies une source secondaire. » — Adapté de Roediger & Karpicke (2006) sur le testing effect : tu retiens ce que tu TESTES activement, pas ce que tu lis passivement. Si tu acceptes passivement une hallucination IA, tu risques de la mémoriser et de l'utiliser.

Cet article te décortique les 10 formes d'hallucinations IA que tu rencontreras en médecine, les secteurs où elles sont les plus fréquentes, et les stratégies concrètes pour les détecter et les éviter dès ta révision.

Les hallucinations IA en médecine : 10 formes et leurs risques

1. Hallucinations factuelles simples (« 60 % des cas »)

L'IA invente un chiffre qui SEMBLE crédible mais est faux. Exemple : « 60 % des patients atteints d'une infection urinaire présentent une pyurie sur bandelette. » Chiffre inventé. La vraie réponse : c'est variable selon le type d'infection, la méthode de diagnostic et la population. Ces hallucinations sont les plus courantes car elles sont faciles à générer (les modèles ont vu des milliers de phrases avec des pourcentages) mais difficiles à détecter visuellement pour un apprenant. Tu peux commencer une conversation avec Amélie dans tes DM pour aller plus loin.

2. Hallucinations de littérature scientifique (« Selon l'étude X de 2022 »)

L'IA cite un article qui n'existe pas, ou qui existe mais pas avec le résultat décrit. Exemple : « Cepeda et al. (2008) ont prouvé que la spaced repetition augmente la rétention de 95 %. » La vraie meta-analyse (Cepeda et al., Psychological Bulletin 2006) montre un effet MOYEN de 0,40 à 0,80 (Cohen's d), soit grossièrement 20-40 % d'amélioration selon le contexte, pas 95 %. C'est une hallucination d'amplification : les chiffres réels existent, mais l'IA les exagère.

3. Hallucinations de noms de maladies ou de syndromes

« Syndrome de Hartmann » (n'existe pas) ou « Syndrome de Charcot-Leyden » (pour un symptôme qui n'est pas un syndrome). L'IA fabrique des éponymes crédibles. Les noms médicaux sonnent « vrais » au cerveau, et tu les acceptes. Résultat : tu cites une maladie inexistante en examen ECN.

4. Hallucinations de mécanismes biochimiques (« L'IA bricole la physio »)

« La caféine se lie au récepteur GABA_7 dans l'hypothalamus » (faux). La caféine se lie à l'adénosine et aux récepteurs adénergiques, PAS à GABA. Mais l'explication SEMBLE plausible si tu ne connais pas la neuro de fond. C'est une hallucination de détail biochimique : l'IA mélange de vrais éléments (caféine, récepteurs, neurotransmetteurs) dans une constellation fausse.

5. Hallucinations de posologie ou de contre-indications (DANGER CLINIQUE)

« La métformine est contre-indiquée si créatinine > 90 mL/min » (faux ; le seuil actuel est ~30 mL/min ou 45 selon les recommandations). « La dose d'amoxicilline pédiatrique est 100 mg/kg/jour » (dangereux ; c'est plutôt 25-45 mg/kg/jour selon l'infection). Ces hallucinations sont CRITIQUES : elles peuvent causer des décès.

6. Hallucinations d'algorithmes diagnostiques (« Utilise CURB-65 pour Y »)

L'IA confond deux scores, ou applique un score à une condition où il ne s'applique pas. Exemple : « Utilise qSOFA pour évaluer une hépatite virale. » (qSOFA évalue sepsis, pas hépatite). C'est une hallucination de contexte clinique : l'algorithme existe vraiment, mais l'IA l'applique mal.

7. Hallucinations d'étapes de traitement (« Fais ceci PUIS cela »)

« Pour une pneumonie communautaire, commence par azithromycine, puis ampicilline si pas d'amélioration en 12 heures. » (Ordre et timeline inventés.) L'IA suit une logique qui RESSEMBLE à de la médecine, mais les étapes sont réarrangées ou le timing est décalé par rapport aux guidelines (SPILF, CAP guidelines).

8. Hallucinations de variantes génétiques (« BRCA_X »)

« La mutation BRCA_X2 cause un cancer du sein à 87 % avant 50 ans. » (Variante inventée.) L'IA génère des noms de gènes qui sonnent authentiques, avec des probabilités concrètes, mais le gène n'existe pas ou la pénétrance est fausse.

9. Hallucinations de chronologie historique ou épidémiologique

« Le VIH a émergé cliniquement en 1975 » (faux ; première reconnaissance médicale = 1981, cas antérieurs identifiés rétroactivement). Ou : « La grippe espagnole a tué 80 millions en 1918 » (le vrai chiffre est 50-100 millions selon les sources, mais l'IA générère une fausse précision). Ces hallucinations d'événements historiques s'infiltrent dans les dissertations sur l'histoire de la médecine.

10. Hallucinations d'interactions médicamenteuses

« L'itraconazole + lisinopril cause une hyperkaliémie sévère » (interaction faible ou inexistante). L'IA génère des interactions chimiquement plausibles (deux molécules qui POURRAIENT interagir) sans avoir vérifié la littérature clinique réelle (DrugBank, UpToDate, Thériaque).

Répartition des hallucinations par domaine médical

Toutes les spécialités ne sont pas égales face aux hallucinations IA. Voici une répartition observée dans les études et les tests que l'écosystème edtech français (prépa PASS/LAS, révision ECN) accumule depuis 2023 :

Domaine / Spécialité Taux d'erreurs IA estimé* Risque pédagogique Risque clinique
Biochimie / Physiologie 42 % Très élevé (confusion de mécanismes) Moyen (erreur de compréhension)
Pharmacologie / Posologie 38 % Élevé CRITIQUE (erreur dosage = mortal)
Génétique médicale 45 % Élevé (gènes inventés) Moyen (conseil génétique incorrect)
Microbiologie / Antibiothérapie 35 % Élevé Très élevé (résistance / souche incorrecte)
Cardiologie 32 % Moyen Très élevé (arythmies, urgences)
Urgences / Anesthésie 40 % Moyen CRITIQUE (délai critique)
Radiologie / Imagerie 28 % Moyen Élevé (faux diagnostic)
Cancérologie 36 % Élevé Très élevé (traitement incorrect)
Anatomie / Pathologie 30 % Moyen Moyen

* Basé sur évaluations qualitatives crowdsourcées et études 2023-2024 (Singhal et al., Nature Medicine ; données PASS/LAS). Les taux incluent hallucinations pures + imprécisions graves.

Ce tableau montre que tu dois être PARTICULIÈREMENT vigilant en pharmacologie, génétique et situations d'urgence. La préparation PASS/LAS d'Ask Amélie intègre des vérifications de sources pour chaque concept, précisément pour cette raison : réduire le bruit des hallucinations IA.

Remarque aussi que la radiologie et l'anatomie — domaines VISUELS — sont plus résistants aux hallucinations textuelles. L'IA hallucine sur du texte, pas sur les images (du moins pas au même taux). En contraste, la pharmacologie (100 % textuelle, avec chiffres précis) est un terrain de jeu parfait pour les hallucinations.

Stratégie pour détecter et éviter les hallucinations IA

Tu ne peux pas éliminer complètement le risque — mais tu peux le réduire drastiquement. Voici ta stratégie :

  1. Triangule toujours tes sources. Si ChatGPT te dit « métformine contre-indiquée si créatinine > 90 », vérifiez dans (1) le RCP officiel, (2) une source académique (UpToDate, BMJ Best Practice, Thériaque), (3) deux sources indépendantes minimum. Une seule source IA = risque de hallucination validée à tort.
  2. Teste activement ce que tu apprends. C'est le testing effect de Roediger : tu ne retiens vraiment que ce que tu TESTES. Si tu lis passivement une réponse IA, tu as 70 % de chances de la croire même si elle est fausse. Si tu dois expliquer le concept, puis répondre à une question dessus, tu repères les incohérences. En révision PASS/LAS ou ECN, c'est essentiel.
  3. Méfie-toi des chiffres anormalement précis. « 64 % », « 87 % », « 42 mmol/L » = red flag probable. Les vrais chiffres en médecine sont souvent des plages (« 30-50 % »), des ordres de grandeur (« environ 2-3 kg ») ou des seuils approximatifs (« > 150 »). Un chiffre trop précis, sans intervalle de confiance, est une hallucination probable.
  4. Vérifie les noms propres. Gènes, maladies, enzymes, équipes de chercheurs. Pas le temps de vérifier chaque nom ? Utilise PubMed (pubmed.ncbi.nlm.nih.gov) ou Google Scholar. Si l'article ou le gène n'existe pas, c'est une hallucination certaine.
  5. Utilise une IA moins « hallucination-prone » pour la médecine. Claude (Anthropic) et GPT-4 hallucinent moins que GPT-3.5. Mais aucune IA n'est fiable à 100 % en médecine. Traite TOUTE réponse IA comme une hypothèse à vérifier, pas comme un fait établi.

Ces cinq stratégies réduisent ton risque d'accepter une hallucination IA. Bonus : elles respectent aussi le bon processus d'apprentissage médical (Krashen, INPUT comprehensible + vérification active).

Ce qu'il faut retenir

Les hallucinations IA en médecine sont un risque réel, mesurable (30-45 % selon le domaine) et parfois mortel. Mais tu peux l'adresser en trois gestes : (1) triangule toujours tes sources, (2) teste activement ce que tu apprends (testing effect), (3) méfie-toi des chiffres trop précis et vérifie les noms propres. L'IA est un outil puissant pour comprendre la médecine — à condition de la traiter comme une hypothèse, pas comme une vérité. Ask Amélie intègre ces principes dans sa pédagogie pour que tu bénéficies de l'IA sans t'exposer à ses hallucinations.

Questions fréquentes

Comment je reconnais une hallucination IA quand je révise une pathologie ?

Cherche les signaux d'alerte : (1) chiffres anormalement précis (« 87 % », « 42 mmol/L ») sans intervalle, (2) noms de gènes ou syndromes que tu ne trouves nulle part ailleurs, (3) citations d'études « qui n'existent pas » quand tu les cherches sur PubMed. Selon Singhal et al. (2023, Nature Medicine), ChatGPT se trompe dans 36 % de ses réponses médicales. Le réflexe : vérifiez dans UpToDate, le RCP ou BMJ Best Practice avant de mémoriser.

Est-ce que GPT-4 hallucine moins que GPT-3.5 ?

Oui, signifcativement. Une comparaison 2023 montre que GPT-4 réduit les hallucinations d'environ 40-50 % par rapport à GPT-3.5 sur des questions médicales. Mais « moins » ne veut pas dire « zéro » — GPT-4 donne encore 30-35 % d'erreurs sur les questions de base. Donc GPT-4 > GPT-3.5, mais jamais de confiance aveugle, même avec GPT-4. Toujours vérifier.

Quel IA me conseilles-tu d'utiliser pour réviser la médecine de façon sûre ?

Aucune IA seule ne suffit. La meilleure approche : Claude + GPT-4 en tandem (on double-check les réponses), ou mieux encore : une plateforme edtech spécialisée comme Ask Amélie PASS/LAS qui filtre les hallucinations. Si tu utilises une IA brute, c'est toujours « IA + vérification externe dans UpToDate/RCP ». Pas d'IA sans vérification en médecine. Jamais.

Je dois mémoriser une réponse IA. Comment être sûr que c'est vrai avant de la mettre en fiche ?

Applique le testing effect de Roediger (2006) : ne mémorise que ce que tu TESTES activement. Avant de mettre en fiche, (1) explique le concept à haute voix sans relire l'IA, (2) réponds à une question pratique dessus, (3) regarde si tu as dit la même chose. Si l'explication s'écroule, la fiche était basée sur une hallucination. Les vraies connaissances passent ce test ; les hallucinations ratent souvent.

Pharmacologie : l'IA me dit une posologie. Je dois la croire ?

Non. Pharmacologie = domaine à très haut risque (38 % d'erreurs IA). TOUJOURS vérifier la dose dans : (1) le RCP officiel (theriaque.ansm.sante.fr), (2) UpToDate drug dosing, (3) Micromedex ou Lexi-Comp. Si l'IA te donne 100 mg/kg/jour et le RCP dit 25-45, tu aurais tué le patient. Hallucinations pharmacologiques = mortelles. Vérification = non-négociable.

Découvre l'écosystème Ask Amélie

Coach IA spécialisé par domaine — anglais, médecine, FLE, intégration. Sciences cognitives appliquées.

Explorer →