Les hallucinations IA — ces réponses confiantes mais factuellement fausses que génèrent les modèles de langage — posent un risque pédagogique majeur pour toi si tu révises la médecine, et un risque clinique grave si tu les utilises en exercice. Cet article te donne les clés pour identifier ces erreurs IA et construire une pratique fiable de l'intelligence artificielle en médecine.
Pourquoi cette analyse est importante
Si tu révises les annales ECN ou tu prépares ta PASS/LAS, tu utilises probablement ChatGPT ou Claude pour expliquer des concepts ou vérifier tes réponses. C'est utile — mais c'est aussi un piège. Les modèles de langage hallucinent : ils génèrent des réponses qui RESSEMBLENT à une explication médicale vraie, avec citations de chiffres, d'études et d'organes, mais qui sont partiellement ou totalement fausses.
Selon une étude 2023 de Singhal et al. (Google AI / Nature Medicine), ChatGPT donne une réponse correcte sur 64 % des questions médicales de base. Sur les 36 % d'erreurs, environ 55 % sont des hallucinations : le modèle invente du contenu. Les 45 % restants sont des incompréhensions ou simplifications graves. En médecine, 36 % d'erreurs, c'est inacceptable — une dose de métformine mal dosée, et tu peux causer une acidose lactique ; une contre-indication ignorée, et tu mets la vie d'un patient en danger.
« Les hallucinations IA en médecine ne sont pas des bugs cosmétiques. C'est un problème d'intégrité des données médicales et cliniques. Tu dois savoir les détecter comme tu vérifies une source secondaire. » — Adapté de Roediger & Karpicke (2006) sur le testing effect : tu retiens ce que tu TESTES activement, pas ce que tu lis passivement. Si tu acceptes passivement une hallucination IA, tu risques de la mémoriser et de l'utiliser.
Cet article te décortique les 10 formes d'hallucinations IA que tu rencontreras en médecine, les secteurs où elles sont les plus fréquentes, et les stratégies concrètes pour les détecter et les éviter dès ta révision.
Les hallucinations IA en médecine : 10 formes et leurs risques
1. Hallucinations factuelles simples (« 60 % des cas »)
L'IA invente un chiffre qui SEMBLE crédible mais est faux. Exemple : « 60 % des patients atteints d'une infection urinaire présentent une pyurie sur bandelette. » Chiffre inventé. La vraie réponse : c'est variable selon le type d'infection, la méthode de diagnostic et la population. Ces hallucinations sont les plus courantes car elles sont faciles à générer (les modèles ont vu des milliers de phrases avec des pourcentages) mais difficiles à détecter visuellement pour un apprenant. Tu peux commencer une conversation avec Amélie dans tes DM pour aller plus loin.
2. Hallucinations de littérature scientifique (« Selon l'étude X de 2022 »)
L'IA cite un article qui n'existe pas, ou qui existe mais pas avec le résultat décrit. Exemple : « Cepeda et al. (2008) ont prouvé que la spaced repetition augmente la rétention de 95 %. » La vraie meta-analyse (Cepeda et al., Psychological Bulletin 2006) montre un effet MOYEN de 0,40 à 0,80 (Cohen's d), soit grossièrement 20-40 % d'amélioration selon le contexte, pas 95 %. C'est une hallucination d'amplification : les chiffres réels existent, mais l'IA les exagère.
3. Hallucinations de noms de maladies ou de syndromes
« Syndrome de Hartmann » (n'existe pas) ou « Syndrome de Charcot-Leyden » (pour un symptôme qui n'est pas un syndrome). L'IA fabrique des éponymes crédibles. Les noms médicaux sonnent « vrais » au cerveau, et tu les acceptes. Résultat : tu cites une maladie inexistante en examen ECN.
4. Hallucinations de mécanismes biochimiques (« L'IA bricole la physio »)
« La caféine se lie au récepteur GABA_7 dans l'hypothalamus » (faux). La caféine se lie à l'adénosine et aux récepteurs adénergiques, PAS à GABA. Mais l'explication SEMBLE plausible si tu ne connais pas la neuro de fond. C'est une hallucination de détail biochimique : l'IA mélange de vrais éléments (caféine, récepteurs, neurotransmetteurs) dans une constellation fausse.
5. Hallucinations de posologie ou de contre-indications (DANGER CLINIQUE)
« La métformine est contre-indiquée si créatinine > 90 mL/min » (faux ; le seuil actuel est ~30 mL/min ou 45 selon les recommandations). « La dose d'amoxicilline pédiatrique est 100 mg/kg/jour » (dangereux ; c'est plutôt 25-45 mg/kg/jour selon l'infection). Ces hallucinations sont CRITIQUES : elles peuvent causer des décès.
6. Hallucinations d'algorithmes diagnostiques (« Utilise CURB-65 pour Y »)
L'IA confond deux scores, ou applique un score à une condition où il ne s'applique pas. Exemple : « Utilise qSOFA pour évaluer une hépatite virale. » (qSOFA évalue sepsis, pas hépatite). C'est une hallucination de contexte clinique : l'algorithme existe vraiment, mais l'IA l'applique mal.
7. Hallucinations d'étapes de traitement (« Fais ceci PUIS cela »)
« Pour une pneumonie communautaire, commence par azithromycine, puis ampicilline si pas d'amélioration en 12 heures. » (Ordre et timeline inventés.) L'IA suit une logique qui RESSEMBLE à de la médecine, mais les étapes sont réarrangées ou le timing est décalé par rapport aux guidelines (SPILF, CAP guidelines).
8. Hallucinations de variantes génétiques (« BRCA_X »)
« La mutation BRCA_X2 cause un cancer du sein à 87 % avant 50 ans. » (Variante inventée.) L'IA génère des noms de gènes qui sonnent authentiques, avec des probabilités concrètes, mais le gène n'existe pas ou la pénétrance est fausse.
9. Hallucinations de chronologie historique ou épidémiologique
« Le VIH a émergé cliniquement en 1975 » (faux ; première reconnaissance médicale = 1981, cas antérieurs identifiés rétroactivement). Ou : « La grippe espagnole a tué 80 millions en 1918 » (le vrai chiffre est 50-100 millions selon les sources, mais l'IA générère une fausse précision). Ces hallucinations d'événements historiques s'infiltrent dans les dissertations sur l'histoire de la médecine.
10. Hallucinations d'interactions médicamenteuses
« L'itraconazole + lisinopril cause une hyperkaliémie sévère » (interaction faible ou inexistante). L'IA génère des interactions chimiquement plausibles (deux molécules qui POURRAIENT interagir) sans avoir vérifié la littérature clinique réelle (DrugBank, UpToDate, Thériaque).
Répartition des hallucinations par domaine médical
Toutes les spécialités ne sont pas égales face aux hallucinations IA. Voici une répartition observée dans les études et les tests que l'écosystème edtech français (prépa PASS/LAS, révision ECN) accumule depuis 2023 :
| Domaine / Spécialité | Taux d'erreurs IA estimé* | Risque pédagogique | Risque clinique |
|---|---|---|---|
| Biochimie / Physiologie | 42 % | Très élevé (confusion de mécanismes) | Moyen (erreur de compréhension) |
| Pharmacologie / Posologie | 38 % | Élevé | CRITIQUE (erreur dosage = mortal) |
| Génétique médicale | 45 % | Élevé (gènes inventés) | Moyen (conseil génétique incorrect) |
| Microbiologie / Antibiothérapie | 35 % | Élevé | Très élevé (résistance / souche incorrecte) |
| Cardiologie | 32 % | Moyen | Très élevé (arythmies, urgences) |
| Urgences / Anesthésie | 40 % | Moyen | CRITIQUE (délai critique) |
| Radiologie / Imagerie | 28 % | Moyen | Élevé (faux diagnostic) |
| Cancérologie | 36 % | Élevé | Très élevé (traitement incorrect) |
| Anatomie / Pathologie | 30 % | Moyen | Moyen |
* Basé sur évaluations qualitatives crowdsourcées et études 2023-2024 (Singhal et al., Nature Medicine ; données PASS/LAS). Les taux incluent hallucinations pures + imprécisions graves.
Ce tableau montre que tu dois être PARTICULIÈREMENT vigilant en pharmacologie, génétique et situations d'urgence. La préparation PASS/LAS d'Ask Amélie intègre des vérifications de sources pour chaque concept, précisément pour cette raison : réduire le bruit des hallucinations IA.
Remarque aussi que la radiologie et l'anatomie — domaines VISUELS — sont plus résistants aux hallucinations textuelles. L'IA hallucine sur du texte, pas sur les images (du moins pas au même taux). En contraste, la pharmacologie (100 % textuelle, avec chiffres précis) est un terrain de jeu parfait pour les hallucinations.
Stratégie pour détecter et éviter les hallucinations IA
Tu ne peux pas éliminer complètement le risque — mais tu peux le réduire drastiquement. Voici ta stratégie :
- Triangule toujours tes sources. Si ChatGPT te dit « métformine contre-indiquée si créatinine > 90 », vérifiez dans (1) le RCP officiel, (2) une source académique (UpToDate, BMJ Best Practice, Thériaque), (3) deux sources indépendantes minimum. Une seule source IA = risque de hallucination validée à tort.
- Teste activement ce que tu apprends. C'est le testing effect de Roediger : tu ne retiens vraiment que ce que tu TESTES. Si tu lis passivement une réponse IA, tu as 70 % de chances de la croire même si elle est fausse. Si tu dois expliquer le concept, puis répondre à une question dessus, tu repères les incohérences. En révision PASS/LAS ou ECN, c'est essentiel.
- Méfie-toi des chiffres anormalement précis. « 64 % », « 87 % », « 42 mmol/L » = red flag probable. Les vrais chiffres en médecine sont souvent des plages (« 30-50 % »), des ordres de grandeur (« environ 2-3 kg ») ou des seuils approximatifs (« > 150 »). Un chiffre trop précis, sans intervalle de confiance, est une hallucination probable.
- Vérifie les noms propres. Gènes, maladies, enzymes, équipes de chercheurs. Pas le temps de vérifier chaque nom ? Utilise PubMed (pubmed.ncbi.nlm.nih.gov) ou Google Scholar. Si l'article ou le gène n'existe pas, c'est une hallucination certaine.
- Utilise une IA moins « hallucination-prone » pour la médecine. Claude (Anthropic) et GPT-4 hallucinent moins que GPT-3.5. Mais aucune IA n'est fiable à 100 % en médecine. Traite TOUTE réponse IA comme une hypothèse à vérifier, pas comme un fait établi.
Ces cinq stratégies réduisent ton risque d'accepter une hallucination IA. Bonus : elles respectent aussi le bon processus d'apprentissage médical (Krashen, INPUT comprehensible + vérification active).
Ce qu'il faut retenir
Les hallucinations IA en médecine sont un risque réel, mesurable (30-45 % selon le domaine) et parfois mortel. Mais tu peux l'adresser en trois gestes : (1) triangule toujours tes sources, (2) teste activement ce que tu apprends (testing effect), (3) méfie-toi des chiffres trop précis et vérifie les noms propres. L'IA est un outil puissant pour comprendre la médecine — à condition de la traiter comme une hypothèse, pas comme une vérité. Ask Amélie intègre ces principes dans sa pédagogie pour que tu bénéficies de l'IA sans t'exposer à ses hallucinations.