Tu connais cette sensation : tu lis un article en anglais, tu comprends chaque mot, et pourtant ton cerveau traduit en silence. Pendant deux ans, on a refusé de regarder ce phénomène en face. On a construit Ask Amélie comme la plupart des outils edtech : un moteur générique, des exercices adaptatifs, une IA polyglotte qui s'adressait à tous les apprenants de la même façon. Puis on a pivoté. Voici pourquoi, et surtout ce qu'on a appris en chemin.
Le constat qui a tout déclenché
En octobre 2025, on regarde nos métriques de rétention sur la cohorte anglais. Les chiffres sont décevants. Pas catastrophiques, mais tièdes : 34 % des apprenants francophones décrochent entre la semaine 3 et la semaine 6. On creuse les sessions enregistrées (avec consentement), on lit les feedbacks, on interroge une trentaine d'utilisateurs. Une phrase revient, formulée de mille manières : « L'application m'apprend l'anglais comme si j'étais un enfant qui n'avait jamais parlé aucune langue. »
Le problème, ce n'était pas la qualité du contenu. C'était la posture. Notre IA traitait un cadre francophone de 35 ans comme un nourrisson neuro-vierge. Elle ignorait que cet apprenant possède déjà une langue maternelle structurée, des intuitions grammaticales solides, des transferts utiles à activer et des interférences à désamorcer. On apprenait l'anglais à partir de zéro, alors que personne n'apprend jamais une L2 à partir de zéro.
Ce que la recherche nous criait depuis quarante ans
Le pivot a commencé par un retour aux sources. Stephen Krashen, dans son Input Hypothesis (1985), avait posé une intuition que la pratique edtech avait largement érodée : l'acquisition d'une L2 dépend de l'input compréhensible, c'est-à-dire d'un input calibré juste au-dessus du niveau actuel de l'apprenant — son fameux « i+1 ». Mais ce « i » n'est pas un niveau abstrait. Il dépend massivement de la L1.
Plus récemment, les travaux de Jarvis et Pavlenko (Crosslinguistic Influence in Language and Cognition, 2008) ont montré quelque chose de troublant : même chez des bilingues avancés, la L1 reste active dans les processus d'inférence sémantique. Tu ne quittes jamais vraiment ton français, même quand tu lis l'anglais à C1. Le cerveau bilingue n'est pas un commutateur, c'est un mélangeur.
Et puis il y a Henry Roediger et Jeffrey Karpicke, dont l'étude de 2006 publiée dans Psychological Science a établi un effet aujourd'hui connu sous le nom de testing effect : les apprenants qui révisent par récupération active obtiennent en moyenne 50 % de rétention à long terme, contre 27 % pour ceux qui relisent passivement. Couplé à l'espacement (Cepeda et al., 2008, qui ont synthétisé 317 études), tu obtiens un cadre d'apprentissage redoutable. Mais ce cadre, lui aussi, est plus efficace quand il est calibré sur ce que l'apprenant sait déjà.
Le malentendu fondateur de l'edtech générique
L'edtech moderne a importé de la Silicon Valley une idée séduisante : la scalabilité. Un produit, un million d'utilisateurs, une IA universelle. Le problème, c'est que la pédagogie ne scale pas comme un SaaS B2B. La cognition humaine est têtue : elle reste ancrée dans une langue maternelle, une culture scolaire, des automatismes de raisonnement.
« Apprendre une langue seconde, ce n'est pas remplir un seau vide. C'est tisser de nouveaux fils sur un métier déjà chargé. Ignorer la trame, c'est garantir que les fils glissent. »
Ce que veut dire « L1-aware »
Concrètement, une IA L1-aware ne se contente pas de connaître la langue cible. Elle modélise activement la langue source de l'apprenant et adapte trois couches :
- Les explications grammaticales : un francophone n'a pas besoin qu'on lui explique le concept de conjugaison ; il a besoin qu'on lui explique pourquoi l'anglais n'a presque pas de conjugaison, et où sont les pièges (le -s de la 3e personne du singulier, le present perfect qui n'a pas d'équivalent direct).
- Les calques et faux amis : actually, eventually, library, sensible. Ces mots déclenchent des erreurs prévisibles, prédictibles, et donc préventivement traitables.
- La prosodie et la phonétique : un francophone a une difficulté spécifique avec les voyelles tendues/lâches de l'anglais (le fameux ship/sheep) et avec l'accent tonique mobile. Un anglophone apprenant le français, lui, butera sur les voyelles nasales. Ce ne sont pas les mêmes obstacles, donc ce ne sont pas les mêmes exercices.
L'IA L1-aware, c'est l'IA qui sait que ton point de départ détermine la moitié de ton parcours. Elle ne fait pas semblant que tu débutes ; elle s'appuie sur ce que tu sais déjà pour t'amener là où tu veux aller, en moins de temps et avec moins de friction.
Ce qu'on a changé concrètement
Le pivot n'a pas été cosmétique. On a réécrit le pipeline pédagogique autour de trois principes opérationnels.
1. Profilage L1 dès l'onboarding
La toute première interaction avec Amélie identifie ta langue maternelle et ton parcours linguistique antérieur. Pas par un questionnaire de quinze pages, mais par une conversation de trois minutes où le modèle infère ton profil. Tu déclares « je suis cadre infirmier, je veux préparer un colloque international » : Amélie sait que tu es francophone, que ton vocabulaire médical est solide, et que ton blocage probable se situe sur la fluency orale et la prosodie.
2. Génération d'exercices contextualisée
Chaque exercice est généré en tenant compte de la paire L1-L2. Un exercice sur les phrasal verbs n'a pas la même utilité pour un francophone (qui les trouve illogiques) que pour un germanophone (qui les retrouve dans sa propre langue). On ne donne pas le même exercice, on ne donne pas la même explication, on ne donne pas le même nombre de répétitions.
3. Récupération espacée calibrée
Le moteur d'espacement intègre la difficulté relative à la L1. Le mot anglais actually est faussement facile pour un francophone (il croit le connaître), donc Amélie le ressort plus souvent au début, puis l'espace plus largement une fois la trace consolidée. C'est l'application directe du desirable difficulty de Robert Bjork (1994) : la difficulté optimale n'est pas absolue, elle est relative à ton point de départ cognitif.
Les résultats à six mois
On n'a pas encore publié d'étude pair-reviewée, et on s'y attelle. Mais les premiers signaux internes sont nets. Sur la cohorte anglais L1-aware versus la cohorte générique précédente :
- Le taux de complétion à 8 semaines passe de 41 % à 67 %.
- Le temps moyen pour atteindre une production écrite jugée B1 par un correcteur humain passe de 14 à 9 semaines.
- La satisfaction qualitative (mesurée par NPS) passe de 32 à 58.
Ce ne sont pas des miracles. C'est ce qui arrive quand tu arrêtes de traiter ton apprenant comme un humain abstrait et que tu commences à le traiter comme un francophone précis avec une histoire linguistique précise.
Ce que le pivot nous a appris sur l'edtech francophone
Ask Amélie ne fait pas que de l'anglais. On opère aussi sur la prépa PASS/LAS, l'ECN, l'intégration linguistique des nouveaux arrivants. Le principe L1-aware s'est révélé transposable bien au-delà des langues.
En PASS/LAS, on a constaté que les étudiants ne butent pas sur la biologie en tant que telle, mais sur le passage de leur lecture lycéenne (descriptive) à la lecture universitaire (problématisée). Leur « L1 cognitive », c'est la pensée scolaire de terminale. L'IA doit en tenir compte. Pour l'ECN, c'est la transition entre le raisonnement étudiant (par cours) et le raisonnement clinique (par tableau). Pour l'intégration, c'est la transition entre le français-langue-de-vie et le français-langue-administrative.
À chaque fois, le même principe : tu pars de quelque part, et ce quelque part doit être modélisé. Une IA pédagogique sérieuse n'est pas universelle. Elle est située.
Ce qu'on aurait fait différemment
Avec le recul, on aurait pivoté plus tôt. On a perdu six mois à essayer d'optimiser un produit générique, à ajouter des features, à patcher la rétention par des notifications et de la gamification. Aucune de ces optimisations n'aurait pu compenser le défaut structurel : on ignorait la langue maternelle de nos apprenants. C'est comme essayer de compenser un mauvais socle de fondation avec une déco soignée.
La leçon de fondateur, si tu construis dans l'edtech : avant d'optimiser quoi que ce soit, pose-toi la question de la posture. Comment ton produit considère-t-il celui qui apprend ? Comme un cerveau vierge ? Comme un humain situé ? La réponse change tout, depuis l'architecture du modèle jusqu'au copywriting de l'onboarding.
Ce qu'on construit maintenant
On élargit progressivement Ask Amélie à d'autres paires linguistiques (français-arabe, français-mandarin), tout en gardant le francophone comme noyau. On publie nos prompts pédagogiques en open access pour que d'autres acteurs francophones puissent s'en inspirer. On collabore avec deux laboratoires de psycholinguistique pour produire les premières études d'efficacité comparée.
L'objectif n'est pas de devenir le Duolingo français. L'objectif est de prouver, métriques à l'appui, qu'une IA pédagogique située bat une IA pédagogique universelle, à coût computationnel équivalent. Si tu veux suivre le travail, tester Amélie ou nous proposer un cas d'usage qu'on n'a pas encore couvert, écris-nous. Le projet avance par les retours de terrain plus que par les roadmaps internes — et pour cause, c'est ce que cette histoire de pivot raconte.