
Récemment, la plateforme de visioconférence Zoom a annoncé que son système d’intelligence artificielle a obtenu 48,1 % à l’Évaluation avancée du raisonnement (EAR). À première vue, ce score peut sembler peu élevé. Dans un contexte scolaire ou académique classique, il serait considéré comme insuffisant. Pourtant, l’intérêt de cette étape tient à ce que l’évaluation mesure réellement, et à la manière dont l’IA de Zoom y est parvenue.
L’EAR a été conçue pour évaluer le raisonnement plutôt que la mémorisation. De nombreuses évaluations d’IA mesurent avant tout la capacité à exploiter des régularités statistiques : lorsqu’un modèle a été exposé à un grand nombre d’exemples, il peut parfois produire une réponse correcte sans compréhension réelle. L’EAR retire ce filet de sécurité. Ses questions sont volontairement inédites et exigent un raisonnement en plusieurs étapes, de la résolution de problèmes et une justification argumentée. Le modèle doit interpréter un scénario, examiner différentes hypothèses explicatives et défendre une conclusion cohérente. Rappeler des informations ne suffit pas : c’est la structuration du raisonnement qui est évaluée.
Un autre point particulièrement intéressant réside dans l’approche technique adoptée par Zoom. Plutôt que de s’appuyer sur un modèle unique et massif, l’entreprise a fait collaborer plusieurs modèles plus compacts. Chacun explore le problème selon ses points forts, vérifie le raisonnement et contribue à la réponse finale. Zoom résume cette démarche ainsi : « Explorer, vérifier, fédérer ». Cette logique est proche de la pratique clinique : face à une situation complexe, nous échangeons avec d’autres professionnels, confrontons les indices, discutons des hypothèses, puis intégrons ces éclairages pour parvenir à une décision plus solide. Dans certains contextes, un ensemble de modules spécialisés peut produire un raisonnement plus robuste qu’un système unique surdimensionné.
Pourquoi les thérapeutes devraient-ils s’y intéresser ? Même si l’IA est encore loin d’un raisonnement comparable à celui d’un humain, cette étape laisse entrevoir des outils capables de soutenir le travail clinique de manière concrète. On peut imaginer une IA capable d’aider à analyser des notes de suivi et à repérer des évolutions dans le temps, de suggérer des idées d’activités thérapeutiques, de générer des supports visuels ou interactifs personnalisés, ou encore de produire des synthèses structurées utilisables en séance, y compris à distance. De tels systèmes pourraient réduire certaines tâches répétitives et permettre aux thérapeutes de consacrer davantage d’énergie à la relation thérapeutique, véritable moteur des progrès.
L’approche dite « fédérée » suggère également des solutions potentiellement plus efficaces et plus lisibles. Plutôt que des modèles gigantesques et opaques, on pourrait voir émerger des assemblages de modules capables d’expliquer plus clairement la manière dont une conclusion est construite. Pour les cliniciens, cela peut renforcer la confiance dans les propositions de l’outil et faciliter son intégration au sein d’équipes pluridisciplinaires.
L’EAR ne signifie pas que l’IA puisse remplacer les thérapeutes. Il s’agit d’un pas vers des systèmes centrés sur le raisonnement, conçus pour soutenir la pratique clinique. En mettant l’IA à l’épreuve dans des scénarios exigeants et inédits, cette évaluation montre que la technologie peut commencer à structurer un raisonnement, et pas seulement produire un texte fluide. Pour les thérapeutes, notamment en télésoin, cela ouvre la voie à des outils d’appui plus pertinents, à un engagement des patients plus personnalisé, et à des dispositifs qui aident à planifier, suivre et ajuster les interventions de façon plus efficiente.
Nous n’en sommes qu’au début, mais des jalons comme l’examen final de l’humanité nous donnent un aperçu d’un futur où l’IA peut véritablement renforcer notre pratique clinique. Elle ne remplacera pas notre jugement, mais peut devenir un partenaire puissant pour offrir une thérapie réfléchie, fondée sur les données et réellement engageante.
