Quand il s’agit de diagnostiquer les patients qui arrivent aux urgences, une étude datant de seulement quelques mois révélait que les médecins humains étaient meilleurs que le ChatGPT d’OpenAI.
Le modèle o1 d’OpenAI dépasse les médecins dans une étude Harvard
Mais la technologie va vite, et le tout premier modèle dit « de raisonnement » o1 d’OpenAI s’est récemment avéré supérieur aux professionnels de la santé. Des chercheurs de Harvard et du centre médical Beth Israel Deaconess de Boston ont mis cet état de fait en évidence à travers une étude opposant l’IA aux médecins.
Un taux de diagnostic supérieur : 67,1% pour l’IA contre 55,3% pour les médecins
Résultat, o1 a correctement diagnostiqué 67,1% des 76 cas d’urgences qui lui ont été soumis, alors que les deux médecins humains sont arrivés respectivement à 55,3% et 50%. En outre, d’autres médecins ont été incapables de distinguer les diagnostics effectués par l’IA de ceux de leurs collègues de chair et d’os.
La parole à Arjun Manrai, co‑auteur de l’étude et enseignant en informatique biomédicale à Harvard
« Je ne pense pas que nos résultats signifient que l’IA remplacera les médecins, a tenu à souligner Arjun Manrai, co‑auteur de l’étude et enseignant en informatique biomédicale à Harvard, malgré ce que certaines entreprises sont susceptibles d’affirmer. Il a toutefois décrit les résultats de l’équipe comme la preuve d’un « changement technologique vraiment profond qui va transformer la médecine ».