La Coupe du monde 2026 est le premier tournoi depuis l’adoption généralisée des chatbots d’intelligence artificielle générative (IA). Les fans et les chercheurs testent ces systèmes pour prédire le champion. Une frénésie comparable à celle de Paul le poulpe qui s’était emparée d’eux lors de la Coupe du monde 2010.
Le chatbot ChatGPT d’OpenAI a été lancé auprès du public le 30 novembre 2022. À l’époque, peu de personnes en dehors de la Silicon Valley s’intéressaient à l’IA générative et la Coupe du monde de football battait son plein au Qatar. Aujourd’hui, des banques aux universités, diverses institutions testent les capacités prédictives des systèmes d’IA générative pour les matchs de football.
Par exemple, les analystes de Bank of America, s’appuyant sur les prédictions de Microsoft Copilot, privilégiaient l’Espagne et la France. Tom’s Guide, un site d’actualités technologiques américain, utilisant les prédictions de Google Gemini, ChatGPT et Perplexity, indiquait quant à lui que l’Espagne avait les meilleures chances de victoire, suivie de la France.
Un autre site web américain d’analyse technologique, Decrypt, avait constaté que l’utilisation de chatbots développés en Occident, tels que ChatGPT et Claude d’Anthropic, donnait des résultats similaires. Cependant, l’utilisation de chatbots développés en Chine, DeepSeek et Qwen, avait prédit que l’Argentine remporterait le championnat.
Des chercheurs de l’Université Ludwig Maximilian de Munich (LMU) ont mené une analyse plus scientifique, en utilisant divers modèles d’IA pour prédire chaque match et en publiant toutes les données de précision sur un site web appelé « Large Language Model SoccerArena ».
En plus de tester les prédictions de l’IA en fonction de ses connaissances existantes, les chercheurs ont également testé sa capacité à intégrer dans ses prédictions des informations pertinentes trouvées en ligne, telles que les blessures des joueurs, les compositions des équipes et même les cotes des paris.
Stefan Feuerriegel, chercheur en gestion à l’Université de Munich, a expliqué dans un communiqué que la question de savoir si les modèles de langage peuvent fournir un soutien fiable est cruciale face à des situations de prise de décision réelles.
Il a ajouté : « C’est pourquoi les critères d’évaluation dont nous avons besoin ne se contentent pas de tester des tâches abstraites. Mais ils doivent également tester la façon dont les modèles d’IA réagissent aux informations dynamiques, à l’incertitude et aux situations où ils pourront être vérifiés (avec des résultats réels) à l’avenir ».