Lors des tests effectués sur le benchmark ARC-AGI, un outil conçu pour évaluer la capacité des modèles à se rapprocher de l’intelligence artificielle générale (AGI), le HRM a démontré des performances exceptionnelles. Il a obtenu un score de 40,3 % au test ARC-AGI-1, surpassant plusieurs modèles concurrents, tels que l’o3-mini-high d’OpenAI, qui a obtenu un score de 34,5 %, le DeepSeek R1, qui a obtenu un score de 15,8 %, et le Claude 3.7 d’Anthropic, qui a obtenu un score de 21,2 %. En d’autres termes, non seulement le HRM rivalise avec des modèles géants, mais il les surpasse dans des épreuves qui mettent réellement à l’épreuve leur intelligence de raisonnement.
Author: contact@dailygeekshow.com (DGS)
Published at: 2025-09-06 09:00:00
Still want to read the full version? Full article