Copilot fallisce i test del QI, ma conta davvero qualcosa?

Copilot fallisce i test del QI, ma conta davvero qualcosa?


Una scelta che potrebbe rivelarsi vincente nel lungo periodo, anche se i risultati dei test più recenti dipingono un quadro apparentemente preoccupante per le prestazioni di Copilot. Il sito TrackingAI ha sottoposto diversi modelli linguistici a una serie di sfide intellettuali, dai difficili test di ragionamento del Mensa Norway fino a valutazioni completamente offline progettate per impedire alle AI di cercare risposte su internet. Microsoft ha costruito Copilot sulla base di GPT-4o, un modello che privilegia la versatilità, la velocità e soprattutto la convenienza economica rispetto alle pure capacità di ragionamento.

Author: Marco Pedrani


Published at: 2025-07-15 08:15:18

Still want to read the full version? Full article