I progressi degli LLM nella programmazione sono ancora impressionanti. GPT-5.3 Codex supera la precedente versione nel benchmark SWE-Bench Pro pur usando la metà dei token di output (ragionamento incluso) e costando quindi (circa) la metà.