I progressi degli LLM nella programmazione sono ancora impressionanti. GPT-5.3 Codex supera la precedente versione nel benchmark SWE-Bench Pro pur usando la metà dei token di output (ragionamento incluso) e costando quindi (circa) la metà.
I progressi degli LLM nella programmazione sono ancora impressionanti. GPT-5.3 Codex supera la precedente versione nel benchmark SWE-Bench Pro pur usando la metà dei token di output (ragionamento incluso) e costando quindi (circa) la metà.
Il mio messaggio medio a Codex (GPT-5.2 Codex medium):
Non capisco perché a molti piaccia più di Claude Code.
A volte Codex CLI è veramente stupido:
I need to inspect each file that imports '$lib/app/responses/domains-groups', but I failed due to quoting the route path incorrectly. I haven’t modified anything yet.
E si ferma.