Note di Matteo


#ai

Non capivo molto il dibattito sul fatto che alcune persone chiamino ChatGPT così oppure semplicemente "chat". Finché non ho sentito usare la seconda versione da una persona più giovane di me qualche giorno fa ("chiedo a chat", e ci ho messo un attimo a capire).

#48 /
6 ottobre 2025
/
21:05
/ #ai#openai

Apps in ChatGPT

Mi sa che ormai si può dire definitivamente che OpenAI con ChatGPT ha vinto la gara consumer nel campo AI. È il brand più forte che c'è nel settore e ora ha introdotto per prima il concetto di "chat with apps", es. chiedi a ChatGPT di creare una playlist Spotify, Spotify viene contattata in modo trasparente per poi mostrare il risultato con una UI interattiva.

I tentativi precedenti erano incompleti o con target diverso (es. MCP), e alla fine è stata di nuovo OpenAI a inventarsi qualcosa di nuovo (i benchmark non premiano più OpenAI ma anche i modelli di reasoning sono invenzione di OpenAI).

Primo commento su YouTube:

this presentation made me understand the concept of an "everything app."

Eh, altro che X.

#47 /
6 ottobre 2025
/
20:36
/ #openai#ai

Despite widespread confusion, Andrej Karpathy coined "vibe coding" as a kind of AI-assisted coding where you "forget that the code even exists."

We already have a phrase for code that nobody understands: legacy code. Legacy code is universally despised, and for good reason. But why? You have the code, right? Can't you figure it out from there? Wrong.

Code that nobody understands is tech debt. It takes a lot of time to understand unfamiliar code enough to debug it, let alone introduce new features without also introducing bugs. [...] If you don't understand the code, your only recourse is to ask AI to fix it for you, which is like paying off credit card debt with another credit card.

Vibe code is legacy code

#45 /
5 ottobre 2025
/
22:36
/ #ai

AI security engineers

Gli LLM stanno lentamente rivoluzionando il settore dei sistemi di analisi statica del codice per rilevare vulnerabilità. Finora erano prevalentemente basati su regole ma gli LLM specialmente di reasoning sono molto superiori perché sono in grado di fare collegamenti del codice e valutazioni dettagliate.

Qua ce ne sono alcuni con relativa recensione.

My general summary is as follows:

  • Multiple AI-native SASTs are already on the market, ready to use today.
  • They work extremely well.
  • They find real vulnerabilities and logic bugs in minutes.
  • They can “think”/”reason” about business logic issues.
  • They can match developer intent with actual code.
  • They aren’t based on static rule-sets and queries.
  • They have low false positive rates.
  • They’re cheap (for now).
  • My results showed that (in order of success for finding vulnerabilities), ZeroPath, Corgea, and Almanax, are the top three products on the market right now. I did not test DryRun. However, all three products have different functions and can solve different problems, so I would recommend testing all of them if you can.
#37 /
3 ottobre 2025
/
13:54
/ #ai

Il peggiore nemico dei giornalisti io ritengo che siano i giornalisti stessi. Dobbiamo abbandonare una pigrizia, una stanchezza che ormai ci ha un po' preso tutti e tornare a fare il nostro lavoro. Il nostro lavoro è guardare direttamente e raccontare direttamente. L'intelligenza artificiale non lo può fare.

Alessandra Costante, segretaria generale Federazione Nazionale Stampa Italiana.

#35 /
2 ottobre 2025
/
21:25
/ #informazione#ai


Interessante mossa di Microsoft: per 19,99 $ al mese Copilot + Microsoft 365 Family:

Microsoft 365 Premium will be priced at $19.99 per month, the same price as OpenAI’s ChatGPT Plus subscription, and will include Microsoft’s highest usage limits in features like GPT-4o image generation and voice, as well as Copilot Podcasts, Deep Research, Vision, and Actions. It will also include all of the Microsoft 365 Family benefits, with access to Office desktop apps for six people, 1TB of storage per person, and more.

(The Verge)

#30 /
1 ottobre 2025
/
18:11
/ #ai#microsoft

Seahorse emoji

is there a sea horse emoji? e gli LLM vanno in crisi!

Anche GPT-5 e Claude Sonnet 4.5, incredibilmente. Sembra uno di quei "bug" di GPT-3/3.5 quando il modello finiva in loop e buttava fuori token a caso.

(ChatGPT)

#25 /
1 ottobre 2025
/
14:47
/ #ai

TikTok for deepfakes

OpenAI ha annunciato Sora 2, assieme a un'app stile TikTok dove si scorre tra video generati con AI (TikTok for deepfakes, dice The Verge, e già qui...), e sorprende il livello di distacco dalla realtà dei lavoratori di OpenAI sul tema.

Un ricercatore OpenAI che lavora su Sora ha pubblicato casualmente un video generato con AI, e quindi totalmente falso, di Sam Altman che viene arrestato dopo aver rubato una GPU. Dovrebbe passare per la testa un dubbio, no?

#24 /
1 ottobre 2025
/
14:37
/ #ai#openai

Claude Sonnet 4.5

È il turno di Anthropic: è uscito Claude Sonnet 4.5, l'ultima evoluzione degli LLM Anthropic, e come al solito è molto focalizzato sul coding. Anthropic stessa dichiara che Sonnet 4.5 is the best coding model in the world, probabilmente senza temere di essere smentita. Simon Willison è d'accordo, vedremo!

#18 /
29 settembre 2025
/
21:18
/ #ai#anthropic

La storia si ripete:

Mr. Musk has reorganized xAI on the fly. He has led an aggressive recruiting drive for engineers. And he has pushed out a flurry of prominent researchers, even as others have left because they thought xAI had abandoned science in favor of attention-grabbing products, like a chatbot that sometimes produced offensive material and flirty A.I. chat companions, according to two people with knowledge of the company who spoke on the condition of anonymity.

(I capitoli precedenti sono la scissione di Anthropic per dissensi sulla scarsa attenzione alla ricerca sull'allineamento, e le grandi litigate tra OpenAI e Musk di nuovo sulla necessità di fare ricerca e in modo aperto: openai.com/elon-musk)

#12 /
28 settembre 2025
/
14:59
/ #ai

Scrive il WSJ che gli hard disk costituiscono l'80-90% dei sistemi di storage nei datacenter (la tecnologia SSD è troppo costosa), e con la necessità di raccogliere molti dati per il training di AI le aziende leader del settore (Seagate e Western Digital) sono in forte crescita.

E mi sorprende vedere che c'è ancora spazio per l'innovazione:

Both [companies] are moving toward a new hard-drive storage technology called heat-assisted magnetic recording, or HAMR. Seagate is rolling it out now, and Western Digital is set to do so in a couple of years.

HAMR opens the way to larger-capacity drives—30 terabytes and more. The companies have been working on the technology for many years, and there’s no easy path for competitors to challenge them.

#7 /
28 settembre 2025
/
13:38
/ #datacenter#ai

I was at a leadership group, people were telling me they think that with AI they can replace all of our junior people in our company. That's one of the dumbest things I've ever heard. [...]

How's that going to work when ten years in the future you have no one that has learned anything. My view is you absolutely want to keep hiring kids out of college and teaching them the right ways to go build software and decompose problems and think about it, just as much as you ever have.

Matt Garman, CEO AWS (via)

#5 /
28 settembre 2025
/
09:58
/ #ai

← Precedente Pagina 6 di 6