Note di Matteo


Note

Come funziona la tecnologia della pubblicità online

Dalla newsletter Big Tech on Trial:

The underlying structure of targeted internet advertising is completely different from the old days.

Instead of individual websites selling ad space, they hire a service to manage their space for them. This is a “publisher ad server,” and it has a large inventory of websites looking to sell space, which is why we’ll call it the “sell side” for short. On the “buy side” is an “advertiser ad network,” which similarly has a large inventory of advertisers looking for space to post ads. (Judge Brinkema found Google not liable for illegally monopolizing the buy side.)

In between the publisher ad server (the sell side) and the advertiser ad network (the buy side) is an “advertising exchange” which matches up ads with spaces by holding a lightning speed auction. In the time it takes a website to load after you click on it (maybe half a second), an ad exchange auctions off the advertising space on that webpage to the highest bidder among all the advertisers in the ad network inventories.

The three parts together are known as the “ad tech stack.” Companies compete to provide these services on the sell side, ad exchange, and buy side, and these are the three markets Google dominates with DFP, AdX, and Google Ads, respectively. Here’s what that all looks like visually:

#29 /
1 ottobre 2025
/
15:45
/ #google#internet

In beta con 1Password i file .env con i secret letti automaticamente dal password manager:

1Password makes your environment variables available as a .env file without actually storing the plaintext contents on your device. Instead, the file contents are passed directly to the reader process on demand through a UNIX-named pipe. [...] When your application tries to read the file, you'll receive an authorization prompt asking for approval to populate the .env file. The file will lock again when 1Password locks.

Super cool!

#28 /
1 ottobre 2025
/
15:25

Fly.io ha annunciato che ridurrà significativamente il numero di region globali, passando da 35 a 18! In Sud America si passa da 4 region a solo una, in Europa spariscono Polonia, Spagna e Romania. In America del Nord ne spariscono ben 9!

#27 /
1 ottobre 2025
/
15:03
/ #cloud


Seahorse emoji

is there a sea horse emoji? e gli LLM vanno in crisi!

Anche GPT-5 e Claude Sonnet 4.5, incredibilmente. Sembra uno di quei "bug" di GPT-3/3.5 quando il modello finiva in loop e buttava fuori token a caso.

(ChatGPT)

#25 /
1 ottobre 2025
/
14:47
/ #ai

TikTok for deepfakes

OpenAI ha annunciato Sora 2, assieme a un'app stile TikTok dove si scorre tra video generati con AI (TikTok for deepfakes, dice The Verge, e già qui...), e sorprende il livello di distacco dalla realtà dei lavoratori di OpenAI sul tema.

Un ricercatore OpenAI che lavora su Sora ha pubblicato casualmente un video generato con AI, e quindi totalmente falso, di Sam Altman che viene arrestato dopo aver rubato una GPU. Dovrebbe passare per la testa un dubbio, no?

#24 /
1 ottobre 2025
/
14:37
/ #ai#openai

Rai News 24 ha nuova grafica da lunedì 29 ottobre:

Il rollout è stato un po' travagliato: è iniziato poco prima delle 01:00 ma ha richiesto mezza giornata per arrivare alla versione finale.

P.S. si inaugura l'upload di immagini nei post di questo sito con questa immagine.

#23 /
1 ottobre 2025
/
14:29
/ #broadcasting

Il comune di Trento ha iniziato a notificare le multe (della polizia locale, presumo) tramite il sistema SEND (Servizio Notifiche Digitali), che tenta una notifica in formato digitale, cioè con app IO oppure PEC, prima di ricorrere alla raccomandata.

Riporta il TGR che alcuni cittadini pensavano che la notifica via posta fosse una truffa, e riporta Il Dolomiti che girano truffe a nome di PagoPA.

La cosa assurda è che purtroppo il sistema di notifiche digitali SEND ha come dominio ufficiale notifichedigitali.it (indicato anche sulle comunicazioni cartacee) ed è così essenzialmente impossibile distinguere a colpo d'occhio se si tratta di un sito ufficiale. Non costerebbe nulla usare correttamente la TLD gov.it e poi comunicare ai destinatari che si possono fidare proprio perché il dominio termina con .gov.it.

[ qua avrei incollato un'immagine della comunicazione cartacea, ma non ho ancora implementato il sistema di upload su questo sito :) ]

EDIT eccola:

#19 /
29 settembre 2025
/
23:10
/ #digitalizzazione#italia#pagopa

Claude Sonnet 4.5

È il turno di Anthropic: è uscito Claude Sonnet 4.5, l'ultima evoluzione degli LLM Anthropic, e come al solito è molto focalizzato sul coding. Anthropic stessa dichiara che Sonnet 4.5 is the best coding model in the world, probabilmente senza temere di essere smentita. Simon Willison è d'accordo, vedremo!

#18 /
29 settembre 2025
/
21:18
/ #ai#anthropic

Bunny Hub

Uh, bunny.net lancerà una nuova status page e metterà a disposizione il prodotto costruito in-house a tutti per creare le proprie status page, con health check, iscrizioni, changelog, ecc.

#17 /
29 settembre 2025
/
18:36
/ #cloud

The Social Reckoning

Nel 2026 arriva il sequel di The Social Network!

Il film non riprenderà la narrazione del 2010, che raccontava in sostanza la fondazione di Facebook, ma si concentrerà invece sullo scandalo legato alle accuse di Haugen: dalla denuncia sugli effetti negativi di Instagram sulla salute mentale delle adolescenti alla gestione insufficiente della moderazione dei contenuti in lingue diverse dall’inglese, fino al ruolo della piattaforma nei conflitti internazionali.

Il primo film è stato di ispirazione per molti (me compreso), ma poi le cose sono andate in una direzione un po' più creepy del previsto.

#16 /
29 settembre 2025
/
11:15
/ #internet#social#meta

Con 2,4 milioni di firme la petizione dei cittadini del Regno Unito per bloccare la proposta di carta d'identità digitale mi sembra un grande esempio delle diverse sensibilità dei popoli nei confronti dei propri governi.

We think this would be a step towards mass surveillance and digital control, and that no one should be forced to register with a state-controlled ID system. We oppose the creation of any national ID system.

In Regno Unito non esistono le carte d'identità come le conosciamo noi, e quindi questo viene visto come un tentativo di schedare la popolazione. In Italia e presumo nella maggior parte dei paesi europei è invece la normalità che lo Stato conosca già i dati di tutti perché emette i documenti di identità.

Il rischio in Italia è stato preso in considerazione nel momento di introdurre l'identità digitale: anziché centralizzare il sistema, si è scelto il modello SPID dove esistono diversi identity provider tra cui poter scegliere liberamente. Il paradosso è che questo sistema decentralizzato ha mostrato i suoi limiti e ora molti chiedono a gran voce una migrazione (ormai molto probabile) verso CieID, cioè un sistema centralizzato a pieno controllo statale basato sulla carta d'identità elettronica.

Magari è solo questione di abitudini che si creano nel tempo. O magari siamo come popolo in realtà molto selettivi (o ipocriti) nello scegliere quando fidarci dello Stato.

#15 /
29 settembre 2025
/
09:12
/ #digitalizzazione

La dimensione di Google

Il monopolio di Google nei servizi web:

  • #1 and #2 most-visited websites: Google.com is the most popular website in the world, and YouTube is #2. Google.com gets 85 billion monthly visits – more than the next 9 most-visited websites, combined
  • Android: around 4.2 billion users (circa 75% of global smartphone market share)
  • Chrome: circa 3.45 billion users (around 65% of global browser market share)
  • Gmail: approximately 1.8 billion active users

Con questi risultati finanziari:

In absolute terms, Google is currently the most profitable company in the world; it generated $115 billion in profit (net income) over the past 12 months on $371 billion in revenue.

At its core, Google is still an advertising company; around 75% of revenue comes from selling ads on Google Search, YouTube, and the Google Ads network.

E questa quantità di staff tecnico:

Google employs around 60,000 software engineers [...] This makes Google one of the largest employers of software engineers. [...] Google runs more than 25 engineering offices.

(The Pragmatic Engineer)

#14 /
29 settembre 2025
/
08:54
/ #google#internet

La storia si ripete:

Mr. Musk has reorganized xAI on the fly. He has led an aggressive recruiting drive for engineers. And he has pushed out a flurry of prominent researchers, even as others have left because they thought xAI had abandoned science in favor of attention-grabbing products, like a chatbot that sometimes produced offensive material and flirty A.I. chat companions, according to two people with knowledge of the company who spoke on the condition of anonymity.

(I capitoli precedenti sono la scissione di Anthropic per dissensi sulla scarsa attenzione alla ricerca sull'allineamento, e le grandi litigate tra OpenAI e Musk di nuovo sulla necessità di fare ricerca e in modo aperto: openai.com/elon-musk)

#12 /
28 settembre 2025
/
14:59
/ #ai

Bloom filter in the wild!

I bloom filter, una struttura dati per determinare in modo efficiente ma probabilistico la presenza/assenza di un elemento in una collezione, sembravano inizialmente relegati ai corsi di algoritmi dell'università ma con la scala di Internet si sono iniziati a vedere in implementazioni reali.

Esempio recente, da How we made global routing faster with Bloom filters (Vercel):

When you make a request to a Vercel deployment, our routing service first checks whether the requested path exists before attempting to serve it. [...] We do this by generating a JSON file on build that contains a tree of every path in your project's build outputs, including static assets, pages, API routes, webpack chunks, and Next.js route segments.

In alcuni casi questo file JSON era diventato un collo di bottiglia, specialmente perché il servizio di routing è single-threaded (Node.js, presumo):

These sites can create 1.5+ megabyte lookup files that take dramatically longer to parse. At the 99th percentile, parsing this JSON file takes about 100 milliseconds; at the 99.9th percentile, it takes about 250 milliseconds.

Qui entrano in gioco i Bloom filter:

A Bloom filter is a probabilistic data structure that can be used to test whether an element, or key, is a member of a set. [...] Bloom filters can return false positives, but never false negatives. For path lookups, this property is valuable. If the Bloom filter says a path does not exist, we can safely return a 404; if it says a path might exist, we fall back to checking the build outputs.

Il risultato: miglioramento della velocità di lookup fino a 200 volte. I dettagli nell'articolo.

#11 /
28 settembre 2025
/
14:35
/ #cdn

Scrive il WSJ che gli hard disk costituiscono l'80-90% dei sistemi di storage nei datacenter (la tecnologia SSD è troppo costosa), e con la necessità di raccogliere molti dati per il training di AI le aziende leader del settore (Seagate e Western Digital) sono in forte crescita.

E mi sorprende vedere che c'è ancora spazio per l'innovazione:

Both [companies] are moving toward a new hard-drive storage technology called heat-assisted magnetic recording, or HAMR. Seagate is rolling it out now, and Western Digital is set to do so in a couple of years.

HAMR opens the way to larger-capacity drives—30 terabytes and more. The companies have been working on the technology for many years, and there’s no easy path for competitors to challenge them.

#7 /
28 settembre 2025
/
13:38
/ #datacenter#ai

Vercel request collapsing

Vercel ha annunciato di aver implementato il request collapsing per impedire valanghe di richieste contemporanee in caso di cache miss.

Raramente si conoscono i dettagli implementativi di una CDN, quindi è interessante leggere l'approccio basato su lock distribuiti:

Request collapsing works through a two-level distributed locking system.

At the node level, each CDN node maintains an in-memory lock. When multiple requests for the same uncached path arrive at that node, the lock ensures that only one proceeds. Others wait until the cache fills. This prevents a single node from firing multiple function invocations for the same path.

At the regional level, every region enforces its own lock across all nodes. After acquiring the node lock, a request tries to get the regional lock. Only one request per region can hold both locks simultaneously, meaning only one function invocation per region can regenerate a page.

This design makes collapsing scalable. Without the node-level grouping, hundreds of concurrent requests could all compete for the regional lock simultaneously. This would create a thundering herd problem where the lock coordination itself becomes a bottleneck.

#3 /
27 settembre 2025
/
14:17
/ #cdn

Habemus notedimatteo.it! Come dice /about:

[...] questo è il mio spazio personale dove condivido appunti, idee e segnalazioni sulle cose che mi capita di leggere o di vedere.

Non è una newsletter e nemmeno un blog tradizionale. È una specie di archivio, forse un diario, nello spirito del Web 1.0: non ci sono notifiche, non ci sono commenti, non ci sono reazioni, non ci sono pubblicità. Il design è brutto. Alcune note non hanno nemmeno un titolo. È tutto voluto.

E probabilmente sostituirà il mio canale Telegram @notedimatteo.

#1 /
26 settembre 2025
/
17:03

← Precedente Pagina 10 di 10