Note di Matteo


29 settembre 2025

Pochi anni fa un uomo che ha fatto la storia dei social e del web, Evan Williams, uno dei creatori di Twitter, ha fatto un intervento che ha colpito tanti. Ha detto: signori, Internet così come lo conosciamo e come ho contribuito a renderlo è guasto. Noi stiamo portando le persone non a capire, ma a reagire. Gli chiediamo continuamente un like, gli chiediamo continuamente o di urlare o di condividere senza passare dalla testa. Passa tutto da un dito, passa tutto da un click. E alla fine sai che c’è, c’è che con il web così come noi lo conosciamo probabilmente ben presto non ci importerà più niente di capire, ci basterà solo reagire.

Stefano Massini a Riserva Indiana del 22 settembre 2025.


28 settembre 2025

La storia si ripete:

Mr. Musk has reorganized xAI on the fly. He has led an aggressive recruiting drive for engineers. And he has pushed out a flurry of prominent researchers, even as others have left because they thought xAI had abandoned science in favor of attention-grabbing products, like a chatbot that sometimes produced offensive material and flirty A.I. chat companions, according to two people with knowledge of the company who spoke on the condition of anonymity.

(I capitoli precedenti sono la scissione di Anthropic per dissensi sulla scarsa attenzione alla ricerca sull'allineamento, e le grandi litigate tra OpenAI e Musk di nuovo sulla necessità di fare ricerca e in modo aperto: openai.com/elon-musk)

#12 /
14:59
/ #ai

Bloom filter in the wild!

I bloom filter, una struttura dati per determinare in modo efficiente ma probabilistico la presenza/assenza di un elemento in una collezione, sembravano inizialmente relegati ai corsi di algoritmi dell'università ma con la scala di Internet si sono iniziati a vedere in implementazioni reali.

Esempio recente, da How we made global routing faster with Bloom filters (Vercel):

When you make a request to a Vercel deployment, our routing service first checks whether the requested path exists before attempting to serve it. [...] We do this by generating a JSON file on build that contains a tree of every path in your project's build outputs, including static assets, pages, API routes, webpack chunks, and Next.js route segments.

In alcuni casi questo file JSON era diventato un collo di bottiglia, specialmente perché il servizio di routing è single-threaded (Node.js, presumo):

These sites can create 1.5+ megabyte lookup files that take dramatically longer to parse. At the 99th percentile, parsing this JSON file takes about 100 milliseconds; at the 99.9th percentile, it takes about 250 milliseconds.

Qui entrano in gioco i Bloom filter:

A Bloom filter is a probabilistic data structure that can be used to test whether an element, or key, is a member of a set. [...] Bloom filters can return false positives, but never false negatives. For path lookups, this property is valuable. If the Bloom filter says a path does not exist, we can safely return a 404; if it says a path might exist, we fall back to checking the build outputs.

Il risultato: miglioramento della velocità di lookup fino a 200 volte. I dettagli nell'articolo.

#11 /
14:35
/ #cdn

Meglio costruire in cinque anni con meno equity, piuttosto che impiegare vent’anni mantenendo il pieno controllo: “Il tempo risparmiato vale inestimabilmente di più”, dice Ogliengo. Per lui la motivazione principale non è economica, ma intrinseca: “Voglio sentirmi intelligente, vedere che ce l’ho fatta davanti a una sfida difficile”.

Marco Ogliengo, fondatore di Jet HR, nel podcast Actually.

#10 /
13:58
/ #business

TIL tutti questi software nell'ambito video/multimediale sono stati originariamente creati da sviluppatori francesi:

  • ffmpeg
  • VLC / VideoLAN
  • x264 (codec H.264)
  • DivX (codec)
  • HandBrake (GUI per transcoding)
  • Matroska/MKV (formato container)
  • GPAC/MP4Box (packager)
  • MediaInfo (debugging)
  • dav1d (codec AV1 di VideoLAN)
  • HLS.js
  • TSDuck

(fonte)

#9 /
13:44
/ #video


Scrive il WSJ che gli hard disk costituiscono l'80-90% dei sistemi di storage nei datacenter (la tecnologia SSD è troppo costosa), e con la necessità di raccogliere molti dati per il training di AI le aziende leader del settore (Seagate e Western Digital) sono in forte crescita.

E mi sorprende vedere che c'è ancora spazio per l'innovazione:

Both [companies] are moving toward a new hard-drive storage technology called heat-assisted magnetic recording, or HAMR. Seagate is rolling it out now, and Western Digital is set to do so in a couple of years.

HAMR opens the way to larger-capacity drives—30 terabytes and more. The companies have been working on the technology for many years, and there’s no easy path for competitors to challenge them.

#7 /
13:38
/ #datacenter#ai

Una intuizione preveggente e brillante oggi è più facile che venga sviluppata dentro Google, Meta o al New York Times piuttosto che in un garage o in un blog. E questo scenario sta entrando nelle consapevolezze delle generazioni più giovani, che a differenza di quelle che le hanno precedute non si trovano davanti mondi da inventare e opportunità inedite da sfruttare ma una situazione simile a quella di quarant'anni fa: in cui ambizioni e creatività possono svilupparsi quasi soltanto al servizio di progetti e strutture esistenti e forti. Sono progetti e strutture diversi, ma hanno ricostruito una condizione di forza che per un periodo era stata terremotata, e sulle cui macerie erano cresciute non solo imprese impensate, grandi e piccole, ma una sensazione di poter sperimentare, costruire, inventare, con grandi libertà e autonomie.

L'inclinazione a inventarsi cose proprie e inesistenti si è attenuata, per saturazione e perché molte acque si sono richiuse. Niente di drammatico: il mondo era così anche prima, e anzi, c'è da rallegrarsi di avere attraversato una ricreazione tanto straordinaria e fertile. E poi magari succederà di nuovo, di nuovo imprevisto.

Luca Sofri nella newsletter Charlie del 28 settembre 2025.


I was at a leadership group, people were telling me they think that with AI they can replace all of our junior people in our company. That's one of the dumbest things I've ever heard. [...]

How's that going to work when ten years in the future you have no one that has learned anything. My view is you absolutely want to keep hiring kids out of college and teaching them the right ways to go build software and decompose problems and think about it, just as much as you ever have.

Matt Garman, CEO AWS (via)

#5 /
09:58
/ #ai

27 settembre 2025

Vercel Domains. Un nuovo tool per la ricerca istantanea di domini (e acquisto al prezzo di costo).

#4 /
14:27
/ #domini

Vercel request collapsing

Vercel ha annunciato di aver implementato il request collapsing per impedire valanghe di richieste contemporanee in caso di cache miss.

Raramente si conoscono i dettagli implementativi di una CDN, quindi è interessante leggere l'approccio basato su lock distribuiti:

Request collapsing works through a two-level distributed locking system.

At the node level, each CDN node maintains an in-memory lock. When multiple requests for the same uncached path arrive at that node, the lock ensures that only one proceeds. Others wait until the cache fills. This prevents a single node from firing multiple function invocations for the same path.

At the regional level, every region enforces its own lock across all nodes. After acquiring the node lock, a request tries to get the regional lock. Only one request per region can hold both locks simultaneously, meaning only one function invocation per region can regenerate a page.

This design makes collapsing scalable. Without the node-level grouping, hundreds of concurrent requests could all compete for the regional lock simultaneously. This would create a thundering herd problem where the lock coordination itself becomes a bottleneck.

#3 /
14:17
/ #cdn

TIL il firewall di Cloudflare era inizialmente fatto con nginx + PHP (!):

[...] the first version of FL was implemented based on the NGINX webserver, with product logic implemented in PHP. After 3 years, the system became too complex to manage effectively, and too slow to respond, and an almost complete rewrite of the running system was performed.

E poi fino al 2024 nginx (openresty) con scripting Lua:

From this point on, FL was implemented using NGINX, the OpenResty framework, and LuaJIT. While this was great for a long time, over the last few years it started to show its age. We had to spend increasing amounts of time fixing or working around obscure bugs in LuaJIT. The highly dynamic and unstructured nature of our Lua code, which was a blessing when first trying to implement logic quickly, became a source of errors and delay when trying to integrate large amounts of complex product logic.

Da quest'anno è in rollout la nuova versione scritta in Rust.

#2 /
11:31
/ #cloudflare#cdn

26 settembre 2025

Habemus notedimatteo.it! Come dice /about:

[...] questo è il mio spazio personale dove condivido appunti, idee e segnalazioni sulle cose che mi capita di leggere o di vedere.

Non è una newsletter e nemmeno un blog tradizionale. È una specie di archivio, forse un diario, nello spirito del Web 1.0: non ci sono notifiche, non ci sono commenti, non ci sono reazioni, non ci sono pubblicità. Il design è brutto. Alcune note non hanno nemmeno un titolo. È tutto voluto.

E probabilmente sostituirà il mio canale Telegram @notedimatteo.

#1 /
17:03

← Precedente Pagina 11 di 11