Note di Matteo


#informazione

Un mio commento sul Post in risposta all'articolo Per le intelligenze artificiali i PDF sono un problema, che si basa sul nulla:

L'articolo solleva il problema sbagliato. L'OCR serve solo se il contenuto è stato rasterizzato o è frutto di scansione, che non è la normalità (fuori dalla PA italiana almeno).

Il formato PDF resta però comunque problematico perché non contiene concetti come "paragrafo di testo", "pié di pagina" o "tabella" ed è quindi molto difficile associare le singole parole/righe di testo (solitamente leggibili senza OCR) al flusso della pagina. In casi complessi come pagine a più colonne servono una miriade di euristiche per provare a ricostruire il testo correttamente, perché non c'è legame tra gli elementi.

Non è un problema risolvibile al 100% ma è comunque in gran parte superato e negli ultimi 3 anni è spuntata diversa ricerca e molti nuovi strumenti anche open source per attaccare il problema.

Detto questo, del presunto "obiettivo di lungo termine" di sostituire il formato PDF sinceramente non trovo traccia e non ne ho mai sentito parlare pur avendo realizzato sistemi AI che ingeriscono PDF. A prova della tesi l'articolo menziona solo questa startup israeliana completamente sconosciuta nel settore, il cui sito sembra indicare che sia semplicemente una piattaforma cloud (a cui non ci si può nemmeno iscrivere), più che un formato di file. Di cosa stiamo parlando?

#374 /
10 marzo 2026
/
23:13
/ #ai#informazione

Quotidiani ed editori/2

Sempre avendo presente la precarietà di alcuni degli scenari che abbiamo descritto, vediamo anche come sarebbero raffigurabili le proprietà delle maggioranze dei primi dieci quotidiani italiani per diffusione se venissero confermate le ipotesi attuali.

Corriere della Sera - Urbano Cairo, con posizioni filogovernative per ragioni di opportunità economica

Repubblica - società greca Antenna, in buone relazioni con Donald Trump e con Mohammed bin Salman

Stampa - SAE, in amichevoli e fruttuose relazioni con gli establishment editoriali e politici di centrodestra

Sole 24 Ore - Confindustria

Resto del Carlino - Leonardo Del Vecchio, socio del Giornale del deputato leghista Antonio Angelucci

Messaggero - Franco Caltagirone, costruttore e banchiere di grandi poteri e accorte relazioni col centrodestra

Gazzettino - Franco Caltagirone, costruttore e banchiere di grandi poteri e accorte relazioni col centrodestra

Nazione - Leonardo Del Vecchio, socio del Giornale del deputato leghista Antonio Angelucci

Dolomiten - Famiglia Ebner, protagonista dello storico partito di potere altoatesino, SVP

Giornale - Antonio Angelucci, deputato della Lega, e Leonardo Del Vecchio

Luca Sofri nella newsletter Charlie del 25 gennaio 2026.

#325 /
1 febbraio 2026
/
17:46
/ #informazione

Quotidiani ed editori/1

Gli scenari - ancora suscettibili di sovversioni - che si mostrano in questo momento sono di un'ulteriore estensione del già diffuso modello italiano che vede come editori dei maggiori quotidiani imprenditori di fortune economiche legate ad altri settori e privi di competenze e attenzioni sia sulla natura dei giornali e del giornalismo, che del loro ruolo di servizio pubblico, che delle trasformazioni delle loro funzioni e dei loro business, che delle prospettive dell'innovazione nell'ambito delle aziende giornalistiche e della loro sostenibilità economica. Per farsi un'idea: nessuno dei nuovi editori di quotidiani dell'ultimo decennio ha portato nel panorama giornalistico italiano una sola novità rilevante, promettente, di qualche visione intorno ai cambiamenti di questi decenni. L'espressione ormai antica "digital first" nel 2026 non è stata concretizzata da nessuna delle grandi testate tradizionali.

Per farsi un'altra idea: nessun editore italiano ha spostato le priorità di ricavo dalla pubblicità verso gli abbonamenti, direzione in cui si sono mossi o si stanno muovendo quasi tutti i maggiori progetti internazionali. Nei migliori dei casi – rari – si sono protette le fragili e novecentesche economie di progetti giornalistici straordinariamente tradizionali e conservatori. Che può non essere necessariamente un approccio del tutto fallimentare, in un paese anagraficamente anziano e culturalmente resistente all'innovazione sia nel suo pubblico che nel suo mercato, ma di sicuro non contribuisce ad attenuare questa resistenza o a creare modelli economicamente o giornalisticamente moderni, capaci di invertire i presenti declini.

Luca Sofri nella newsletter Charlie del 25 gennaio 2026.

#324 /
1 febbraio 2026
/
17:45
/ #informazione

I fatti non sono mai separati dalle opinioni, sui giornali. Nel momento stesso in cui qualunque giornale decide di pubblicare un articolo su un fatto, su una notizia, su una storia, sta applicando una propria opinione. Altri giornali non lo pubblicheranno, avendo opinioni diverse. Le opinioni di ogni giornale e di ogni giornalista con delle responsabilità influenzano la decisione di che articoli pubblicare, e poi di quale evidenza dare loro, e poi di quali elementi e tagli mettere nel titolo: e sono tutte scelte, mai universali, mai le sole possibili, anzi. E le opinioni di ogni giornalista incaricato di scrivere influenzano i fatti che ci mette dentro e quelli che no, e lo spazio che dà a ciascun fatto, e di quali parla prima e di quali parla dopo.

Il risultato è che di un fatto - un fatto - verranno a sapere i lettori di un giornale, e non quelli di un altro. O che i lettori di uno lo riceveranno come molto importante e quelli di un altro come poco importante. O che i lettori di uno leggeranno che la cosa più importante di quel fatto è una e quelli dell'altro che è un'altra. Anche se stiamo sempre parlando di fatti: ma la cui descrizione, a cominciare dalla decisione di descriverli o no, è il risultato di un'opinione.

Nessun giornale ha i fatti separati dalle opinioni.

Luca Sofri nella newsletter Charlie.

#304 /
23 gennaio 2026
/
11:52
/ #informazione

Il terrore delle ripetizioni che ci viene instillato a scuola genera nel giornalismo scelte acrobatiche e artificiose per sostituire parole e nomi con presunti sinonimi o creative perifrasi. Nel giornalismo sportivo questo ha prodotto un ricco vocabolario di termini di poco uso, ma con radici storiche o geografiche, per indicare le città sedi di squadre di calcio o altro. Il risultato è posticcio, ma permette di imparare termini che hanno ricchissime implicazioni storiche. Sapete dire a quali città si riferiscono gli aggettivi scaligera, labronica, felsinea, partenopea, sabauda, orobica, capitolina, estense, gigliata, ambrosiana, etnea, alabardata, lariana?

Luca Sofri in Parole che usiamo in un modo o nell’altro sul Post.

#295 /
20 gennaio 2026
/
22:25
/ #informazione#scrivere

Se tutte le persone fossero in possesso di ogni informazione possibile in ogni momento, se fossimo onniscienti, tra i due concetti non esisterebbe alcuna differenza: cambiare la realtà sarebbe cambiare la percezione della realtà. Siccome siamo più vicini alla condizione opposta – in ogni momento su ogni cosa nessuno sa niente – la percezione conta parecchio. Salvo che nei casi di successi o fallimenti clamorosi, in politica può contare persino più della realtà: perché ognuno di noi della realtà vede solo un pezzo minuscolo, mentre tutto il resto gli viene raccontato da qualcuno (social, giornali, amici, etc).

Francesco Costa

#250 /
21 dicembre 2025
/
11:09
/ #informazione#mondo

La risposta di Guido Scorza sulla "inchiesta" di Report sul Garante privacy. Come è abitudine di Report, una ricostruzione selettiva con diverse inesattezze, omissioni e ignoranze per far sembrare scandalo cose che non lo sono.

#140 /
11 novembre 2025
/
14:29
/ #informazione#privacy

AI e giornali

Una nuova ricerca del Reuters Institute ha raccolto le esperienze e le opinioni di circa 12mila persone in sei paesi del mondo a proposito dell'uso dei software di "intelligenza artificiale". Ne sono uscite molte considerazioni ma quelle più rilevanti per il dannato futuro dei giornali sono due.

Una è che continua ad aumentare l'uso di simili servizi per la ricerca di informazioni di vario genere, e questo va a scapito dei siti di news, tradizionali fornitori di molte di queste informazioni. Ormai le prove di questa tendenza sono tante. Solo un terzo degli interpellati dice di cliccare con frequenza sui link dopo aver letto le sintesi offerte in testa alle pagine dei risultati di Google: un terzo dice di non farlo mai.

La seconda questione su cui riflettere è più complessa: a quanto pare sempre più persone usano abitualmente e serenamente i vari software di intelligenza artificiale per le proprie necessità, accettando il margine di insicurezza dei risultati in termini di qualità e accuratezza. Ma se si chiede alle stesse persone un giudizio sull'uso degli stessi software da parte dei giornali, una gran parte se ne dice critica e diffidente.

Le letture di questa contraddizione possono essere due. Una è che ci sia una specie di ipocrisia che ci rende severi contro l'uso delle AI da parte di altri, ma indulgenti le usiamo noi. O una specie di supponenza che ci fa pensare di saper essere più prudenti o esperti degli altri: non da escludere, è una tendenza assai comune. [...] Dovremmo abituarci a valutare i risultati di un lavoro giornalistico (è accurato o no? è completo o no? svolge adeguatamente la sua funzione di informazione?) piuttosto che l'insignificante percorso della sua costruzione (ci sono testi prodotti dalle "AI" che hanno maggiore accuratezza di certi testi prodotti dagli umani, per dire).

La seconda - più apprezzabile - lettura della contraddizione è che le nostre aspettative nei confronti del lavoro giornalistico siano maggiori di quelle che abbiamo per noi stessi. E che laddove consentiamo alle nostre ricerche di informazioni un margine di mediocrità e approssimazione - non dando a quelle ricerche ruoli rilevanti: non scegliendo delle cure mediche, per esempio -, diamo una maggiore credibilità al lavoro giornalistico e lo assumiamo per farci un'idea più radicata e affidabile del mondo. È una pretesa lusinghiera per i giornali, ma che deve imparare a fare i conti col costo di quella differenza: e capire che un lavoro giornalistico, se lo si vuole migliore di quello che fa ChatGPT, ha dei costi a cui serve contribuire. Nessuno è obbligato, basta che poi non si pretenda che giornali in crisi di risorse economiche non ricorrano sciattamente alle "AI".

Luca Sofri nella newsletter Charlie del 12 ottobre 2025.

#63 /
12 ottobre 2025
/
13:44
/ #ai#informazione

Il peggiore nemico dei giornalisti io ritengo che siano i giornalisti stessi. Dobbiamo abbandonare una pigrizia, una stanchezza che ormai ci ha un po' preso tutti e tornare a fare il nostro lavoro. Il nostro lavoro è guardare direttamente e raccontare direttamente. L'intelligenza artificiale non lo può fare.

Alessandra Costante, segretaria generale Federazione Nazionale Stampa Italiana.

#35 /
2 ottobre 2025
/
21:25
/ #informazione#ai

Le regole di scrittura di George Orwell (dal Post):

  1. Mai usare una metafora, una similitudine o un’altra figura retorica che siete soliti leggere sui giornali.
  2. Mai usare una parola lunga quando una breve funziona lo stesso.
  3. Se si può togliere una parola, toglietela sempre.
  4. Mai usare il passivo quando potete usare l’attivo.
  5. Mai usare una frase straniera, un termine scientifico, una parola di qualsiasi gergo se sapete pensare all’equivalente in inglese comune.
  6. Piuttosto che scrivere una cosa orrenda ignorate le regole precedenti.
#34 /
2 ottobre 2025
/
21:20
/ #scrivere#informazione

Una intuizione preveggente e brillante oggi è più facile che venga sviluppata dentro Google, Meta o al New York Times piuttosto che in un garage o in un blog. E questo scenario sta entrando nelle consapevolezze delle generazioni più giovani, che a differenza di quelle che le hanno precedute non si trovano davanti mondi da inventare e opportunità inedite da sfruttare ma una situazione simile a quella di quarant'anni fa: in cui ambizioni e creatività possono svilupparsi quasi soltanto al servizio di progetti e strutture esistenti e forti. Sono progetti e strutture diversi, ma hanno ricostruito una condizione di forza che per un periodo era stata terremotata, e sulle cui macerie erano cresciute non solo imprese impensate, grandi e piccole, ma una sensazione di poter sperimentare, costruire, inventare, con grandi libertà e autonomie.

L'inclinazione a inventarsi cose proprie e inesistenti si è attenuata, per saturazione e perché molte acque si sono richiuse. Niente di drammatico: il mondo era così anche prima, e anzi, c'è da rallegrarsi di avere attraversato una ricreazione tanto straordinaria e fertile. E poi magari succederà di nuovo, di nuovo imprevisto.

Luca Sofri nella newsletter Charlie del 28 settembre 2025.

#6 /
28 settembre 2025
/
13:30
/ #internet#business#informazione