Accesso rapido:

Vai direttamente al contenuto (alt 1) Vai direttamente al primo livello di navigazione (alt 2)

Data journalism
A caccia di pattern nascosti

“Bounding boxes” proposti in chiave artistico-umoristica da Max Gruber.
Possiamo vedere così il giornalismo supportato dall’intelligenza artificiale? Sì e no: l’AI è in grado di riconoscere automaticamente oggetti e testi, ma non solo, e i giornalisti la sfruttano, ad esempio, per le ricerche investigative. Tipici del riconoscimento di oggetti sono i cosiddetti “bounding box”, proposti in foto in chiave artistico-umoristica da Max Gruber. | Immagine (screenshot): Max Gruber © Better Images of AI / Ceci n'est pas une banane / CC-BY 4.0

Nel giornalismo l’intelligenza artificiale svolge già oggi un ruolo importante: gli algoritmi sono in grado di estrapolare delle storie da grandi volumi di dati, generando automaticamente migliaia di testi. Presto l’AI potrebbe diventare un’infrastruttura critica della produzione mediale.

Di Rebecca Ciesielski

“Lavorerò instancabilmente per informarvi” è stata una delle prime frasi del notiziario presentato dalla Cina alla Conferenza mondiale su Internet ospitata nel 2018. Un “instancabilmente” da prendere proprio alla lettera, visto che l’annuncio non proveniva da una persona in carne ed ossa, ma era il risultato di un assemblaggio di video frame e file audio predisposto da un’intelligenza artificiale.

Sembra fantascienza, eppure è frutto di una sperimentazione che si sta portando avanti non solo in Cina, ma anche in Europa, dove media e aziende stanno lavorando alla messa a punto di cronisti automatizzati: insieme alla start-up londinese Synthesia, l’agenzia di stampa Reuters ha sviluppato il prototipo di un’intelligenza artificiale in grado di fornire sintesi di eventi sportivi, evitando così l’impiego di risorse umane per la stesura dei relativi testi e per la loro presentazione davanti alle telecamere.

Possiamo quindi immaginare che l’intelligenza artificiale vada prossimamente a sostituire la persona nel giornalismo? Non proprio: “La cosa migliore e al contempo peggiore che si possa immaginare è un sistema di AI che scriva articoli”, ha dichiarato Abishek Prasad del Media Group indiano HT in un panel intitolato The Future of AI in Journalism al Festival dell’AI nel giornalismo, presso la LSE, London School of Economics and Political Science all’inizio di dicembre 2021.

Una valutazione, la sua, condivisa da molti operatori del settore. Il lavoro dei professionisti dei media è vario e spesso richiede empatia, spontaneità e creatività, capacità che i sistemi di intelligenza artificiale non potranno possedere nel prossimo futuro, se non in forma molto limitata. È vero che l’AI sta prendendo sempre più piede nel giornalismo, ma non con l’obiettivo di sostituire i professionisti dei media, ma piuttosto di supportarli svolgendo compiti uniformi e ripetitivi per accelerando il lavoro di ricerca, produzione e distribuzione di contenuti mediali, lasciando alle redazioni tempo e spazio da riservare alla creatività. L’intelligenza artificiale ha anche il potenziale adatto a rivoluzionare il giornalismo a livello di dati.

L’importanza dell’AI nell’individuazione di connessioni rilevanti

Parlando di data journalism si pensa, a ragione, a tabelle da esaminare. Uno dei compiti per i quali occorre più tempo, in questo settore, consiste nello strutturare i dati in modo da trovare connessioni interessanti. È in questo workflow che si inserisce ottimamente l’AI, che è in grado di riconoscere pattern nei set di dati e a produrre testi direttamente da questi ultimi.

Grandi agenzie di stampa come Thomson Reuters, Bloomberg e AP affidano ad algoritmi l’incarico di scandagliare enormi set di dati alla ricerca di tutto ciò che può avere rilevanza, da cambiamenti significativi nelle quotazioni delle azioni ad altri movimenti nei mercati, ma persino commenti che spiccano nei social media. Bloomberg utilizza un intero mix di strumenti di AI per automatizzare la stesura di notizie su argomenti finanziari. I cosiddetti algoritmi di “NER” (named entity recognition, cioè riconoscimento di entità denominate) individuano persone, aziende e organizzazioni nei testi, mentre l’analisi automatica del “sentiment” indica quanto una notizia possa essere positiva o negativa per un’azienda.

Questi strumenti di intelligenza artificiale possono supportare il giornalismo nel tenere sotto controllo le notizie e individuare in anticipo gli eventi rilevanti.

AI e sorveglianza, pannelli solari e twitter

Il riconoscimento di pattern da parte dell’AI può anche sostenere il giornalismo investigativo nell’analisi di big data e dati complessi sulla base di tesi: Buzzfeed News ha usato l’intelligenza artificiale per scoprire le rotte di routine degli aerei dei servizi segreti statunitensi; La Nación Argentina ha sfruttato le immagini satellitari per contare i parchi fotovoltaici argentini; The Atlantic ha programmato un bot per Twitter che ha sfruttato machine learning ed elaborazione del linguaggio naturale per valutare quali tweet fossero stati scritti direttamente da Donald Trump e quali invece dal suo staff.

L’intelligenza artificiale è particolarmente utile nelle ricerche con grandi dataset di immagini: i reporter delle emittenti tedesche Bayerischer Rundfunk, Norddeutscher Rundfunk e Westdeutscher Rundfunk hanno usato l’AI di riconoscimento delle immagini per setacciare simboli di odio come rune delle SS e immagini di Hitler su Facebook. Analogamente, il team di ricerca di Panama Papers ha utilizzato l’OCR, il riconoscimento ottico dei caratteri, per convertire documenti e contratti scansionati in file di testo leggibili da macchine.

Migliaia di testi scritti da algoritmi su sport, borsa e criminalità

Gli algoritmi di AI non stanno cambiando solo la valutazione, ma anche la stesura di storie basate su dati. “Abbiamo creato l’unica agenzia di stampa automatizzata al mondo”, afferma la società britannica RADAR sul proprio sito web. Alla ricerca di notizie locali nel Regno Unito, infatti, ci si imbatte facilmente in articoli generati automaticamente dall’intelligenza artificiale di RADAR, che li fornisce quotidianamente a centinaia di siti web di notizie, giornali ed emittenti radiofoniche in tutto il Paese. Secondo le informazioni fornite dall’azienda stessa, sei dipendenti scrivono ogni settimana circa 3.000 articoli con il supporto dell’AI, il che significa ben 70 al giorno ciascuno.

Per arrivare a quest’enorme mole di testi, RADAR si basa su un data journalism che può essere applicato a livello regionale. In questo modo, poche storie diventano centinaia in un batter d’occhio.

“Human in the loop” per risparmiare tempo e risorse

L’approccio non è valido soltanto a livello di notiziari locali: il team AI + Automation Lab del Bayerischer Rundfunk, insieme alla redazione sportiva dell’emittente bavarese e alla Technische Universität di Monaco, ha sviluppato un sistema che genera cronache sportive per i gironi preliminari del basket. L’applicazione formula automaticamente dei testi a partire dai dati dei risultati, dai calendari delle partite, dalle classifiche e dalle statistiche sui tiri dei giocatori; il tutto può essere controllato e, se necessario, modificato prima della pubblicazione dai redattori sportivi, che in questo modo risparmiano tempo, garantendo comunque un check editoriale professionale.

Questo tipo di automatizzazione testuale non va a sostituire la persona, in quanto funziona solo in presenza di dati regolari, prevedibili e chiaramente strutturati, limitando pertanto la sua applicabilità a settori come l’economia, lo sport o la cronaca nera.

Quando i dati diventano un rischio

Gli algoritmi di AI supportano il giornalismo e creano possibilità altrimenti inesistenti. Si tratta tuttavia di sistemi non privi di rischi: l’intelligenza artificiale, infatti, fa ciò che fanno tutti gli algoritmi, ossia classifica, imposta sequenze e fornisce punteggi, ma i risultati che fornisce non sono sempre corretti. Nel caso delle ricerche, può non essere un problema, visto che l’AI si impiega soprattutto quando è tollerabile che qualche immagine, qualche tweet o qualche documento venga classificato in modo errato e l’errore possa essere individuato in fase di singolo controllo.

Il pericolo nasce piuttosto quando si analizzano dati relativi a persone. Il paywall del Wall Street Journal utilizza algoritmi di machine learning che registrano variabili come la frequenza delle visite, i dispositivi utilizzati e i contenuti consumati, li esaminano e calcolano probabilità di abbonamento da parte dei lettori. Questa probabilità influenza il numero di testi che ogni lettore può visualizzare gratuitamente. Benché il rischio di discriminazione, come in questo esempio, sia per lo più trascurabile, molti media guardano in modo particolarmente critico ai propri sistemi di AI. L’emittente Bayerischer Rundfunk ha definito delle linee guida etiche per la valutazione di ogni AI, utilizzando criteri come l’uso responsabile delle risorse, la parsimonia nella raccolta dei dati, la sicurezza nell’archiviazione e il controllo editoriale sui sistemi: “Anche nell’automated journalism e nel data journalism, la responsabilità ricade sui redattori, che sono tenuti alla verifica dei contenuti multimediali generati automaticamente e a un’analisi critica della plausibilità delle strutture e delle fonti dei dati.

Modelli di AI inquinanti per l’ambiente

Anche il gruppo olandese Schibsted ha sviluppato un framework per la valutazione dei rischi dei propri sistemi di intelligenza artificiale chiamato FAST, acronimo di Fairness, Accountability, Sustainability and Transparency, laddove per “sostenibilità” si intende tanto l’aspetto sociale quanto quello ecologico. I nuovi modelli di AI, pertanto, vengono analizzati anche in termini di bilancio di CO2, e a ragione, visto che per l’addestramento di alcuni modelli di intelligenza artificiale si consuma una quantità di energia equivalente a quella di diverse automobili durante il loro intero ciclo vitale.

Agnes Stenbom, data & AI specialist presso Schibsted, ha dichiarato al JournalismAI Festival nel dicembre 2021 che l’AI avrà “un impatto enorme sul giornalismo” e che “ne parleremo come di un’infrastruttura, più o meno come è accaduto con l’avvento dell’elettricità”, che inizialmente aveva generato timori diffusi. “Oggi invece entriamo in una stanza e premiamo un bottone aspettandoci che funzioni” ed è “probabile un’integrazione similare dell’AI nell’attività giornalistica quotidiana”.

Cresce l’importanza di team interni per l’AI

Vedremo presto da dove proverrà quest’infrastruttura. La start-up cinese Xinhua Zhiyun non si limita alla sperimentazione di notiziari generati dall’AI: secondo l’azienda, il suo repertorio comprende anche robot che filmano e montano brevi videoclip in modo completamente autonomo. Inoltre, un’altra sua AI, denominata Media Brain, durante la Coppa del Mondo 2018 ha prodotto oltre 37.000 clip di notizie, cliccate milioni di volte, a dimostrazione dell’importanza che anche i media europei costituiscano dei team interni e acquisiscano competenze in materia di AI, sia in termini di programmazione e software, sia a livello di valutazione giornalistica, etica e legale dell’AI.

Top