Sono anni che ogni bacheca di un giornale online e ogni terza pagina cartacea contiene un articolo sull’intelligenza artificiale. Di tutti i pubblicisti lanciatisi sul tema, pochissimi sono ingegneri, programmatori o matematici. Nel campo dell’IA il giornalismo italiano, ad oggi, ha fallito, perché non ha informato. Paradossalmente il legislatore europeo e nazionale, accusato costantemente di lentezza o indecisione, ha già disegnato un quadro completo e si dimostra molto più avanzato dell’informazione pop.
Dissipatio ha intervistato Nicola Grandis, a.d. della startup di IA ASC27, per conoscere quel ristrettissimo mondo di tecnici, studiosi ed imprenditori che sta realmente facendo la storia. Abbiamo scoperto che l’Italia e l’Europa sono sì dei Davide in confronto ai Golia americani o cinesi, ma sono comunque presenti sul campo di battaglia. Puntano sull’agilità e l’utilizzo ottimale delle risorse per ritagliarsi un ruolo. Il mondo dell’implementazione quotidiana dei modelli non passa solo per le macchine apparentemente onniscienti di OpenAI o Meta, ma da strumenti chirurgicamente pensati per le imprese, la pubblica amministrazione, la cybersicurezza. È qui che ASC27 e l’Italia giocano la loro partita.
Nicola Grandis, laureatosi nel 2002 a Bologna, è il fondatore di ASC27. Appassionato di Asimov, dopo una lunga carriera nella cybersicurezza crea questa startup, oggi supportata daNvidia e Microsoft. ASC27 offre una ampia gamma di tool di IA pensati soprattutto per le imprese. L’ultima creazione dell’impresa è Vitruvian, un modello di reasoning attualmente in beta-testing. Ha fatto il giro del mondo per la sua eccezionale efficienza al netto di una dimensione molto ridotta.
-Cos’è ASC27 e come è nato?
Il core team che lavora oggi in ASC27 è nato circa nel 2002-2003. Ci siamo occupati per 18 anni di cybersicurezza a livello governativo e nel campo della difesa.
Poi nel 2016-2017 abbiamo visto l’IA, quella bella, che arrivava dagli Stati Uniti e giocava un ruolo nella cybersicurezza. E quindi nel 2020 abbiamo avviato il progetto ASC27, perché avevamo pensato che sarebbe stata la tecnologia che avrebbe cambiato il mondo.
ASC27 è un’azienda molto giovane, l’età media probabilmente sui 22-23 anni. È strettamente necessario: i temi di cui ci occupiamo sono estremamente innovativi. Spesso non sono neanche temi per cui si riesce a preparare un percorso universitario. Le persone che lavorano da noi hanno un loro interesse che coltivano sin da piccoli per questa materia, che è quella dell’intelligenza artificiale. Capitano così in azienda ragazzi giovanissimi.
-In tema cyber security, ci può offrire una finestra all’ecosistema della cybersicurezza?
Dopo la caduta del muro di Berlino una porzione della guerra fredda si è prolungata, semplicemente cambiando spazio. Non è più una guerra cinetica, non è più una guerra televisiva, ma è una guerra ibrida – secondo la definizione di Nikolay Makarov. Viviamo in un mondo in cui degli attacchi vengono organizzati e lanciati giorno per giorno in uno spazio cyber. Siccome il nostro mondo è completamente digitalizzato e informatizzato, la cybersicurezza diventa un elemento strutturale della nostra sicurezza infrastrutturale – dagli ospedali alla corrente elettrica e l’acqua, insomma tutto quello che ci consente di avere una civiltà.
Quindi la cybersicurezza è un tema sensibile che, interessando la collettività, viene gestito anche a livello governativo e istituzionale, nonché sovra istituzionale e sovra governativo(vedi le strutture dedicate della NATO). Noi facciamo parte di questo sistema, offrendo delle capacità che poche aziende possono offrire.
-Come mai le istituzioni pubbliche si fidano dei contactors privati, piuttosto che cercare di internalizzare tutto?
Le istituzioni pubbliche svolgono numerosissime attività in proprio e completamente autonome. Se si ricerca un livello di specializzazione elevatissimo, all’interno per esempio di quella complessa macchina logistica che è una forza armata, bisogna affidarsi a degli specialisti. Questi si trovano di frequente nel mondo della ricerca e dell’università, e talvolta possono essere anche aziende private. Le aziende chiaramente vengono preventivamente filtrate, analizzate, verificate.
-La guerriglia digitale quotidiana è fatta di azioni di scouting, spionaggio e messa alla prova dei dispositivi avversari o di vere e proprie operazioni con specifici scopi distruttivi?
Credo che esistano entrambe le dimensioni, e che anzi ce ne siano anche delle altre. Noi come azienda forniamo soltanto tecnologia, forniamo la macchina e gli strumenti della lotta, ma non i piloti o gli strateghi. Le operazioni di training, dove alleno una mia capacità e simulo gli attacchi altrui è fondamentale – non si può non essere informato su quale siano lecapacità di un possibile attore ostile. Detto ciò, se dicessi di più starei speculando.
-La diffusione del machine learning ha cambiato il mondo della cybersicurezza e dell’hacking? È semplicemente un cambio dei mezzi, delle armi in uso, o sono proprio cambiate le regole del gioco?
Nella sicurezza partecipano sempre due parti: è un gioco guardie e ladri, di attaccanti e difensori. Lo scopo dell’attaccante è modificare l’equilibrio di quello che si sta difendendo al fine di farlo scomporre e quindi riuscire nell’attacco, un po’ come nella la boxe. Chi deve attaccare utilizza tutti i mezzi a sua disposizione, quindi compresa l’intelligenza artificiale, il machine learning… domani si attaccherà con computer quantistici, nel futuro con quello che verrà ancora dopo. Questa è la storia.
-La guerra è sempre uguale a sé stessa, al netto dei strumenti, insomma.
Un attacco di cyber security si può portare persino con il fuoco, con una molotov lanciata su un quadro dove passa la connettività di una città – uno scenario simile al famoso chiodo che ha bloccato tutti i treni in Italia per mezza giornata.
-Descriva in dettaglio che cos’è Vitruvian…
Vitruvian è un progetto per realizzare qualcosa che prima non c’era. Nelle classifiche dell’intelligenza artificiale, l’Italia, semplicemente, non esisteva. Nel passato recente è iniziata a comparire l’Europa, o meglio la Francia. Dopo la Francia, dopo tanti paesi, anche qualche paese africano in queste classifiche, compariva l’Italia.
Noi italiani siamo stati importantissimi nello sviluppo dell’IA dagli anni Sessanta fino agli anni Novanta. Abbiamo avuto parecchi professori, parecchie intuizioni. Molta dell’intelligenza artificiale che vediamo oggi è stata sviluppata anche da italiani. Nel 1989 si tenne a Roma la International Joint Conference on Artificial Intelligence, che all’epoca era il gruppo di lavoro più importante del mondo sull’intelligenza artificiale.
In Italia abbiamo perso poi il primo treno per motivi strutturali. Quando in questi altri paesi si sono iniziati ad allenare modelli di dimensioni colossali, con milioni di GPU, in Italia non avevamo questa capacità di calcolo. Leonardo I del Cineca è forte ma deve gestire tutta l’attività di ricerca di tutte le università italiane. È uno strumento per la ricerca, non per le imprese.
Lo scopo di Vitruvian è iniziare ad alzare l’Italia sulla scala internazionale dell’IA. Non è un progetto di ricerca, quindi il nostro intento non è né la divulgazione né la pubblicazione di paper, né tantomeno spiegare come abbiamo fatto o cosa faremo. Siamo un’azienda privata, e abbiamo il dovere di proteggere la nostra proprietà intellettuale.
Vitruvian non è neanche la versione piccola dei modelli altrui, non è il Chat GPT italiano. Èun progetto per portare l’IA effettivamente dove serve, cioè nei processi business, di organizzazioni, imprese, pubbliche amministrazioni, però in una modalità e una scala praticabili. Oggi di generative IA nelle aziende quasi non ce n’è. Ecco, Vitruvian e vuole iniziare a posizionare l’Italia anche come un utilizzatore dell’IA.
-Vitruvian è in una buona posizione nelle classifiche internazionali per tre unità di misura: miliardi di parametri, punteggio Math 500, punteggio MMLU. Ci spieghi cosa rappresentano queste unità.
Il numero di hyperparameters definisce la grandezza di un modello, quindi si parla di miliardi di parametri. Vitruvian ne ha 14, gli altri modelli nella classifica ne hanno ben altri billions. Siamo molto piccoli e leggeri, ma i risultati sono ottimi.
Math 500 e MMLU sono due benchmark universalmente riconosciute con cui testare il modello. Il tema dei benchmark nell’intelligenza artificiale è un tema enorme; come misurare le prestazioni di un modello, per di più nelle sue mille sfaccettature? Math 500 e MMLU pongono al modello domande, matematiche e logiche, cui la macchina risponde e riceve una valutazione. Non tutte le IA però hanno bisogno di saper rispondere ad avanzate domande di fisica universitaria – magari eccellono in altre forme di ragionamento o campi. Inoltre i benchmark sono progettati in lingua inglese. Infine il terzo problema dei benchmark sono quei programmatori che cercano di ottimizzare le loro IA per i punteggi, quando in verità il software fa acqua da tutte le parti. Poiché però il testing delle IA è molto democratico, diffuso e scrupoloso, chi prova a ottimizzare a scapito della qualità viene perlopiù beccato. Il livello massimo di disonestà si raggiunge quando qualcuno programma contemporaneamentebenchmark che IA, e casualmente il proprio prodotto riceve ottimi punteggi… Quindi noi non ci abbiamo neanche pensato.
-Vitruvian è una macchina che fa reasoning, non è un chatbot. Che cos’è il reasoning? Ma poi, chiedendo due volte la stessa cosa, dà due risposte diverse? C’è randomness nel modello?
Il ragionamento di un modello IA non ha niente a che fare con il nostro, non è ragionamento, non è intuizione, non è una riflessione introspettiva. Il reasoning di Vitruvian funziona con il sillogismo della tradizione greca. Durante il training noi abbiamo mostrato al modello, attraverso il linguaggio, come noi ragioniamo: ipotesi, svolgimento dell’ipotesi, tesi.
Il modello di reasoning esegue un meccanismo su sé stesso, riflessivo, generando quella che si chiama code, una concatenazione logica, quindi qualcosa che somiglia al nostro ragionamento. Infine con la next token prediction si arriva ad una risposta per l’utente finale.
La randomness fa parte delle caratteristiche del modello, ed è una funzione della cosiddetta temperature. La temperatura corrisponde circa alla componente casuale nelle risposte, e quindi più un modello è freddo meno è creativo, e viceversa. Vitruvian sta modulando la sua temperatura grazie al beta testing; siamo comunque all’incirca a metà tra gelo e sauna.
-Vitruvian non è solo di manifattura italiana, ma è pensato per la lingua italiana. Nello sviluppo di una IA una lingua non vale l’altra? I chatbot avanzati sembrano saltare in scioltezza da una lingua all’altra.
La nostra public-beta ha visto il 65-70% di stimoli di ragionamento in italiano. Vitruvianprodurrà famiglie di modelli, e non un megamodello, quindi ci sarà un prodotto per ogni lingua e linguaggio professionale. Partendo noi dal mercato, da tester e da programmatori italiani, bisognava ottimizzare il modello per la lingua italiana.
-Com’è l’ecosistema scientifico italiano ed europeo in confronto a quelli americano e cinese?
La diversità è tale che non saprei neanche da dove iniziare. Le differenze quantitative in campo economico sono enormi, dalle risorse disponibili per costruire i calcolatori agli stipendi dei ricercatori. Negli Stati Uniti, in particolare, l’università in questo campo ha un marcatissimo taglio imprenditoriale. Questo è un grande vantaggio per la ricerca in un campo che ha bisogno di grandi risorse come l’IA. L’università pubblica italiana ha una natura propria e risorse limitate – i suoi vantaggi sono altrove. Detto ciò, la comunità scientifica dell’IA è molto aperta, molto internazionale, perciò non bisogna pensare che la minore mole della ricerca in Europa sia necessariamente un collo di bottiglia. Le informazioni filtrano, le persone girano.
Comunque c’è anche molta attività qui, basti pensare al progetto FAIR del MIUR o agli istituti Ginevrini e la Sorbona.
-ASC27 punta tanto sull’italianità. Cos’è per lei questo valore, e perché ne ha fatto un faro del suo lavoro?
Vedo come fonte di orgoglio l’appartenenza tanto all’Italia quanto all’Europa. Essere italiani significa una serie di cose. Significa sicuramente non avere alcuni vantaggi che potrebbero avere dei cittadini non europei, per esempio americani o anche asiatici, però significa anche avere alle spalle cinquemila anni di civiltà.
Noi in Europa ci siamo dati delle regole, negli Stati Uniti si può girare armati.L’autolimitazione è segno di civiltà. In Europa e in Italia ci siamo dati regole sulla General Data Protection, abbiamo l’EU IA Act e abbiamo deciso di non stravolgere la rete elettrica o costruire centrali nucleari per servire gli interessi tech. L’idea di sviluppare centrali a 5 gigawatts (le più grandi del mondo) che dovrebbero alimentare degli sconfinati data center in cui collocare modelli colossali che processino tutti i dati del mondo per noi non è sostenibile, non è ragionevole, non è a misura.
Per ASC27 sviluppare l’intelligenza artificiale italiana ed europea significa adattarla e portarla nel contesto legale e produttivo del Continente. Il nostro messaggio quando ci occupiamo di IA a scala italiana, a scala europea, è in realtà un messaggio molto positivo: noi non stiamo sviluppando il modello più grande del mondo, noi stiamo sviluppando il modello più efficiente e praticamente utilizzabile del mondo.
-A proposito di legislazione europea e italiana, quando si parla di tecnologia digitale il legislatore italiano ed europeo sa di cosa parla? Sono norme scritte da specialisti, o voi a posteriori le dovete riempire?
Regole e regolamenti in Europa e in Italia, per l’IA come per settori come la raccolta rifiuti o gli standard di produzione, devono includere componenti altamente tecniche. Il legislatorenon può essere un tecnico di intelligenza artificiale, né un tecnico di smaltimento radioattivo, né un tecnico di alcun genere. Quindi per come vediamo il mondo noi, il legislatore crea delle regole generali fatte di dati, principi, comportamenti codificati in leggi. Noi tecnici poi dobbiamo adeguarci, ma secondo me le norme non vanno viste come limiti. Il frameworklegislativo è ispirato dai suddetti 5.000 anni di civiltà, perciò è giusto sviluppare softwareentro questi principi.
Io non credo che il mondo high-tech debba potere modificare liberamente i principi della società. Sarebbe un paradosso, andremmo alla singolarità o in una direzione distopico-fantascientifica.
Noi come azienda facciamo il contrario: 1) guardiamo il framework sociale e legislativo 2) conosciamo per esempio cosa c’è mediamente in una sala server di un’azienda, sappiamo mediamente quali sono le capacità di calcolo di una pubblica amministrazione e quindi 3) decidiamo di sviluppare un modello come Vitruvian, che è fatto per quegli ambienti ed ècompliant con la legge.
-Quindi non avere accesso alla libertà legislativa e alla finanza americane non è solo un problema?
Costruire modelli immensi in sé non è difficile. Avere miliardi di parametri in più non implica una complessità così maggiore rispetto a un modello piccolo. La cosa complessa invece, secondo noi, è sviluppare qualcosa di molto efficiente. Vi spiego il perché.
L’allenamento di un modello intelligenza artificiale si divise in due fasi, una si chiama pre-training e una si chiama post-training. Nel pre-training si forniscono al modello grandi quantità di informazioni. Lui impara statisticamente come sono distribuite le parole, di conseguenza quando parlerà metterà sempre una parola sensata dopo l’altra. In pre più dati fornisci al modello più questo diventerà efficiente.
Ilya Sutskever, uno dei fondatori di OpenAI, il 24 novembre ha parlato del plateau degli LLM: durante una conferenza mondiale per l’intelligenza artificiale sostanzialmente ha detto che l’epopea del pre-training è finita, perché abbiamo processato tutto l’internet conosciuto, non possiamo più scalare aggiungendo dati. Jan Lipun, inventore delle reti neurali, ha proposto di creare un grande modello di pre-training unico, globale, in seno alle Nazioni Unite, al quale far accedere chiunque.
La partita ora si gioca nel post-training, una tecnica per cui si modifica il modello uscito dal pre-training, e sistemandolo diventa più efficiente. Questo secondo lavoro è quello che per esempio ha generato DeepSeek ed è quello che abbiamo fatto con Vitruvian.
-La totalità di internet è davvero un buon punto di partenza per il pre-training? Non ha dei forti bias, ad esempio a favore di talune idee o lingue?
L’internet è biased quanto noi. Lo facciamo noi, quindi noi abbiamo i nostri bias e semplicemente li riversiamo all’interno di quello che produciamo e quindi di conseguenza li iniettiamo, volenti o non volenti, all’interno dei modelli di intelligenza artificiale.
Nella fase di post-training, in realtà, questi bias in parte li puoi correggere. Noi, per esempio, adesso stiamo lavorando con un ragazzo bravissimo del CERN che si occupa di IA Ethics e sta testando Vitruvian per identificarne i suoi bias.
-Lei descrive la moderazione nel consumo di energia come una virtù. Non è una necessità data da una posizione di incapacità o mancanza di volontà in terra europea? Asimov o Kardashëv, leggendari scienziati e visionari sospesi tra realtà e fantascienza, identificarono nel secolo scorso un rapporto diretto tra la capacità di estrarre e utilizzare energia e il livello di civilizzazione di una società.
Ribadisco la virtuosità della moderazione. Le attuali scelte d’oltreoceano sono irrazionali e insostenibili. Credo che se l’Italia e l’Europa volessero alimentare i data center con centrali a fissione o a carbone lo potrebbero fare e lo farebbero. È stata una scelta, una saggia via intermedia tra sviluppo e altri valori. È frutto di una buona cultura del governo.
Tra l’altro, non sarei così sicuro del valore intrinseco dell’energia.
-Lei prospetta una Europa dei piccoli modelli che trova spazio nelle pieghe tra i giganti stranieri. Ma questi giganti sono forti come farebbero pensare le straordinarie quotazioni borsistiche, o hanno i piedi d’argilla?
Ricordiamo che ogni colosso è stato piccolo, e al suo interno una piccola squadra di persone straordinarie è responsabile per il funzionamento del tutto. Il mondo IA è fatto di team ridotti. Se vuoi fare qualcosa è lì che devi colpire nel segno, trovare un numero ridotto di matematici straordinari.
Tutta la mole finanziaria e aziendale di imprese come OpenAI serve soprattutto allo scaling. Se vuoi creare modelli di valore universale avrai bisogno di infrastrutture fisiche e quantitativi di energia da capogiro.
Poi, va detto che il mondo IA di alto livello conterà massimo poche migliaia di persone in tutto il mondo. Quindi, il mercato perlopiù scommette senza conoscere ciò su cui scommette, perché le informazioni non ci sono o sono scarsamente accessibili.
-Spesso e volentieri i popoli che inventano una tecnologia e la applicano con successo per primi rimangono poi indietro. Accadrà lo stesso con l’IA?
È possibile. C’è una grande differenza tra inventori ed ingegneri. Se i primi hanno valore da un punto di vista universale, i secondi determinano molto di più la velocità di implementazione tecnologica di una società.
-Il potere della tecnologia digitale è straordinario. Il programmatore governa segretamente il mondo?
Neanche per sogno, l’IA causerà l’estinzione di gran parte dei programmatori. Chi lavora con l’IA non è un programmatore, è un matematico specializzato. Semmai queste figure saranno sempre più richieste. L’epoca degli scribacchini è finita.