Questo articolo è disponibile anche in inglese / This article is also available in English

C’era una volta, non molti anni fa, il laboratorio di ricerca chimica. Niente di particolarmente romanzesco o mefistofelico, più che altro schermi di computer e innumerevoli simulazioni. Un ricercatore poteva passare anche tutta la sua vita professionale, dalla tesi di dottorato fino alla pensione, sulla struttura di una singola molecola: ogni giorno, per anni, si sedeva di fronte a un modello virtuale, cambiando un idrogeno qui o un doppio legame là, e facendo test per individuare la variante più efficace, la più sicura, la più semplice da sintetizzare.

Che si trattasse di un farmaco salvavita, di una nuova plastica o di un fertilizzante, ci volevano anni, o addirittura decenni, per arrivare a un prodotto certificato e commercializzabile. Un lavoro faticoso, alienante, e anche parecchio costoso, visto che la ricerca di un unico composto poteva richiedere investimenti di milioni o addirittura miliardi di dollari (per ogni nuovo farmaco, ad esempio, la spesa in R&D è stimata fra i 314 milioni e i 4,46 miliardi di dollari, come riporta lo studio pubblicato da JAMA Network nel giugno 2024).

Negli ultimi due decenni è però cominciata una rivoluzione che progredisce ormai a ritmi esponenziali: l’intelligenza artificiale. Sistemi di machine learning e AI generativa sono oggi utilizzati un po’ in tutti i rami della ricerca scientifica, ma nessuno ne sta beneficiando a livelli così dirompenti come l’industria chimica e farmaceutica. Dalla scoperta e creazione di nuove molecole alla ricerca di materiali inediti, dalla previsione del rischio chimico alla bonifica in caso di contaminazioni, fino alle analisi di mercato e all’ottimizzazione della supply chain: l’intelligenza artificiale accelera processi e sperimentazioni, riduce gli sprechi, migliora la qualità degli output, aiuta la sostenibilità e promuove persino l’etica, visto che in alcuni casi potrebbe ridurre drasticamente il ricorso ai test sugli animali. E, infine, ha quel potere che da solo riesce a cambiare le regole del gioco: può ridurre i costi.

Se l’AI impara la grammatica delle molecole

Aromi alimentari o fragranze per cosmetici, farmaci o detersivi, fertilizzanti o vernici, leghe metalliche o nuovi materiali ad alte prestazioni. Le applicazioni dell’industria chimica sono innumerevoli, ma alla base di ogni filiera, all’origine di ciascun processo industriale, c’è sempre un primo e più importante passo: la ricerca della molecola adatta. Un inizio che, in verità, può richiedere anni di studi e sperimentazioni, visto che “le combinazioni possibili sono pressoché infinite”, ha spiegato in un webinar Julien Herzen, Lead Data Scientist di Unit8, società svizzera che offre consulenze su data science e AI.

Per fare un esempio, solo nel campo della chimica farmaceutica si stima che possano essere creati 1060 composti con caratteristiche simili a farmaci, più di quanti sono gli atomi del sistema solare. “E di tutte queste molecole – continua Herzen – solo 1010 (10 miliardi) sono note, commercialmente o virtualmente, agli scienziati.”

Per trovare la molecola giusta in questo gigantesco pagliaio l’industria chimica si sta dunque affidando sempre più a sistemi di machine learning e deep learning. Come spiegavamo in MR48, si tratta di reti neurali artificiali che sono in grado di scandagliare in tempi molto rapidi enormi quantità di dati, combinandoli fino a ottenere le caratteristiche richieste. Un “progettista di molecole”, spiega Herzen, inserirà allora le proprietà desiderate (ad esempio solubilità o edibilità) in un sistema di machine learning e questo poi procederà in modo incrementale generando varie combinazioni di elementi, con tentativi via via più vicini al risultato ricercato.

Anche con l’aiuto dell’AI, il processo rimane tuttavia lungo e laborioso. Il problema è che, per addestrare efficacemente un modello di apprendimento automatico, occorre prima dargli in pasto dei dataset composti da milioni di strutture molecolari, che a loro volta devono essere classificate ed etichettate da ricercatori in carne e ossa. E siccome dataset così vasti sono piuttosto rari, i risultati generati dai sistemi di molecular design portano spesso a tentativi falliti, a molecole che non si riescono a sintetizzare o che non sono efficaci.

Su questo collo di bottiglia del processo sta quindi lavorando il MIT-IBM Watson AI Lab, che ha di recente sviluppato un nuovo modello in grado di generare molecole e prevederne contemporaneamente le proprietà in modo molto più efficace dai sistemi di deep learning usati finora. Lo studio del MIT non è un semplice miglioramento, ma un vero salto di livello, e per capirne la portata basti dire che al nuovo framework è sufficiente un dataset di meno di un centinaio di esempi di strutture molecolari per generare risultati affidabili.

Grazie a un approccio di reinforcement learning (il sistema è “premiato” quando raggiunge l’obiettivo), i ricercatori sono infatti riusciti a insegnare all’AI la “grammatica” molecolare. E una volta assimilate le regole fondamentali che ne governano la struttura e il comportamento, il modello procede autonomamente a migliorare la sua capacità di parlare il linguaggio delle molecole. “Questa rappresentazione basata sulla grammatica è molto potente”, ha spiegato in un comunicato Minghao Guo, dottorando del MIT e primo autore dello studio. “E siccome è anche un modello molto generale, può essere applicato a vari tipi di dati. Pertanto stiamo cercando di identificare altre possibili applicazioni oltre alla chimica e alla scienza dei materiali.”

Alla ricerca dei materiali del futuro

Oltre al ramo farmaceutico, c’è un altro vasto comparto dell’industria chimica che si è lanciato con grande entusiasmo sulle applicazioni dell’intelligenza artificiale: quello della ricerca di nuovi materiali. È di giugno 2024, ad esempio, l’annuncio della società britannica Materials Nexus, che ha lanciato sul mercato il primo magnete (da utilizzare per veicoli elettrici, turbine eoliche, ecc.) realizzato senza terre rare. Il materiale è stato individuato, per l’appunto, grazie alla piattaforma AI dell’azienda. Ed è solo l’ultimo esempio in ordine cronologico.

La ricerca di nuovi materiali, esattamente come quella di composti destinati a diventare farmaci, è sempre stata un processo lento e dispendioso, basato su ripetuti tentativi ed errori e su costosi test. Ma di recente, e in particolare nell’ultimo anno, l’utilizzo di modelli di machine learning e deep learning ha portato a un’accelerazione esponenziale. Tanto che, a fine novembre 2023, Google DeepMind ha annunciato con toni trionfali su Nature la scoperta di 2,2 milioni di nuove strutture cristalline teoricamente stabili e mai realizzate sperimentalmente: praticamente l’equivalente di 800 anni di lavoro di ricerca. La magia l’ha fatta uno strumento di deep learning avanzato battezzato GNoME, ovvero Graph Networks for Materials Exploration, che macina dati in ingresso sotto forma di grafi, paragonabili ai legami tra atomi. GNoME non si è limitato solo a scoprire inediti cristalli teoricamente sintetizzabili, ma ha anche individuato le 381.000 strutture più stabili e promettenti per una sperimentazione, mettendole a disposizione della comunità scientifica sulla piattaforma The Materials Project. Il numero è davvero straordinario, se si pensa che fino a oggi i cristalli inorganici noti erano “solo” 48.000.

Chi usa l’AI nell’industria chimica

Dalla farmaceutica alla scienza dei materiali, dalla petrolchimica all’agrochimica, dalla tossicologia al Chemical Risk Assessment, non c’è ramo dell’industria chimica che oggi non sia interessato dalla rivoluzione dell’AI. DOW Chemicals, ad esempio, utilizza modelli di machine learning per sviluppare nuove formule di poliuretano, e DuPont sta implementando robot addestrati con l’AI per maneggiare materiali chimici pericolosi. Mentre la società di biotecnologie Recursion Pharmaceuticals ha lavorato in tandem con il colosso dell’AI NVIDIA per esplorare 2,8 milioni di miliardi di combinazioni di molecole e proteine-bersaglio in appena una settimana: una ricerca che avrebbe richiesto 100.000 anni con metodi tradizionali.

Secondo una stima della società di analisi di mercato Precedence Research, l’utilizzo di strumenti di intelligenza artificiale nell’industria chimica ha oggi un valore di 1,4 miliardi di dollari, ma si prevede che raggiungerà i 20,5 miliardi nel 2033. E il ritorno di questi investimenti non mancherà di dare soddisfazioni: ad esempio un report di McKinsey uscito a febbraio 2024, che si concentra solo sull’AI generativa nell’industria farmaceutica, prevede che questa tecnologia potrebbe generare un valore economico annuo compreso tra i 60 e i 110 miliardi di dollari per il settore.

Va detto che, sebbene le applicazioni fantascientifiche in laboratorio siano quelle che accendono di più gli entusiasmi e la fantasia, le società chimiche cominciano a servirsi dell’AI in ogni area delle attività aziendali: non solo R&D, ma anche produzione, ingegneria, ottimizzazione delle supply chain, management, ricerche di mercato. Come la multinazionale tedesca BASF, che “utilizza algoritmi avanzati di machine learning su misura per prevedere la domanda di prodotti”, ci spiega Suad Sejdovic, Global Head of Analytics & AI della società. Mentre nel campo dell’AI generativa, ben prima che esplodesse il fenomeno ChatGPT, BASF aveva già implementato i “primi progetti pilota come QKnows AI, piattaforma di conoscenza e strumento di recupero per report interni e letteratura esterna per i colleghi di R&D”. E ancora, sistemi AI sono utilizzati dal gruppo per l’ottimizzazione delle catene del valore, e in futuro, aggiunge Sejdovic, “vediamo un potenziale significativo per il marketing, le vendite e le gare di appalto”.

Infine, anche per gli obiettivi di sostenibilità delle aziende chimiche le tecnologie AI possono dare un importante aiuto. BASF, ad esempio, sta digitalizzando i suoi impianti per garantire una migliore tracciabilità dei materiali e individuare le fasi dei processi produttivi dove è possibile ridurre le emissioni di carbonio. E a questo proposito, ci anticipa Sejdovic, “il nuovo impianto in costruzione a Zhanjiang, in Cina, sarà il primo progettato per essere digitale fin dall’inizio e diventerà il sito del gruppo con l’impronta di carbonio più bassa”.

 

Immagine: Envato