Il 2024 è stato l’anno dell’Artificial Intelligence. Il 2025 appartiene invece agli Agenti AI. Ma che cosa sono realmente questi Intelligent Agents? E in che modo si stanno imponendo – praticamente – per svolgere i più diversi compiti?
Addio BOT e AI Assistant: arrivano gli AI Agent
Ormai dati per acquisiti – e anche un po’ incompetenti e ‘stupidi’ a dire il vero – i chatbot, che servono (o sono serviti) solo per automatizzare semplici attività o conversazioni basiche, è adesso il turno degli Assistenti ad essere messi in discussione, che pure rispondono proattivamente a richieste e a sollecitazioni diverse, fornendo informazioni e completando compiti semplici. Arrivano anche a consigliare azioni, ma il limite di fondo rimane: è l’utente a prendere le decisioni operative in ultima analisi. ‘The man in the loop’ resta indispensabile al corretto funzionamento di questi strumenti.
Ma gli agenti intelligenti sono tutt’altro: possono eseguire azioni complesse e in più fasi; apprendendo delle esperienze pregresse e adattandosi al contesto. Ma soprattutto – e questa è la differenziazione che più conta in termini valoriali – possono prendere decisioni in modo autonomo e indipendente, liberandosi dalla supervisione umano. In altre parole, una volta impostati, portano a termine il compito richiesto, superando gli inevitabili contrattempi che quasi sempre si incontrano nell’esecuzione del compito.
Non si vuole qui sostenere che, a modello di quanto accade in un romanzo di fantascienza, una ‘macchina’ posso essere istruita – come Terminator – per sopprimere un uomo e persegua questo fine con infaticabile costanza (per quanto…), ma gli agenti AI hanno oggi il massimo grado di autonomia, in grado di operare e prendere decisioni in modo indipendente per raggiungere un obiettivo, progettati per gestire compiti e flussi di lavoro complessi. Gli agenti AI, inoltre, sempre più spesso utilizzano l’apprendimento automatico per adattarsi e migliorare le proprie prestazioni nel tempo.
Come riescono a funzionare gli AI Agents
Gli agenti di intelligenza artificiale osservano l’ambiente circostante, sfruttano LLM per la pianificazione e accedono a sistemi connessi per agire e raggiungere gli obiettivi. Sostanzialmente il loro impiego può essere riassunto in tre momenti distinti.
Osservazione: gli agenti di intelligenza artificiale raccolgono ed elaborano costantemente informazioni dall’ambiente in cui si trovano, tra cui le interazioni degli utenti, le metriche chiave delle prestazioni o i dati dei sensori. Sono in grado di conservare la memoria durante le conversazioni, il che fornisce un contesto ‘continuo’ per i piani e le operazioni in più fasi.
Pianificazione: utilizzando modelli linguistici, gli agenti di intelligenza artificiale valutano autonomamente e danno priorità alle azioni in base alla loro comprensione del problema da affrontare, degli obiettivi da raggiungere, del contesto e della memoria.
Azione: gli AI Agent sfruttano le interfacce con i sistemi aziendali, gli strumenti e le fonti di dati per eseguire le attività. I compiti sono regolati dal piano fornito da un modello linguistico di grandi dimensioni, o anche da una di dimensione più contenute ma specializzato. Per eseguire i propri compiti, l’AI Agent può accedere ai servizi aziendali (come i sistemi HR, i sistemi di gestione degli ordini o i CRM), delegare azioni ad altri agenti di intelligenza artificiale o chiedere chiarimenti all’utente. Questi agenti software intelligenti hanno la capacità di rilevare gli errori, correggerli e imparare attraverso piani in più fasi e controlli interni.
Questo ciclo di osservazione-pianificazione-azione è in grado di auto-rinforzarsi iniziando da capo un nuovo ciclo, perché gli strumenti di intelligenza artificiale analizzano continuamente come l’ambiente circostante è cambiato in base alle interazioni passate, sviluppano azioni diverse in funzione dei risultati parziali e imparano a essere più efficienti ed efficaci man mano che tempo passa. E così via.
Potenzialità, prestazioni e rischi degli AI Agent
Gli agenti di IA sono strumenti di IA in grado di automatizzare compiti complessi che altrimenti richiederebbero risorse umane. Ciò si traduce in obiettivi raggiungibili in modo economico, rapido e su scala. A loro volta, questi progressi fanno sì che gli agenti umani non debbano fornire indicazioni all’assistente AI per la creazione e la navigazione dei suoi compiti.
I framework multi-agente tendono a superare gli agenti singoli. Questo perché più piani d’azione sono disponibili per un agente, più apprendimento e riflessione avvengono. Un agente di intelligenza artificiale che incorpora la conoscenza e il feedback di altri agenti di intelligenza artificiale specializzati in aree correlate può essere utile per sintetizzare le informazioni. Questa collaborazione di back-end degli agenti di AI e la capacità di colmare le lacune informative sono caratteristiche uniche dei framework agenziali, che li rendono uno strumento potente e un significativo progresso nell’intelligenza artificiale.
Gli agenti di intelligenza artificiale forniscono risposte più complete, accurate e personalizzate per l’utente rispetto ai modelli di intelligenza artificiale tradizionali. Questo aspetto è estremamente importante per gli utenti, in quanto risposte di qualità più elevata offrono in genere un’esperienza migliore per il cliente. Come descritto in precedenza, ciò è possibile grazie allo scambio di informazioni con altri agenti, all’utilizzo di strumenti esterni e all’aggiornamento del flusso di memoria. Questi comportamenti emergono da soli e non sono pre-programmati.
Alcuni compiti complessi richiedono le conoscenze di più agenti AI. Quando si implementano questi framework multi-agente, c’è il rischio di malfunzionamenti. I sistemi multi-agente costruiti sugli stessi modelli di base possono incontrare insidie condivise. Tali debolezze potrebbero causare un guasto all’intero sistema di tutti gli agenti coinvolti o esporre la vulnerabilità ad attacchi, Ciò evidenzia l’importanza della governance dei dati nella costruzione dei modelli di base e di processi di formazione e test approfonditi.
Le ‘personalità’ dei diversi AI Agent
Ormai gli agenti intelligenti spuntano davvero dappertutto, da Salesforce ad Adobe, fino ad applicazioni specializzate per prevedere gli andamenti borsistici o il meteo: impossibile analizzarli tutti. Addirittura esistono anche ‘generatori di AI Agent’ che no hanno nemmeno LLM proprietari, ma si appoggiano a quelli più famosi e conosciuti, come ad esempio è il caso del cinese Manus che utilizza, pagando ovviamente, Sonnet 3,5 di Anthropic.
Si può tuttavia ‘giocare’ con le AI più conosciute, e derivare da queste la ‘caratteristiche ‘ dei diversi AI Agent prodotti: Gemini e Co-pilot hanno un approccio simile. Non si limitano a dare risposte, ma guidano l’utente lungo l’intero percorso. D’altra parte, Grok e ChatGPT hanno un’atmosfera più orientata all’azione. Grok punta tutto sulla velocità, mentre ChatGPT eccelle nella creazione di testi. Meta AI, l’unico open source di questi, si colloca più o meno a metà del guado e ha in più il vantaggio di poter essere ‘scaricato’ in locale e personalizzato a piacere. Per il momento, però, non è disponibile in Italia al di fuori delle app di Meta.
In ultima analisi le AI stanno sviluppando una sorta di personalità distintiva. Grok è il più imprevedibile e passa da un linguaggio tecnico a un linguaggio più informale. Co-pilot e ChatGPT sono più coerenti. Co-pilot è lucido e professionale e offre risposte chiare e ponderate. ChatGPT è colloquiale, adattabile e sempre pronto con una risposta eulibrata. Gemini, invece, adatta la sua complessità alla comprensione dell’utente, come un professore che adatta le spiegazioni al suo livello.
di Massimo Bolchi