NVIDIA non fa più chip per essere umani, ma per gli agenti AI


Taipei – NVIDIA non sta più progettando chip soltanto per farci giocare, lavorare o aprire Excel un po’ più velocemente. Al Computex 2026 di Taipei, Jensen Huang (il CEO di NVIDIA che sul palco indossa sempre una giacca di pelle da rockstar, ed è acclamato come tale dal pubblico) ha raccontato una visione molto più radicale: i prossimi computer saranno costruiti per far lavorare gli agenti AI al posto nostro, con noi a dare l’intenzione e loro a occuparsi dell’esecuzione.

Che sia nelle AI Factory con Vera Rubin o nei nuovi PC Windows con RTX Spark, l’hardware di oggi e di domani è pensato per gli agenti AI. Questo non significa che noi non possiamo giocare, creare, organizzare. Significa solo che non siamo più noi gli utenti finali.

Jensen Huang lo dice chiaro al Computex: NVIDIA ora fa i chip pensando agli agenti AI

Appena usciti dalla conferenza di Jensen Huang a Taipei, come ogni volta che sentiamo parlare il CEO di NVIDIA, ci sembra di aver sentito parlare un oracolo. Non perché ci sia niente di mistico: Huang ha parlato di potenza di calcolo, ha mostrato grafici. Ma perché due ore di conferenza sono volate grazie ai suoi discorsi a braccio, eppure fra i tanti annunci quello che emerge è un singolo messaggio, chiarissimo: NVIDIA non pensa più solo agli utenti umani, ma agli agenti AI.

Non perché noi spariremo dall’equazione, almeno secondo Huang. Ma perché il centro di gravità del computer si sta spostando. Prima l’utente cliccava, scriveva, apriva applicazioni, spostava file e litigava con finestre che si ridimensionavano da sole. Domani, secondo NVIDIA, l’utente dirà cosa vuole ottenere. E un agente AI userà strumenti, software, memoria, GPU, CPU e servizi cloud per arrivarci. A ritmi insostenibili per un essere umano. E, quindi, l’hardware deve imparare a correre più veloce.

NVIDIA e l’era degli agenti AI

Il cambio di passo arriva adesso non solo per questioni tecnologiche, ma anche economiche. Huang ha aperto la conferenza con un concetto semplice, quasi brutale: l’AI utile è arrivata. Non l’AI da demo, non il chatbot che vi scrive una poesia e ci fa interrogare sulla natura dell’arte. Ma un’intelligenza artificiale capace di produrre valore economico, soprattutto nel software.

nvidia chip agenti ai convenienza

Sul palco, Huang ha citato GitHub e l’aumento dei commit: 300 milioni nel 2023, 400 milioni nel 2024, 500 milioni nel 2025 e una crescita quasi triplicata nei primi mesi del 2026, secondo i dati mostrati durante la keynote. Da qui la sua tesi: se gli sviluppatori producono molto di più grazie agli agenti AI, le aziende non assumeranno meno ingegneri, ma più ingegneri. Perché ogni ingegnere, potenziato dall’AI, rende di più.

È una visione ottimista, che secondo noi non tiene conto di quanto aiuta in Borsa tagliare posti di lavoro per mostrare intenzioni di risparmio. Ma dice qualcosa di vero sull’economia nell’era dell’AI. I token sono diventati unità economiche. Ogni token generato da un modello può diventare ricavo. E se i token fanno soldi, allora servono fabbriche per produrli.

Da qui nasce la nuova ossessione di NVIDIA: le AI factory, fabbriche di intelligenza dove l’elettricità entra da una parte e token monetizzabili escono dall’altra. Sembra fantascienza industriale, ma a Taipei il lessico era quello: performance per watt, token per watt, tempo al primo token, affidabilità, raffreddamento, rete elettrica. Non si parla più di AI come esercizio tecnologico, ma come realtà economica.

Cos’è un agente AI

Per capire perché NVIDIA stia ridisegnando tutto, bisogna partire dagli agenti AI. Huang li ha descritti come un nuovo modello di computing: non più una semplice applicazione, ma un sistema composto da un modello linguistico, un “harness” (letteralmente “imbracatura”) che lo orchestra, strumenti da usare, memoria a breve e lungo termine, e un runtime che tiene insieme il tutto.

come funziona un agente ai nvidiacome funziona un agente ai nvidia

Un agente AI non si limita a rispondere. Osserva, ragiona, pianifica, agisce e usa strumenti. Può aprire un browser, consultare un database, generare codice, usare una libreria scientifica, creare un file CAD o chiedere aiuto a un sotto-agente specializzato.

L’idea, è che funzioni come un vostro sottoposto al lavoro. Non gli dite di aprire PowerPoint, scegliere il font, cercare le immagini e salvare in PDF. Gli date l’obiettivo: prepara una presentazione su X.

Vera Rubin: il supercomputer NVIDIA costruito per gli agenti AI

Perché gli agenti siano utili, devono operare a ritmi da computer: sarebbe limitante se eseguissero le azioni al nostro stesso ritmo. Ma per farlo, serve potenza. Da qui nasce Vera Rubin, che NVIDIA presenta come una piattaforma multi-rack pensata per l’agentic AI. Non un singolo chip, non una GPU più grossa da mettere in vetrina, ma un’intera architettura: GPU Rubin, CPU Vera, BlueField-4 per storage e sicurezza, networking Spectrum-X Ethernet Photonics, sistemi a liquido e tray modulari. NVIDIA ha annunciato che Vera Rubin sta entrando in piena produzione per alimentare le AI factory dedicate agli agenti.

Qui la parola chiave è sistema. NVIDIA non vuole più essere vista solo come l’azienda delle GPU. Huang lo ha detto chiaramente: l’azienda si sta trasformando prima in società di sistemi, poi in società di infrastrutture AI.

Vera Rubin serve perché gli agenti AI hanno un comportamento diverso dai vecchi carichi di lavoro. Un modello generativo tradizionale riceve una richiesta e produce una risposta. Un agente, invece, può avviare un percorso lungo: ragiona, cerca informazioni, richiama strumenti, lancia codice, consulta memoria, genera sotto-task, ritorna al modello, poi riparte.

infrastruttura full stack agenti aiinfrastruttura full stack agenti ai

Per questo, secondo NVIDIA, non basta più avere GPU potenti. Anzi: la CPU Vera nasce proprio per evitare colli di bottiglia quando c’è da analizzare gli output AI delle GPU Rubin. Ma, in generale, c’è bisogno che ogni elemento della catena sia efficiente. Bisogna progettare tutta la fabbrica per far girare questi flussi senza colli di bottiglia.

DSX: le fabbriche AI come infrastruttura industriale

Il pezzo forse meno “sexy” della conferenza, ma più importante per capire dove sta andando NVIDIA, è DSX. Se RTX è il marchio delle GPU (e, come vedremo, non solo) e DGX quello dei sistemi AI, DSX diventa il playbook per costruire e gestire le AI factory.

DSX Sim usa Omniverse per simulare la fabbrica prima di costruirla. DSX OS gestisce provisioning, monitoraggio e operazioni multi-tenant. DSX Max LPS ottimizza potenza, raffreddamento e distribuzione energetica. DSX Plus dialoga con la rete elettrica per modulare i consumi quando serve. Durante la keynote, Huang ha insistito sul fatto che in una fabbrica AI ogni watt conta: quindi non si può sbagliare in fase di progettazione.

Il punto economico è ancora più chiaro: “compute is revenue“. La potenza di calcolo genera token, i token generano ricavi. Quindi scegliere un’architettura solo perché costa meno all’acquisto, sostiene Huang, non ha senso se poi produce meno token per watt, si rompe più spesso o diventa obsoleta più in fretta. NVIDIA riassume il tutto con un concetto molto da Silicon Valley, ma efficace: più compute comprate, più potete guadagnare.

Vera CPU: il chip per agenti AI impazienti

La frase più interessante della conferenza, però, riguarda le CPU. Huang ha spiegato che le CPU finora erano state progettate per gli esseri umani. Noi viviamo in secondi, minuti, attese sopportabili. Un agente AI no: vive in nanosecondi. Quando chiama uno strumento, consulta un database o aspetta una risposta dal sistema, ogni ritardo blocca il percorso successivo.

Da qui nasce NVIDIA Vera CPU, che Huang ha definito una CPU per agenti. Non per massimizzare il numero di core da affittare “a ore”, come nel vecchio modello cloud, ma per tenere alimentate le GPU e orchestrare il lavoro dell’agente: memoria, strumenti, database, sicurezza, sandbox, storage.

cpu vera chip nvidia per agenti aicpu vera chip nvidia per agenti ai

Tecnicamente, Vera punta su prestazioni single-thread elevate, larghezza di banda per core, bassa latenza e alta efficienza energetica. Durante la keynote si è parlato di core Olympus con decode a 10 istruzioni per ciclo, fabric interno da 3,6 TB/s, LPDDR5X fino a 1,2 TB/s, PCIe Gen 6 e NVLink coerente con la GPU. La logica è semplice: se la GPU è il forno che produce token, la CPU non deve diventare il cuoco che si dimentica di portare gli ingredienti.

Huang ha anche citato numeri concreti: SQL fino a 3 volte più veloce e stream processing in tempo reale fino a 6 volte più rapido in alcuni carichi mostrati sul palco. Ma il messaggio più importante non è il benchmark. È la direzione: la CPU diventa il direttore d’orchestra, la GPU l’orchestra.

CUDA-X diventa una cassetta degli attrezzi per gli agenti AI

Un altro passaggio chiave riguarda il software. Da anni NVIDIA ripete che il suo vantaggio non è solo l’hardware, ma CUDA (e tutti gli esperti del settore sono d’accordo, è la chiave fin da quando l’azienda di Jensen Huang si occupava solo di schede grafiche per il gaming). A Taipei, il CEO dell’azienda ha rincarato la dose: le librerie CUDA-X diventano strumenti che gli agenti AI possono imparare a usare.

cuLitho per la litografia computazionale, cuOpt per l’ottimizzazione, cuDSS per solver sparsi, Warp per la fisica differenziale, Parabricks per la genomica.

NVIDIA Agent Toolkit: il sistema operativo degli agenti aziendali

Per portare gli agenti AI dentro le aziende, NVIDIA ha presentato il proprio Agent Toolkit for Enterprise AI. La struttura è sempre la stessa: modelli, harness, strumenti con skill e runtime. OpenShell gestisce policy, identità, privacy e sicurezza. Nemotron fornisce modelli aperti che le aziende possono adattare. CUDA-X diventa l’insieme di competenze operative.

compute is revenuecompute is revenue

NVIDIA ha annunciato anche Nemotron 3 Ultra, modello open pensato per agenti di lunga durata. Secondo l’azienda, offre inferenza fino a 5 volte più veloce e costi fino al 30% inferiori rispetto ad altri modelli open frontier della stessa classe.

L’esempio più forte è quello con Cadence. Il Superchip Agent per la verifica dei chip coordina sotto-agenti, generazione RTL, testbench, simulazioni, regression testing e debug. NVIDIA e Cadence sostengono che un ciclo che prima richiedeva settimane possa scendere a ore, con una velocità oltre 40 volte superiore nella verifica.

RTX Spark: il PC diventa una macchina per agenti AI

La novità più vicina a noi, però, è NVIDIA RTX Spark. Qui entriamo nel territorio dei PC, dei laptop, delle workstation e della vita quotidiana. NVIDIA e Microsoft vogliono reinventare Windows per l’era degli agenti AI, portando modelli e agenti direttamente sui dispositivi personali. RTX Spark integra una GPU Blackwell RTX con 6.144 CUDA core, una CPU Grace custom a 20 core sviluppata con MediaTek, NVLink, fino a 128 GB di memoria unificata, processo TSMC a 3 nm e 70 miliardi di transistor. NVIDIA parla di 1 petaflop di prestazioni AI.

L’obiettivo non è soltanto far girare meglio i giochi, anche se Huang non ha resistito e ha parlato di Forza e il nuovo 007. Del resto, siamo pur sempre nella “chiesa” NVIDIA: il ray tracing ha il suo altare.

nvidia rtx sparknvidia rtx spark

Il punto è che RTX Spark vuole rendere locale l’agente personale. Un assistente che può leggere file, usare applicazioni, generare immagini, scrivere codice, lavorare con modelli locali o cloud, restare sandboxato per sicurezza e interagire con Windows. NVIDIA e Microsoft parlano di una piattaforma Windows nativa per agenti, con OpenShell e nuove norme di sicurezza.

Dal PC allo smartphone: perché Huang pensa che tutto cambierà

Huang ha usato un paragone che ci ha colpito: il PC di domani starà al PC di oggi come lo smartphone sta al vecchio telefono. Il telefono, in teoria, serviva per telefonare. Oggi lo usiamo per pagare, orientarci, lavorare, guardare video, ordinare cena e discutere con sconosciuti su internet, che è il vero progresso dell’umanità.

Allo stesso modo, il PC non sarà più soltanto una macchina per aprire applicazioni, cliccare icone e compilare fogli Excel. Diventerà una base per agenti. Magari un desktop sempre acceso in casa, collegato a laptop, display, videocamere, elettrodomestici, sistemi di sicurezza. Un piccolo cervello domestico che ricorda, organizza, aiuta.

NVIDIA ha annunciato una nuova famiglia di macchine: laptop RTX Spark, desktop compatti sempre attivi e DGX Station for Windows per sviluppatori e aziende che vogliono modelli molto grandi accanto alla scrivania. Quest’autunno vedremo PC RTX Spark da parte di Microsoft, ASUS, MSI, Lenovo e tante altre. Adobe, intanto, sta ripensando Photoshop e Premiere per RTX Spark, con prestazioni AI e grafiche fino a 2 volte superiori e interazione con agenti tramite MCP server, secondo quanto mostrato da NVIDIA.

Gli agenti AI arrivano anche nei robot e nelle auto

La parte finale della conferenza ha allargato il discorso alla physical AI, cioè l’intelligenza artificiale che deve capire e agire nel mondo fisico. Per Huang, un agente AI è in fondo un robot digitale: osserva, ragiona, pianifica e agisce. La stessa struttura può vivere in un data center, in un PC, in un’auto, in un robot umanoide, in una fabbrica, in un satellite o perfino in una stazione radio.

robot physical airobot physical ai

Qui entra in gioco Cosmos 3, il modello open per la physical AI. NVIDIA lo descrive come un omni model capace di funzionare come VLM, world model, simulatore e modello d’azione. In pratica, può osservare il mondo, generare video sintetici fisicamente plausibili, simulare scenari e aiutare ad addestrare robot e sistemi autonomi. Il concetto di Huang è molto potente: se prima “dati + compute = AI”, ora “AI + compute = dati”.

Il motivo è semplice: per addestrare robot servono dati dal punto di vista del robot. Noi abbiamo riempito internet di testi e video dal punto di vista umano. Un robot, però, deve imparare da una prospettiva in prima persona, con sensori, mani, ruote, peso, attrito, imprevisti. Cosmos serve proprio a generare e simulare quel mondo.

NVIDIA ha poi parlato di Isaac GR00T, della piattaforma per robot umanoidi e di un robot reference design pensato per università e laboratori, così da evitare che ogni team debba ricostruire tutto da zero prima ancora di iniziare la ricerca. Sul fronte automotive, invece, NVIDIA ha introdotto Alpamayo 2 Super, modello open da 32 miliardi di parametri per robotaxi e guida autonoma di livello 4, insieme all’ecosistema DRIVE Hyperion.

La visione di NVIDIA: più efficienza, più lavoro, più compute

Il filo rosso di tutta la conferenza è questo: gli agenti AI cambiano il modo in cui si progetta l’hardware. Le GPU servono ancora, tantissimo. Ma da sole non bastano. Servono CPU per agenti impazienti, storage per memorie enormi, reti più efficienti, sicurezza a livello di silicio, fabbriche simulate in Omniverse, PC capaci di far girare agenti locali e robot che imparano da mondi sintetici.

Huang dice che questo non distruggerà lavoro, ma aumenterà produttività e assunzioni. Noi non sappiamo se sarà davvero così per tutti. La storia della tecnologia ci insegna che l’efficienza crea nuove opportunità, ma non le distribuisce automaticamente in modo equo. Non basta avere più token: bisogna capire chi li controlla, chi li paga e chi raccoglie il valore generato.

Però una cosa, qui a Taipei, si sente davvero: NVIDIA non sta più vendendo semplicemente chip. Sta vendendo l’infrastruttura per una nuova forma di lavoro digitale, fatta di agenti che usano strumenti, generano token, progettano chip, creano case, guidano auto, addestrano robot.

Il cambio di passo è netto. Prima costruivamo computer per far lavorare meglio gli esseri umani. Ora NVIDIA sta costruendo computer per far lavorare gli agenti AI per noi.


msi NVIDIA GeForce RTX 5060 8G Shadow 2X OC Carte Graphique…

  • PRENDI L’ESSENZIALE – MSI SHADOW offre un design orientato alle prestazioni che garantisce l’esperienza di gioco…
  • DESIGN TERMICO E DOPPIA VENTOLA – Due ventole su un ampio dissipatore di calore garantiscono ottime prestazioni di…
  • TORX FAN 5.0 – La ventola TORX FAN 5.0 migliora il flusso d’aria e la pressione grazie a un design migliorato. Gli archi…

Ultimo aggiornamento 2026-06-02 / Link di affiliazione / Immagini da Amazon Product Advertising API






#Adessonews seleziona nella rete articoli di particolare interesse.
Se vuoi leggere l’articolo completo clicca sul seguente link
 Stefano Regazzi

Source link

Di