Perché gli hard disk sono ancora fondamentali per l’infrastruttura AI
Quando la maggior parte delle persone sente parlare di infrastruttura AI, la conversazione di solito ruota attorno a GPU, High Bandwidth Memory (HBM) o sistemi di archiviazione a stato solido ultraveloci. L’idea di base è che l’intelligenza artificiale funzioni interamente su hardware all’avanguardia, dove tutto viene misurato in nanosecondi e terabyte al secondo.
Questa idea non è sbagliata, ma è incompleta.

La realtà è che i moderni sistemi AI dipendono ancora molto da una delle tecnologie più vecchie presenti nei data center: l’hard disk meccanico.
Può sembrare strano, considerando che abbiamo già parlato di come i server AI si stiano spostando oltre la memoria flash tradizionale nel nostro articolo: Il NAND non sta scomparendo, ma i server AI oggi dipendono da più del semplice flash. Abbiamo anche analizzato perché tecnologie come la High Bandwidth Memory (HBM) stanno diventando essenziali per alimentare i sistemi AI con dati abbastanza velocemente da evitare colli di bottiglia nelle GPU.
Ma c’è un altro lato di questa storia che riceve molta meno attenzione: la scala pura.
L’AI non ha bisogno solo di storage veloce. L’AI ha bisogno di una quantità di storage quasi difficile da immaginare.
E gli hard disk sono ancora l’unica tecnologia capace di offrire quella capacità a un costo che l’industria può realisticamente sostenere.
Capire la gerarchia dello storage per l’AI
Il modo più semplice per capire l’infrastruttura AI moderna è smettere di pensare a un singolo computer e iniziare a pensare a un’intera operazione logistica.
La HBM si comporta come la banchina di carico, dove i dati vengono spostati a velocità incredibile. La DRAM funziona come l’area di lavoro attiva, dove le informazioni vengono manipolate di continuo. La NAND flash somiglia più a scaffalature vicine, dove l’accesso rapido è ancora importante, ma anche la persistenza a lungo termine inizia a contare.
Gli hard disk, invece, sono il magazzino.
Non la parte più appariscente dell’operazione. Nemmeno la più veloce. Ma assolutamente la più grande.
| Tecnologia | Capacità tipica | Punto di forza principale | Ruolo principale nell’AI |
|---|---|---|---|
| HBM | 80GB–192GB | Larghezza di banda estrema | Calcolo GPU attivo |
| DRAM | Centinaia di GB | Bassa latenza | Memoria di lavoro |
| SSD NAND | Più TB | Storage persistente veloce | Preparazione dei dataset e caching |
| Hard disk | Da petabyte a exabyte | Efficienza di capacità | Storage di massa e archivi |
Questa distinzione conta perché i sistemi di training AI consumano dati su una scala che la maggior parte delle persone non incontra mai nell’informatica normale.
Un laptop consumer può archiviare pochi terabyte di dati. Anche una workstation di fascia alta potrebbe arrivare solo a decine di terabyte. L’infrastruttura AI opera diversi ordini di grandezza sopra quel livello.
Mentre un laptop consumer ragiona in terabyte, i cluster AI ragionano in exabyte.
Un singolo exabyte equivale a un milione di terabyte.
Se un hard disk enterprise moderno archivia 30TB, servirebbero comunque più di 33.000 hard disk per costruire un singolo exabyte di capacità grezza.
I grandi operatori AI non costruiscono un solo exabyte. Ne costruiscono molti, distribuiti tra regioni, livelli di ridondanza, ambienti di training, sistemi di backup e storage d’archivio.
Il problema dell’exabyte
Addestrare un grande modello linguistico può coinvolgere petabyte di testo, immagini, video, telemetria, checkpoint e stati di training archiviati. Una volta raccolti, quei dataset vengono eliminati raramente. Continuano a crescere man mano che i modelli vengono riaddestrati, rifiniti ed espansi.
Durante il training AI, i sistemi creano continuamente checkpoint, che in pratica sono enormi stati di salvataggio del modello mentre apprende. Se un cluster si guasta a metà di un ciclo di training lungo settimane, quei checkpoint possono essere l’unica cosa che impedisce di perdere milioni di dollari di tempo di calcolo.
Questo significa che l’infrastruttura di storage non riguarda più soltanto la velocità, ma anche il mantenimento di enormi pool di dati accessibili.
Ed è qui che gli hard disk continuano silenziosamente a dominare.
Nel 2010, un hard disk da 2TB sembrava enorme. Gli ambienti enterprise utilizzavano comunemente dischi SAS da 300GB o 600GB, e qualsiasi cosa sopra pochi terabyte era considerata capacità premium.
Oggi, gli hard disk enterprise da 24TB e 30TB stanno diventando installazioni standard nei grandi data center. I produttori stanno già testando dischi da oltre 40TB usando tecnologie come HAMR (Heat-Assisted Magnetic Recording), che aumenta la densità areale senza aumentare la dimensione fisica del disco stesso.
Per mettere questa crescita in prospettiva, un singolo rack di storage moderno può contenere più dati di un intero data center aziendale di medie dimensioni del 2010.
Ecco quanto è cambiata drasticamente la domanda di storage.
E l’AI è una delle ragioni principali.
L’AI funziona con più della sola velocità
La discussione pubblica sull’AI tende a concentrarsi sulle GPU perché le GPU svolgono il lavoro visibile. Generano le risposte, creano le immagini ed elaborano i token.
Lo storage svolge il lavoro invisibile di preservare la pipeline dell’intelligenza stessa.
Le GPU sono utili solo se possono accedere continuamente a enormi quantità di dati di training.
Quei dati devono vivere da qualche parte.
Non dentro la HBM. Non dentro la DRAM. E certamente non interamente dentro costosi livelli di storage NAND.
Vivono principalmente su enormi infrastrutture basate su hard disk.
Un moderno data center AI può contenere centinaia di petabyte di dati archiviati. Alcuni ambienti hyperscale probabilmente vanno ben oltre, fino ad architetture su scala exabyte. Tentare di archiviare tutto questo interamente su NAND flash sarebbe economicamente irrealistico, anche per i più grandi provider cloud.
Questa è la parte che molte persone non colgono quando parlano di hardware AI.
Le prestazioni contano, ma conta anche l’economia.
L’industria ama promuovere IOPS e numeri da benchmark, ma le grandi implementazioni AI sono alla fine limitate dal costo totale di proprietà.
Gli hard disk continuano a offrire il costo per terabyte più basso nelle implementazioni su larga scala. Rimangono anche estremamente efficienti per conservare dati freddi, dataset archiviati, snapshot di backup, checkpoint dei modelli e grandi quantità di informazioni di training che non richiedono tempi di accesso nell’ordine dei nanosecondi.
Perché gli hard disk funzionano ancora per l’AI
C’è anche un altro equivoco da chiarire: spesso si presume che gli hard disk siano inutilizzabilmente lenti per gli ambienti AI.
Non è del tutto vero.
Un singolo hard disk è lento rispetto alla DRAM o alla NAND flash, sì. Ma i data center AI non lavorano con singoli dischi. Lavorano con enormi array di storage, con accesso parallelo attraverso migliaia di dischi contemporaneamente.
Ancora più importante, molti carichi di lavoro AI implicano lo streaming sequenziale di grandi dataset invece di minuscole transazioni casuali. I carichi sequenziali sono proprio una delle aree in cui gli array moderni di hard disk enterprise si comportano ancora sorprendentemente bene.
In altre parole, l’infrastruttura AI non chiede sempre: “Qual è lo storage più veloce possibile?”
A volte chiede:
Qual è il modo pratico più veloce per archiviare 500 petabyte senza mandare l’azienda in bancarotta?
Questo è un problema ingegneristico molto diverso.
L’infrastruttura AI sta diventando un ecosistema di memoria a livelli
Questo spiega anche perché le nuove tecnologie vengono inserite a strati nei sistemi AI, invece di sostituire del tutto le tecnologie più vecchie.
Nel nostro articolo sulla Storage Class Memory: il livello mancante tra DRAM e NAND, abbiamo analizzato come l’industria continui a creare livelli intermedi per bilanciare velocità, persistenza ed economia.
Abbiamo anche esplorato come la NAND stia cercando di avvicinarsi a prestazioni simili alla memoria in: High Bandwidth Flash: la NAND può finalmente comportarsi come memoria?.
L’infrastruttura AI sta diventando esattamente questo: un ecosistema di memoria a livelli.
La HBM gestisce il calcolo immediato. La DRAM gestisce i carichi di lavoro attivi. La NAND flash assorbe le attività di storage persistente veloce. Le tecnologie storage-class cercano di colmare i divari di latenza. Gli hard disk forniscono la base di enorme capacità sotto tutto il resto.
Il futuro dello storage AI non è una tecnologia che ne sostituisce un’altra.
È un insieme di tecnologie impilate una sull’altra, perché nessun singolo tipo di memoria risolve bene ogni problema.
Questo è probabilmente il più grande fraintendimento sull’infrastruttura AI oggi. Le persone presumono che la tecnologia più nuova elimini automaticamente quella più vecchia.
Ma nella storia dell’informatica raramente funziona così.
Gli hard disk sono sopravvissuti agli SSD perché il mondo ha continuato a produrre dati più velocemente di quanto i prezzi della flash potessero scendere. Ora l’AI sta accelerando ancora di più questa tendenza. La quantità di informazioni generate, conservate, copiate e riaddestrate sta esplodendo così rapidamente che la capacità stessa è diventata una risorsa strategica.
Ironia della sorte, più l’AI diventa avanzata, più diventa importante anche l’infrastruttura di storage su larga scala.
Il che significa che una delle tecnologie più vecchie del data center potrebbe continuare a svolgere un ruolo critico nell’AI molto più a lungo di quanto molti si aspettassero.
Nota editoriale: Questo articolo fa parte della serie continua sull’infrastruttura AI e sull’architettura della memoria pubblicata da GetUSB.info. L’articolo è stato ricercato e scritto con supporto editoriale assistito dall’AI per struttura e leggibilità, poi revisionato e rifinito dal team editoriale di GetUSB per accuratezza tecnica, continuità e chiarezza.
L’immagine di accompagnamento utilizzata in questo articolo è una fotografia originale scattata dal team di GetUSB.info e non è fotografia stock.
