I parametri dei modelli di IA di grandi dimensioni sono cresciuti in scala esponenziale, passando da centinaia di miliardi a trilioni. Anche i set di addestramento si sono evoluti da paradigmi unimodali a multimodali (immagini, video, ecc.), dando luogo a un'esplosione di dati che ha aumentato i volumi di migliaia di unità e ha portato a sfide senza precedenti.
In primo luogo, le scarse prestazioni di caricamento di un numero enorme di file di piccole dimensioni hanno compromesso l'efficienza dell'addestramento.
In secondo luogo, l'ottimizzazione frequente di grandi parametri del modello ha portato a piattaforme di addestramento instabili, con interruzioni del servizio che si verificano in media ogni due giorni e letture e scritture frequenti e dispendiose di checkpoint a livello di TB.
In terzo luogo, l'addestramento di modelli da 100 miliardi di parametri richiede risorse massicce da parte delle GPU, dato che le singole GPU non sono sufficientemente efficienti, e garantire l'inferenza in tempo reale a livello di millisecondi per le applicazioni conversazionali è piuttosto impegnativo.
OceanStor A800 offre ben 24 milioni di IOPS e 500 GB/s di larghezza di banda all'interno di un singolo controller, rappresentando la soluzione di archiviazione ad alte prestazioni per il repository della conoscenza dell'intelligenza artificiale. Con prestazioni quattro volte superiori a quelle del secondo classificato, un singolo sistema di storage è tutto ciò che serve per il caricamento di piccoli file di set di formazione e per la formazione riprendibile basata su una larghezza di banda elevata. Potrete inoltre beneficiare dell'accesso a un archivio di conoscenze vettoriali intrinseche leader del settore, che supporta applicazioni di inferenza di modelli di grandi dimensioni con oltre 250.000 QPS, ottenendo un recupero accelerato dei vettori e una risposta all'inferenza di livello millisecondo.
Prestazioni elevatissime
La nostra innovativa architettura di separazione del controllo dei dati facilita il flusso diretto dei dati ai dischi, riducendo l'utilizzo della CPU e fornendo 24 milioni di IOPS per enclosure del controller.
---