Memory Bandwidth senza precedenti in memorie DDR4 LRDIMM grazie a register e data buffer di IDT

Douglas Malech, IDT
Douglas Malech, IDT

Introduzione
Vista la crescita esplosiva della Big Data business analytics, considerata la crescita dei dati real time per i social media e le applicazioni mobile, la richiesta di elevate velocità e capacità nelle memorie non è mai stata così grande. Negli ultimi anni, le società del settore delle memorie hanno lavorato per migliorare continuamente le prestazioni delle memorie per le applicazioni aziendali. Questo articolo si propone di evidenziare i progressi raggiunti grazie alle memorie DDR4 e nello specifico con le memorie DDR4 LRDIMM.
La tecnologia DDR4 LRDIMM (load reduced memory module) utilizza l’approccio ditributed data buffer per raggiungere l'efficienza della larghezza di banda della memoria che consentirà più elevate velocità e capacità nei prossimi sistemi server DDR4 aziendali, in contrasto con l'approccio dati senza buffer utilizzato con DDR4 RDIMM (registered memory modules). LRDIMM, in generale, ha continuato ad evolversi e migliorare il suo valore per gli utenti di sistema. Come evidenziato in Figura 1, i sistemi aziendali Gen1 DDR3 come E5-2600 avevano velocità LRDIMM al di sotto del livello ottimale per tutte le capacità (descriveremo successivamente in questo articolo le ragioni). E5-2600 v2 realizzò significativi progressi migliorando il valore LRDIMM per gli utenti finali e risolvendo il problema di inversione di velocità esistente in E5-2600. Si prevede che DDR4 LRDIMM rappresenti un nuovo paradigma nelle prestazioni del sottosistema di memoria. DDR4 LRDIMM non solo fa appello alle più alte capacità, ma anche a una più vasta gamma di applicazioni che richiedono la massima larghezza di banda e capacità.

Figura 1: LRDIMM e RDIMM a confronto: miglioramento della velocità
Figura 1: LRDIMM e RDIMM a confronto: miglioramento della velocità
Le società del settore hanno fatto passi da gigante garantendo che l'aumento della velocità LRDIMM si traducesse in un corrispondente ridimensionamento LRDIMM della larghezza di banda di memoria in GigaByte / secondo (GB / s). La velocità è analoga a uno sprinter in grado di essere il più veloce in brevi periodi; migliorare la larghezza di banda di memoria è come tagliare il traguardo per primo.
Per riassumere i principali miglioramenti nelle DDR4 realizzati dalle società del settore per migliorare la larghezza di banda utilizzabile in GB / s sono:

  • migliorata l’architettura LRDIMM per una miglior integrità del segnale nei segnali dati
  • un’inferiore latenza del componente grazie a componenti con data buffer distribuiti
  • una migliore intelligenza e la consapevolezza post-buffer dei controller di memoria

Come è stato possibile?

Per capire come DDR4 ha raggiunto questo importante risultato nella tecnologia LRDIMM, in contrasto con DDR3. DDR4 e DDR3 LRDIMM che per migliorare l'integrità del segnale sul bus dati del modulo di memoria riducono il numero di data loads da un massimo di 4 fino a 1; inoltre DDR4 introduce alcune funzionalità aggiuntive per ridurre la latenza complessiva e migliorare l'integrità del segnale, che porta a velocità paragonabili a DDR4 RDIMM. Invece DDR4 LRDIMM eguaglia o supera DDR4 RDIMM larghezza di banda in ogni velocità e capacità di memoria.
DDR3 LRDIMM Design Characteristic Downside
Centralized memory buffer Longer I/O trace lengths Longer stubs connected to memory channel cause worse signal reflections, resulting in poorer signal integrity
Longer traces cause increased latency
Longer traces cause longer I/O bus turnaround time
Component latency Component delay is approximately 2.5ns Longer propagation delay adds to latency
 
DDR4 LRDIMM Design Characteristic Upside
Distributed buffers Shorter I/O trace lengths Shorter stubs connected to memory channel cause less pronounced signal reflections, resulting in improved signal integrity
Shorter traces reduce latency
Shorter traces reduce I/O bus turnaround time
Component latency Component delay is approximately 1.2ns 50% less latency than DDR3 memory buffer,

LDRIMM Design: buffer centralizzati o buffer distribuiti

Figura 2: LRDIMM I disegni
Figura 2: LRDIMM I disegni
Un DDR3 LRDIMM ha un buffer di memoria situato nel centro del modulo, come mostrato in Figura 2 Come per RDIMM, il buffer di memoria (MB3518) bufferizza e ritrasmette il comando, l’indirizzo e i segnali di clock verso le DRAM. Inoltre, LRDIMM bufferizza anche il bus dati DRAM I / O. Bufferizzando i dati di I / O, fino a quattro load DRAM nel backside bus sono ridotti a un unico load sul bus frontside. Avere meno load migliora l'integrità del segnale nel controller di memoria; tuttavia, mentre i percorsi del bus di dati di I/O DDR3 RDIMM vanno direttamente dal edge connettor ai load I/O DRAM, i percorsi DDR3 LRDIMM vengono instradati al buffer di memoria centrale, aumentando così la lunghezza dei percorsi fino a 70mm sia sul frontside che sul backside del buffer di memoria (Figura 3). Questi percorsi più lunghi creano un peso supplementare all'integrità del segnale del percorso dei dati DDR3 ad alta velocità e alla latenza introducendo spezzoni (stubs) molto lunghi sul canale di memoria, che si traduce in una velocità massima di I/O più lenta se paragonato al DDR3 RDIMM.
Figura 3: Lunghezze long trace in DDR3 LRDIMM
Figura 3: Lunghezze long trace in DDR3 LRDIMM
Come mostrato nella figura 4, la tecnologia DDR4 LRDIMM abbandona i percorsi più lunghi introdotte dal buffer di memoria DDR3 dismettendo la funzione data buffer e introducendo nove buffer device tra l’edge connector e le nove colonne di DDR4 DRAM i percorsi di 70 millimetri dei DDR3 LRDIMM sono sostituite con bus trace 8 millimetri frontside e backside come per RDIMM DDR4. Oltre a percorsi di lunghezze paragonabili a DDR4 RDIMM, il ritardo di propagazione attraverso i buffer di dati DDR4 diviene di circa il 33 per cento più veloce rispetto attraverso il buffer di memoria DDR3, riducendo ulteriormente la latenza. Una più breve lunghezza di trace del DDR4 LRDIMM e un più veloce buffer scheme rendono la latenza complessiva e il tempo di lettura / scrittura del bus paragonabile a DDR4 RDIMM.
Figura 4: Lunghezze di trace in DDR4 LRDIMM
Figura 4: Lunghezze di trace in DDR4 LRDIMM
Come mostrato in Figura 5, queste migliori caratteristiche della linea di trasmissione permettono alle DDR4 velocità di trasmissione dati più elevate rispetto alle DDR3 contribuendo ad una configurazione del flusso dati più accurata
Figura 5: configurazione del flusso dati più accurata dovuto ad una ottimale trasmissione dovuta alla minor lunghezza del data stub
Figura 5: configurazione del flusso dati più accurata dovuto ad una ottimale trasmissione dovuta alla minor lunghezza del data stub

Ottimizzazione della Latenza nei componenti

Inoltre, il buffer di memoria centralizzato DDR3 aggiunge anche 2,5ns di ritardo attraverso il buffer ed ha un percorso di segnale aggiuntivo di 70mm tra il retro del buffer di memoria e la DRAM I / O, introducendo ancora più latenza DDR3 LRDIMM rispetto a un approccio RDIMM. Più latenza con il buffer di memoria centrale DDR3 provoca un abbassamento della larghezza di banda (bandwidth) effettiva (Figura 6).
Figura 6: Confronto sulla latenza
 Figura 6: Confronto sulla latenza
Figura 6: Confronto sulla latenza

LRDIMM posizionamento (rank) controllato e valorizzato

Dopo l'introduzione di DDR3 LRDIMM, i memory controller hanno continuato ad aggiungere intelligenza per migliorare l'utilizzo delle capacità deeper memory del LRDIMM. Più di recente, i miglioramenti in una funzione chiamata " rank multiplication" hanno contribuito a ridurre la latenza e migliorare la larghezza di banda. Rank multiplication, evidenziato in Figura 7, è stato progettato per aggirare il problema di avere una serie limitata di due bit selezionare ogni LRDIMM che permettono da 1 a 5 scelte; 1-4 per selezionare una delle 4 DRAM (su un quad rank “4R” DIMM) per recuperare un pezzo di dati e 5 permette di non accedere a qualsiasi dei 4 DRAM. 5 può essere utilizzato, per esempio, se i dati vengono recuperati dal secondo o terzo LRDIMM nello stesso canale di memoria.
Figura 7: Rank Multiplication in 3 DIMM nel memory channel
Figura 7: Rank Multiplication in 3 DIMM nel memory channel
Nell’esempio in Figura 8 per le piattaforme server Gen1 DDR3, l’host controller risulta soprattutto "rank unaware" quando opera in modalità rank multiplication. Ovvero l'host deve sempre passare ad un diverso DRAM per la successiva operazione di lettura e, quindi, disattivare uno DRAM e abilitare l'altra DRAM sullo stesso bus dati. Quindi questi controller non sono in grado di utilizzare il timing più veloce durante le transazioni back-to-back di lettura allo stesso posizionamento con penalizzazione del 25% della larghezza di banda dati in fase di lettura. Rispetto ad una soluzione RDIMM di 24 slot che operano alla stessa velocità, LRDIMM assicura solo il 70% della larghezza di banda di memoria.
Nelle piattaforme server Gen2 DDR3, i controller diventano intelligenti per quanto riguarda la soluzione con i posizinamenti fisici dietro il buffer di dati. Sono in grado di richiedere i dati dalla memoria in modo molto più efficiente perché le letture e scritture back-to-back con lo stesso DRAM utilizzare il timing più veloce. Inoltre hanno superato alcune altre limitazioni per migliorare la velocità. Così, le piattaforme server Gen2 DDR3 raggiungono un miglioramento della velocità rispetto alle piattaforme server Gen1 DDR3, ma ancora più importante, hanno eliminato il gap di banda con le soluzioni RDIMM corrispondenti. L'unica penalizzazione rimasta sulle piattaforme DDR3 era dovuto alle latenze componenti e lunghezza dei percorsi di cui sopra. Sul DDR4, l'architettura distribuita di buffer riduce la latenza attraverso ciascuno dei più piccoli-buffer di dati distribuiti. Inoltre, esso consente al controller della memoria di ridurre la latenza grazie alla sua micro-architettura.
LRDIMM Server Platform LRDIMM rank awareness Latency relative to RDIMM
Gen1 DDR3 More latency
Gen2 DDR3 More latency
Gen1 DDR4 Comparable latency

Sommario

I miglioramenti delle società del settore sulle DDR4 LRDIMM hanno permesso di continuare a migliorare il trend sulla larghezza di banda della memoria e nella velocità del canale. I vantaggi di LRDIMM rispetto a RDIMM aumentano attraverso una gamma più ampia di applicazioni, ad alta capacità, o ad alto consumo di banda, o entrambi. La figura 8 riassume i risultati dei miglioramenti nelle successive generazioni di piattaforme server enterprise ricavati da esperimenti reali effettuati presso il laboratorio di validazione di IDT. 3DPC al 1866 può potenzialmente essere realizzato utilizzando LRDIMM mentre solo 3DPC a 1600 può essere realizzato utilizzando RDIMM. Con questi miglioramenti, ci aspettiamo che alcuni produttori di server che hanno sempre configurato le loro piattaforme server sulla velocità considerino 16GB LRDIMM come riduzione dei costi alternativa all'opzione LRDIMM di maggiore capacità (32GB). In sostanza, DDR4 LRDIMM non va considerata solo per la capacità ma per capacità e larghezza di banda.
Figura 8: Miglioramento normalizzato della larghezza di banda con RDIMM alla stessa velocità con le generazioni LRDIMM
Figura 8: Miglioramento normalizzato della larghezza di banda con RDIMM alla stessa velocità con le generazioni LRDIMM
DISCLAIMER Integrated Device Technology, Inc. (IDT) e le sue filiali si riservano il diritto di modificare i prodotti e / o le specifiche descritte nel presente documento in qualsiasi momento e ad esclusiva discrezione di IDT. Tutte le informazioni in questo documento, comprese le descrizioni delle caratteristiche del prodotto e delle prestazioni, sono soggette a modifiche senza preavviso. Specifiche delle prestazioni e dei parametri di funzionamento dei prodotti descritti sono determinati in modo indipendente e non sono garantiti gli stessi risultati, se installato in prodotti dei clienti. Le informazioni contenute nel presente documento sono fornite senza dichiarazioni o garanzie di alcun tipo, espressa o implicita, incluso, ma non limitato a, l'idoneità dei prodotti di IDT per uno scopo particolare, una garanzia implicita di commerciabilità, o di non violazione della proprietà intellettuale diritti degli altri. Questo documento è presentato solo come guida e non trasferisce alcuna licenza di diritti di proprietà intellettuale di IDT o di terzi. I prodotti di IDT non sono destinati all'uso in sistemi di supporto vitale o dispositivi simili in cui il guasto o il malfunzionamento di un prodotto IDT può essere ragionevolmente previsto per influenzare in tale modo significativo la salute o la sicurezza degli utenti. Chiunque utilizzi un prodotto IDT in modo lo fa a proprio rischio, in assenza di un espresso accordo scritto da IDT.
Integrated Device Technology, IDT e il logo sono marchi registrati di IDT. Altri marchi di fabbrica e marchi di servizi citati nel presente documento, inclusi nomi protetti, loghi e disegni sono di proprietà di IDT o dei rispettivi proprietari di terze parti.
© Copyright 2014 Tutti i diritti riservati.

Commenti