Desempenho DDR4 vs DDR3 | Game Detonado - Tudo sobre games e tecnologia!

Desempenho DDR4 vs DDR3



Para qualquer usuário interessado no desempenho, a velocidade da memória é uma parte importante da equação quando se trata de construir o seu próximo sistema. Isto pode aplicar a qualquer usuário, de processamento de gráficos integrados para jogos ou aqueles que necessitam do máximo de desempenho. 

DDR4 vs DDR3



À primeira vista, comparações diretas entre DDR4 e DDR3 são difíceis de fazer. Os soquetes de DDR2 e DDR3, foram fabricadas algumas placas mãe que poderiam usar os dois tipos de memória e que poderiam realizar testes em ambos no mesmo ambiente. A situação atual do DDR4 é tem 44 pinos a mais do que o antigo, onde DDR3 não é bem-vindo (exceto alguns SKUs de altas quantidade de ordem mínima que são muito raros). A plataforma dita a compatibilidade de memória, e as principais características da DDR4 são simples.


DDR4 traz uma tensão mais baixa, abaixo de 1,5 volts em 1,2 volts. Esta é a característica principal alardeada pelos fabricantes de memória e aqueles que usam DDR4. Não soa como muito, especialmente quando nós podemos estar lidando com sistemas de 300W para 1200W facilmente sob Haswell-E. Os números citados são um 1-2W economizados por módulo por sistema, o que para um desktop totalmente carregado de casa-usuário pode aproximar 15W na poupança de alta qualidade sobre DDR3, mas para um farm de servidores com 1000 CPUs, isso significa um 15kW economizados que acrescenta-se. A especificação de baixa tensão para DDR4L vem de DDR3L, bem como, de 1,35 volts a 1,05 volts.
Comparação DRAM
Baixa
Tensão
Tensão
Padrão
Desempenho
da Tensão
DDR1,80 V2.50 V
DDR21,80 V1.90 V
DDR31.35 V1.50 V1.65 V
DDR41.05 V1.20 V1.35 V
A baixa tensão também é reforçada pela referência de tensão ICs antes de cada chip de memória para garantir que uma voltagem consistente é aplicada através de cada um deles individualmente, ao invés do módulo todo de uma vez. Com DDR3, aplicou-se uma fonte de tensão única em todo o módulo inteiro, que pode causar uma queda de tensão mais significativa, que afeta a estabilidade. Com este novo design qualquer queda de tensão é dependente do IC e pode ser corrigida.
O outro ajuste principal para fazer de DDR3 para DDR4 é a velocidade nominal. Especificações de JEDEC DDR3 começaram a 800 MTs e atravessou a 1600 MTs, enquanto alguns dos mais recentes processadores Intel DDR3 tem movido até 1866 e AMD até 2133. O JEDEC inicial do DDR4 para a maioria das plataformas dos consumidores e servidores é definida a 2133 MHz, juntamente com um aumento na latência, mas é projetado para assegurar que as transferências persistentes são mais rápidas, mas a latência total é comparável de DDR2 e DDR3. Tecnicamente, não há uma especificação DDR4-1600 para cenários que deseja que a memória de sebo e são imperturbáveis pelo desempenho real.
Como resultado deste aumento na velocidade, a largura da banda total é aumentada também.
Comparação da largura de banda
Clock BusTaxa interna
Taxa de transferênciaLargura do canal
DDR100-200 MHz100-200 MHz2n  0.20-0,40 GT/s1.60-3,20 GBps
DDR2200-533 MHz100-266 MHz4n  0,40-1,06 GT/s3.20-8,50 GBps
DDR3400-1066 MHz100-266 MHz8N  0,80-2.13 GT/s6,40-17,0 GBps
DDR41066-2133 MHz100-266 MHz8N  2.13-4.26 GT/s12,80-25.60 GBps
Latência move de DDR3-1600 CL 11 para DDR4-2133 no CL 15, que foi um salto esperado como JEDEC tende a aumentar o CL por 2 para um salto em freqüência. Enquanto ter uma latência de 15 clocks pode vir transversalmente como pior, o fato de que os clocks são a MTs 2133 garante que o desempenho geral é ainda comparável. Em DDR3-1600 e CL11, o tempo para começar a ler é 13,75 nanossegundos, comparados a 14,06 nanossegundos de DDR4-2133 no CL15, que é um salto de 2%.
Uma das coisas que irão compensar o aumento na latência é que CL15 parece ser um padrão comum não importa qual memória é de freqüência. Atualmente no mercado os módulos variam de DDR4-2133 CL15 até CL15 DDR4-3200 ou DDR4-3400 CL16, marcando uma latência de leitura até 9,375 nanossegundos. Com DDR3, vimos kits de Memória DDR3-2400 CL10 para 8,33 nanossegundos, mostrando que quanto maior a fabricação de memória durante a vida útil do produto a eficiência aumenta.
Outra diferença perceptível de DDR3 a DDR4 é o design do módulo em si.

DDR3 (superior) vs DDR4 (inferior)

 Como com a tecnologia de mais atualizações entalhes é deslocada para assegurar que o produto se encaixa no lugar certo, mas as mudanças do DDR4 são um pouco mais do que isso. DDR4 agora é um pacote com 288 pinos, passando de 240 pinos em DDR3. Como os módulos são do mesmo comprimento, isto significa uma redução na distância de pino-a-pino de 1,00 mm a 0,85 mm (com uma tolerância de Fractionária), diminuindo o contato total por pinos.
A outra mudança de grande projeto é os bits pegajosos no meio. Movendo-se de pinos 35 47 e volta de pinos 105 117, os contatos de pino recebem mais bem como o PCB por 0,5 mm.
Esta é uma mudança de inclinação ao invés de uma mudança muito rápida:
Inicialmente, ao lidar com estes módulos, há um problema, na verdade não os coloquem na ranhura corretamente quando usando uma placa-mãe com travas de faces únicas. Ao longo das últimas semanas, começa a fazer mais sentido colocar ambas as extremidades ao mesmo tempo devido a este projeto saliente, apesar do fato de que pode ser mais difícil de fazer quando em suas mãos e joelhos em um caso.
Juntamente com o tamanho do pino e arranjo, os módulos são ligeiramente mais altos que DDR3 (31,25 mm ao invés de 30.35 mm) para fazer o roteamento mais fácil e o PCB é mais grosso (1,2 mm de 1.0 mm) para permitir mais camadas de sinal. Isto tem implicações para projetos futuros, que mencionaremos mais tarde na revisão.
Há outros benefícios não-óbvios e considerações para mencionar.
DDR4 suporta uma baixa potência auto Self-refresh (listada na documentação como LPASR) que faz a coisa padrão de atualizar o conteúdo da memória, mas usa um algoritmo adaptável com base na temperatura, a fim de evitar o desvio de sinal. Os modos refrescantes de cada módulo também irão ajustar cada matriz independente como o controlador deve oferecer suporte a uma rotina de otimização refinada para coincidir também com quais partes da memória estão sendo usadas. Isto tem o poder, bem como a implicções de estabilidade para o futuro de longo prazo do design DDR4.
Módulo de treinamento quando o sistema arranca também é uma característica fundamental do DDR4. Durante a rotina de start-up, o sistema deve passar por tensões de referência para encontrar uma janela de passagem máxima para as velocidades selecionadas em vez de apenas aplicar a tensão nas opções. O treinamento vai passar a referência de tensão em passos de 0,5% do VDDQ (tipicamente 1, 2V) para 0,8% e a tolerância de ajuste do módulo deve ser dentro de 1,625%. Erros de calibração são plausíveis no tamanho de um passo (9.6 mV a 1.2 v) mas também a perda de margem do pântano devido a um erro de calibração deve ser considerada. Isto é devido a maior implicação das perdas devido a margens e tolerâncias e garante um funcionamento estável durante o uso. A desvantagem para o usuário é que o número de módulos do sistema afeta o tempo de inicialização do dispositivo. Um sistema de Haswell-E totalmente carregado quad-channel acrescenta outros 5-8 segundos para executar este procedimento, e é algo que não pode ser contornado através de uma rotina diferente, sem desconsiderar a parte das especificações.

DDR4 destina-se também com o futuro em mente. Memória atual no mercado, exceto o que vimos com Memória inteligente, é uma solução de morrer monolítico. A especificação da base JEDEC permitirá empilhamento de pentes 3D através vias-de-silicone (TSVs) qualquer fabricante de memória que quiser seguir esse caminho vai aumentar a densidade do módulo. Para oferecer suporte a esse ajuste há 3 sinais de selecionar chip, elevando o total de bits selecionar banco para 7, para um total de 128 bancos possíveis. Nas atuais especificações UDIMM, há provisão para até 8 morre empilhada, porém DDR4 é listado apenas para oferecer suporte a x4/x8/x16 ICs com capacidades de 2, 4, 8 e 16 ContrachavetaÉ (gibibit). Isto sugere que a configuração morrer empilhado é mais adequada para dispositivos onde as dimensões de x-y são um prémio, ou nos mercados de servidor. Quando se trata de módulos de maior capacidade, já informamos que 16 GB UDIMMs devem estar chegando ao mercado, que representa um arranjo de rank 8 * 16 Gb dual.Estamos trabalhando para certificar-se de que podemos relatar sobre estes tão logo, no entanto quando se trata de maior densidade de partes UDIMM (ou seja, não RDIMM ou LRDIMM) talvez tenhamos que começar a olhar para as tecnologias mais recentes.

Se você apreciou esse artigo, não se esqueça de compartilhar e opinar nos comentários e em nosso fórum! Erramos em alguma coisa? Há algo mais a ser implementado? Comente!


Nenhum comentário:

Postar um comentário

Tecnologia do Blogger.