41
Evolução das CPUs: Dual e Quad Core ... os computadores sequenciais estão se aproximando do limite físico fundamental em sua energia potencial computacional. Tal limite é a velocidade da luz... Angel L. DeCegama Cesar Sposito Mário J. Filho Rodrigo Ferrassa EACH

Evolução das CPUs: Dual e Quad Core - Stoa Social · Processadores Futuros (Roadmaps) Arquitetura Processador Clock Núcleos Processo Cache TDP Previsão Intel Nehalem Core i7 2,6

Embed Size (px)

Citation preview

Evolução das CPUs: Dual e Quad Core

... os computadores sequenciais estão se aproximando do limite físico fundamental em sua energia potencial computacional. Tal limite é a velocidade da luz...

Angel L. DeCegama

Cesar SpositoMário J. Filho

Rodrigo Ferrassa

EACH

Introdução – Limite: Pentium IV

Desafio: Aumento frequência de clock. Corrida por clock (Intel X AMD). Athlon Thunderbird X Pentium III. Intel: Movimento arriscado. Investimento em um processador com um longo pipeline. Pentium IV.

EACH

Pentium IV: longo pipeline

Pipeline é uma técnica de hardware que permite que a CPU realize a busca de uma ou mais instruções além da próxima a ser executada.

Pentium III: 10 estágios. Pentium IV: 20 estágios a 31 estágios. Dobrar o número de estágios no

processador é como dobrar o número de funcionários de uma empresa.

EACH

Longo pipeline: Consequencias

Com mais estágios, o processador seria capaz de atingir freqüências mais altas.

Adicionar mais estágios tornou o processador menos eficiente, pois as instruções precisavam do dobro do número de ciclos do processador para serem processadas.

Possuir o dobro de estágios significa também possuir aproximadamente o dobro de transistores e consumir o dobro da eletricidade.

EACH

Mais consumo – Maior aquecimento

Maior consumo gera maiores desperdícios. Maior desperdicio gera maiores

aquecimentos. A dissipação térmica (W/cm^2) de um

Pentium 4, é próximo do núcleo de um reator nuclear.

Se a produção de processadores continuasse da mesma forma, num futuro não muito distante, teríamos um processador com dissipação térmica próxima a da superfície solar.

EACH

AquecimentoEACH

Fonte: http://blogs.intel.com

A barreira dos 3.4 GHZ

Desde 1983 até 2002, as taxas de frequência de clock aumentaram de 5 MHz para 3 GHz.

Aumento do clock 600 X em 19 anos. Na época, a Intel previa alcançar 5.2 GHz no

final de 2004 e planos para 10 GHz no final de 2005.

Porém, nada disso aconteceu. Os 3.4 GHz se tornaram uma barreira difícil de transpor.

Fim da Lei de Moore?

EACH

Hyper Treading: Inicio do processamento paralelo

Hyper Treading: simula em um único processador físico dois processadores lógicos.

Pode melhorar desempenho de até 30% Utiliza as partes ociosas dos recursos para

simular dois núcleos.

EACH

Evolução

Elevando, por exemplo, em 20% a freqüência do processador, aumentamos apenas em 13% o seu desempenho e como efeito colateral, também passa a consumir 73% mais energia.

Recíproca verdadeira.

EACH

EstratégiaEACH

Reduzindo a freqüência em 20%, perdemos apenas 13% de desempenho e reduzimos em 49% o consumo de energia.

Se reduzíssemos em 20% o clock e colocássemos dentro da mesma pastilha dois processadores?

Estratégia: Multiplos NúcleosEACH

Teríamos um processador de dois núcleos com 73% mais desempenho e consumindo praticamente a mesma coisa (~2% mais energia).

Processadores multicore podem simultaneamente executar múltiplas tarefas computacionais.

Single-Core X Dual-CoreEACH

Fonte: http://blogs.intel.com

Nova ArquiteturaEACH

“Caminhou bastante, porém para o lado e não para a frente” (National Instruments).

Pentium III

Pentium IV

Pentium D

Core 2 Duo

Quad Core

NetBurst Core

Arquitetura CoreEACH

Somando-se a estratégia de lançar processadores de múltiplos núcleos, a nova arquitetura interna do processador também foi importante.

Maior eficiência de execução de instruções por ciclo de CPU.

Maior desempenho e menor consumo. A arquitetura Core consegue desempenho

superior aos da microarquitetura Netburst (anterior) com o clock muito inferior.

Arquitetura CoreEACH

Derivada do Pentium III – Pentium M. Pipeline de 14 estágios. Cache de memória L2 é compartilhado. Pré-buscas são compartilhadas, se o

controlador de cache carregar um bloco de dados para ser usado pelo primeiro núcleo, o segundo núcleo também pode usar o dado já carregado.

Aprimoramento da unidade de pré-busca do processador (“Melhor Chute”).

Arquitetura CoreEACH

Quanto menor o número de instruções a serem executadas, mais rápido o computador realizará a execução da tarefa além de consumir menos.

O decodificador de instruções do Pentium IV pode decodificar três instruções por pulso de clock, já o do Core 2 Duo (Arquitetura Core) 4.

Arquitetura CoreEACH

Novo conceito: Fusão de instruçõesload eax, [mem1]

cmp eax, [mem2]

jne target

load eax, [mem1]

cmp eax, [mem2] + jne target

Graças ao conceito de fusão de instruções o decodificador de instruções da arquitetura Core consegue fundir 2 instruçoes enviar 5 por pulso de clock.

Arquitetura CoreEACH

E mais! Unidade de ponto flutuante (FPU) e uma

unidade lógica e aritmética (ALU) extras. Caminho de dados real de 128 bits. Desambiguação de memória. Chaveamento Elétrico Avançado. Etc.

EACH

Quad Core

Quad CoreEACH

- É uma das versões de processadores da Intel mais recente apresentada com núcleos Kentsfield(65nm) e Yorkfield(45nm).

- O clock pode alcançar até 3.33Ghz. Em overclocking, com cooler de ar, até 4.0Ghz, e na água até 5Ghz.

- Exemplos: Core 2 Quad, Core 2 Extreme: quad-core, Quad-Core Xeon.

Quad CoreEACH

- Multi-Chip: Duas pastilhas de silício (1 núcleo em cada) encapsuladas junto: Comunicação externa .

- Monolítica: Uma pastilha de silício integra 2 núcleos encapsulados: Comunicação interna.

- Monolítica Multi-Chip: Duas pastilhas de silício (2 núcleos em cada) encapsuladas: Comunicação interna e externa.

Quad CoreEACH

Quad Core – JogosEACH

Quad Core – JogosEACH

EACH

Quad Core - Exemplos

EACH

Aquecimento: Netburst X Core Pentium D

Pentium Extreme Edition

Aquecimento: Netburst X Core EACH

Core 2 Duo

Core 2 Extreme

Core 2 Quad

EACH

Arquitetura Core – Processadores

Dual/Quad/Six Core Xeon

Arquitetura Core – NúcleosEACH

EACH

AMD: Athlon 64 X2• Primeiro processador com dois núcleos da AMD.• Deriva do Athlon 64.

EACH

AMD: Athlon 64 X2

EACH

AMD: Athlon 64 X2

EACH

AMD: Phenom X3/X4

• Três ou Quatro núcleos independentes.• Os núcleos se comunicam internamente

dentro da pastilha.• Controlador de memória integrado.• Tecnologia HT.

EACH

AMD: Phenom X3/X4

Considerações FinaisEACH

Por 10 anos os aumentos de desempenho vieram à custa do uso cada vez mais ineficiente do uso de energia.

A partir de 2001, a taxa de crescimento de desempenho pareceu ter reduzido. Se essa diminuição será ou não temporária ainda é uma questão obscura.

Arquitetos estão usando técnicas cada vez mais complexas para tentar explorar mais paralelismo a nível de instrução.

J L Hennessy e D A Patterson

Considerações FinaisEACH

Com essa estratégia em mente, os fabricantes de processadores tem o desafio de continuar entregando a melhor relação desempenho/Watts.

A Intel propõem melhorar sempre, em um ano a microarquitetura, no ano seguinte a miniaturização, e assim por diante.

Considerações FinaisEACH

Fonte: http://blogs.intel.com

Considerações FinaisEACH

2007 a Intel lança os primeiros processadores para servidores fabricados com a tecnologia de 45nm.

2008 foi o ano do Nehalem, que foi o nome código da nova microarquitetura, que permitirá um outro passo importante, para manter viva a Lei de Moore.

Processadores Futuros (Roadmaps)

Arquitetura Processador Clock Núcleos Processo Cache TDP PrevisãoIntel

Nehalem Core i7 2,6 - 3,2 Ghz 4 por padrão 45nm 1 a 8mb 130W – 150W Novembro-08Westmere - - 6 por padrão 32nm 1 a 12mb - 2009/2010

Sandy Bridge - - 4 – 8 32nm 8 a 24mb - 2010/2011Haswell - - 8 por padrão 22nm - - 2012

AMDBarcelona Opteron - 4 65nm 2mb - 2008Shanguai Opteron/Phenom - 4 45nm 6mb - 2008/2009Istambu Phenom - 6 45nm 6mb - 2009Magny-Cours - - 12 45nm 12mb - 2010São Paulo - - 6 45nm 6mb - 2010

EACH

Considerações Finais

BibliografiaEACH

J L Hennessy e D A Patterson HENSON Valerie - The Kernel Hacker's

Bookshelf: Ultimate Physical Limits of Computation

INTEL - http://www.intel.com/portugues/ products/ processor/index.htm

BLOGS INTEL - http://blogs.intel.com FAPESP - http://www.agencia.fapesp.br NATIONAL INSTRUMENTS -

http://digital.ni.com/worldwide/brazil

BibliografiaEACH

CLUBE DO HARDWARE - http://www.clubedohardware.com.br/

PC FÓRUM - http://www.pcforum.com.br/ FÓRUM PC - http://forumpcs.ig.com.br/home Vasconcelos, Laércio – Introdução aos

processadores dual core e quad core