Upload
lamthu
View
222
Download
0
Embed Size (px)
Citation preview
PROCESSADORES INTEL E AMD
AGENDA
Introdução
Conceitos básicos Microprocessadores
Histórico dos processadores X86 (Intel e AMD)
Linha evolutiva dos processadores
Mercado de processadores
Breve Comparativo Intel x AMD
Resumo Processador Celeron
Processadores 64 bits
Conclusões
Bibliografia e sites relacionados
RESUMO EVOLUÇÃO INTEL X AMD8088 / 8086
80286
80386
80486
Pentium
Pentium Pro
Pentium II
Pentium III
AMD 386
AMD 486
AMD K5
AMD K6
AMD K6-II
AMD K6-III
Celeron(Pentiums limitados) AthlonPentium IV Duron
Semprom
EVOLUÇÃO X86
Nome Data Transistores
• 8086 1978 29K– Processador de 16-bit. Base para o IBM PC & DOS
– Limitado a 1MB de espaço de endereçamento. DOS disponibiliza ao usuário apenas 640K
• 80286 1982 134K– Modo de endereçamento mais complexo, mas não muito útil
– Base para IBM PC-AT e Windows
• 386 1985 275K– Extensão para 32 bits. Adicionado um novo tipo de endereçamento
– Capaz de rodar Unix (modos Real, Protegido)
EVOLUÇÃO X86
• Nome Data Transistores
• 486 1989 1.9M
• Pentium 1993 3.1M
• Pentium II/MMX 1997 4.5M– Adicionada uma coleção especial de instruções para operar em vetores
de 64-bit de dados inteiros de 1, 2, ou 4 bytes
• PentiumPro 1995 6.5M– Adionadas as instruções de mov condicional
– Grande mudança na microarquitetura
• Preempção de tarefas (saltos)
EVOLUÇÃO X86
• Nome Data Transistores
• Pentium III 1999 8.2M– Adicionadas instruções “streaming SIMD” para operar sobre vetores de
128-bits de dados inteiro ou ponto flutuante de 1, 2 ou 4 bytes
• Pentium 4 2001 42M– Adicionados formatos de 8-bytes e 144 novas instruções para o modo
streaming SIMD
EVOLUÇÃO AMD
1975 1979
8080A 8086
1982
286
1991
Am386
1993
Am486
1995
AMD-K5™
1997
AMD-K6®
1999
AMD Athlon™
2002
Transistores 5k 29k 134k 275k 1.200k 3.500k 9.300k 22.000k 37.000k
AMD Athlon XP™
2003
0.80um 0.35um 0.25um 0.18um 0.13um
0.13um -> 0.09um
10um
100.000k Transistores
2004
+
2005
EVOLUÇÃO AMD
1991 1992 1993 1994 1995 1996 1997 1998
1999 2000 2001 2002 2003 2004 2005 2006
am386 am486
+
ARQUITETURA INTERNA DE
MICROPROCESSADOR
ARQUITETURA 8086
– arquitetura de 16 bits
• comunicação com a memória em 16 bits (8086)
• capacidade máxima de memória de 1 MByte
• 14 registradores (4 dados, 4 endereços, 4 segmentos, ponteiro
do programa, flags)
• endereço físico = segmento * 16 + deslocamento
• 85 instruções básicas
• coprocessador: 8087 (67 instruções básicas)
• sem cache, sem memória virtual
– 8088 - mesma arquitetura, barramento externo de 8 bits
8086 - primeiro microprocessador
de 16 bits da Intel
CARACTERÍSTICAS DA ARQUITETURA 8086
CARACTERÍSTICAS DA ARQUITETURA 8088
CARACTERÍSTICAS DA ARQUITETURA 8086
CARACTERÍSTICAS DA ARQUITETURA 8086
15 8 7 0
AX AH AL acumulador
BX BH BL base
CX CH CL contador
DX DH DL dado
SP ponteiro para pilha
BP ponteiro base
SI índice fonte
DI índice destino
IP apontador de instruções
FLAGS flags
CS segmento de código
DS segmento de dados
SS segmento de pilha
ES segmento extra
Dados
Endereços
Segmento
REGISTRADORES DE SEGMENTO 8086
• São registradores de endereços;
• Armazena endereços de programa e dados;
• Organização de memória:
– Cada byte na memória possui um endereços de 20 bits iniciando em 0
até 220-1 ou seja, 1M de memória endereçável;
– Endereços são representados por 5 dígitos hexadecimais; de 00000 -
FFFFF
– Problema: 20 bits de endereços é grande demais para ser colocado em
registradores de 16 bits;
– Solução: Segmentação de memória
• Blocos de memória de 64K consecutivos (65.536);
• Um número de segmento é um número de 16 bits;
• Faixa de um endereços de um segmento vai de 0000 a FFFF
• Em um segmento, uma posição de memória em particular é especificado
como sendo um offset (deslocamento);
• Um offset também tem faixa de 0000 a FFFF
CARACTERÍSTICAS DA ARQUITETURA 8086
SEGMENTAÇÃO DE MEMÓRIA NO 8086
00000
10000
20000
30000
40000
50000
60000
70000
80000
90000
A0000
B0000
C0000
D0000
E0000
F0000
8000:0000
8000:FFFF
seg ofs
8000:0250
0250
one segment
GERAÇÃO DE ENDEREÇO FÍSICO
GERAÇÃO DE ENDEREÇO FÍSICO
• Registrador de segmento * 16 + offset
Physical Address (20 Bits)
Adder
Segment Register (16 bits) 0 0 0 0
Offset Value (16 bits)
ORGANIZAÇÃO DE MEMÓRIA
Bloco Dados
01 Área de memória para o usuário (64 Kb)
02 Área de memória para o usuário (128 Kb)
03 Área de memória para o usuário (192 Kb)
04 Área de memória para o usuário (256 Kb)
05 Área de memória para o usuário (320 Kb)
06 Área de memória para o usuário (384 Kb)
07 Área de memória para o usuário (448 Kb)
08 Área de memória para o usuário (512 Kb)
09 Área de memória para o usuário (576 Kb)
10 Área de memória para o usuário (640 Kb)
11 Memória de Vídeo
12 Memória de Vídeo
13 Área de Extensão da ROM
14 Área de Extensão da ROM
15 ROM-BIOS do sistema
16 ROM-BIOS do sistema e ROM-BASIC
MICROPROCESSADOR INTEL 80286– Praticamente a mesma arquitetura do 8086
– Data bus 16 bits (D0 – D15), Address bus 24 bits (16Mb memória)
– Modos real (8086) e protegido (memória vitual & 16Mb memória)
– 4 Unidades funcionais• EU – Unidade de execução de Instruções
• BU – Unidade de Acesso e Controle de Barramento
• IU – Unidade de decodificação de instruções
• AU – Unidade de Formação de endereços
– Comunicação com a memória em 16 bits
– 14 registradores (os do 8086)
– Endereço físico ou virtual
– 15 instruções extras (92 + 15 = 107 instr. básicas)
– Co-processador: 80287
– Sem cache
– Memória virtual segmentada (apenas no modo protegido)
– Maior parte dos programas desenvolvidos para modo Real
MICROPROCESSADOR INTEL 80386
– Modos real (8086), protegido e virtual86
– 6 Unidades funcionais• EU – Unidade de execução de Instruções
• BU – Unidade de Acesso e Controle de Barramento
• IU – Unidade de decodificação de instruções
• PU – Unidade de pre-fetch com fila de até 16 bytes
• PgU – Unidade de formação de endereços (paging unit)
• SU – Unidade de formação de endereços (segmentation unit)
– Comunicação com a memória
• 16 (SX) ou 32 bits (DX)
• Capacidade máxima de memória de 4 GByte
– 14 registradores
• do 8086, com 32 bits, e mais 2 regs. de segmento
– 44 instruções extras
• 107 + 44 = 153 instruções básicas
– Endereço físico ou virtual (64 TByte)
• Memória virtual segmentada (sempre) e paginada (opcional), ambas
apenas no modo protegido
MICROPROCESSADOR INTEL 8038615 8 7 0EAX AH ALEBX BH BL
ECX CH CL
EDX DH DL
ESP
EBP
ESI
EDI
EIP
EF
CS
DS
SS
ESFSGS
1631acumulador
base
contador
dado
ponteiro para pilha
ponteiro base
índice fonte
índice destino
apontador de instruções
flags
segmento de código
segmento de dadossegmento de pilhasegmento extra
segmento extrasegmento extra
MICROPROCESSADOR INTEL 80386Conceito do Memória Virtual
grande espaço de endereçamento
pequeno
espaço de
endereçamento
endereço gerado
pelas instruções
sendo executadas
mapeamento
por hardware
MICROPROCESSADOR INTEL 80386Questões da Memória Virtual:
• quando mover um bloco da memória secundária para a memória
primária (real) ?
– por demanda
• quando mover um bloco da memória real para a memória secundária?
– quando faltar espaço na memória real
• qual o tamanho ideal de um bloco?
– constante (paginação) ou variável (segmentação)
• onde colocar um novo bloco transferido para a memória principal?
– onde houver área livre (paginação) ou no “melhor” lugar (segmentação)
MICROPROCESSADOR INTEL 80386Dinâmica da Memória Virtual:
• programa gera endereço virtual
– CPU transforma endereço virtual em endereço físico (hardware)
• bloco está na memória principal?
– Sim: calcular o endereço físico (hardware)
– Não: buscar o bloco da memória secundária (software)
• existe espaço para o bloco na memória principal?
– Sim: carregar o bloco e atualizar descritor (software)
– Não: retirar um outro bloco, carregar o bloco e atualizar descritores (software)
MICROPROCESSADOR INTEL 80386
Memória Virtual Segmentada: (Segmentação => Converte endereços
lógicos em endereços lineares)
0
(
g
l
o
b
al
o
u
l
o
c
al
)s
e
g
m
315 31 04
Seletor de tabela
(Global ou Local)
Registrador de segmento Deslocamento
031Tabela de descritores
Descritor
de segmento
(8 bytes)
Endereço base
(32 bits)
(32 bits)
Endereço linear
+
GDTR ou LDTR
endereço lógico
ou virtual
endereço linear
(ainda não é o físico)
CS
DS
SS
ES
...
(Global ou Local)
(Caso a paginação não esteja sendo utilizada, se converte em endereço físico)
MEMÓRIA VIRTUAL SEGMENTADA
• programa gera endereço virtual
– CPU transforma endereço virtual em endereço físico
• segmento está na memória principal?
– Sim: calcular o endereço físico. Se este endereço estiver fora do segmento,
gerar erro
– Não: buscar o segmento da memória secundária
• existe espaço suficiente para o o segmento na memória principal?
– Sim: carregar o segmento na “melhor posição” e atualizar descritor
– Não: retirar um (ou mais) segmentos, carregar novo segmento e atualizar
descritores
MEMÓRIA VIRTUAL PAGINADA
PDE
(32bits)
031
Endereço linear
22 21 12 11
Diretório Página Deslocamento
Diretório de Páginas
(PD)
PTE
(32 bits)
Tabela de Páginas
(PT)
CR3
031
Endereço físico
12 11
DeslocamentoEndereço de page frame
...
(Paginação => Converte endereços lineares em endereços físicos)
Tabelas
(1024 x 32)
(PT)...
MEMÓRIA VIRTUAL PAGINADA
• programa gera endereço virtual
– CPU transforma endereço virtual em endereço físico
• página está na memória principal?
– Sim: calcular o endereço físico. Este endereço sempre está dentro da
página.
– Não: buscar a página da memória secundária
• existe espaço suficiente para a página na memória principal?
– Sim: carregar a página em qualquer lugar e atualizar descritor
– Não: retirar uma página (é suficiente), carregar nova página e atualizar
descritores
MICROPROCESSADOR INTEL 80386
• outras características
– Co-processador: 80387 (67 + 7 -1 = 73 instr. básicas)
– Sem cache
– TLB:
• pequena memória associativa que retém os últimos e mais freqüentes
endereços de página acessado
• uma pequena cache de endereços físicos
• apareceram vários microprocessadores compatíveis no mercado
– AM386
MICROPROCESSADOR INTEL 80486
• Idêntico ao 386
– Modos real (8086), protegido e virtual86
– Comunicação com a memória em 32 bits
– Capacidade máxima de memória de 4 GByte
– 16 registradores (os do 80386, também em 32 bits)
– 6 instruções extras (151 + 6 = 157 instruções básicas)
– Endereço físico ou virtual
• Memória virtual segmentada
• e paginada (opcional)
– Co-processador: 80487 (para 80486SX) integrado no
80486DX
– Com cache de 8 KByte FPU
MICROPROCESSADOR INTEL PENTIUM
• Reestruturação do 486
– Modos real (8086), protegido e virtual86
– 16 registradores (os do 80386, também em 32 bits)
– Memória virtual segmentada e paginada
• Comunicação com a memória em 64 bits
• Capacidade máxima de memória de 4 GByte
• 5 instruções extras (157 + 5 = 162 instr. básicas)
• FPU: coprocessador aritmético integrado
• Cache de 16 KByte (2 x 8 KByte)
MICROPROCESSADOR INTEL PENTIUM
• 2 pipelines para inteiros, operando em paralelo
• cada pipeline inteiro consta de 5 estágios:
– busca de instrução (a partir da cache de instruções),
– decodificação de instrução,
– geração de endereço,
– execução,
– escrita (write back).
• FPU também em pipeline (mas não em paralelo)
• operação super-escalar: mais de uma instrução
pronta em um ciclo de relógio
MICROPROCESSADOR INTEL PENTIUM
BIU
Cache Instr.
ALU
FPU
Registradores
Buffer de
instruções
barramentos de 64 bits
externos e internos
caches separadasdados e instr.
8 KB cada
bus interface
unit
2 pipelines paralelosde 5 estágios
para inteiros
ALU
Cache Dados
BTB
reg.
stack
+
÷U-pipe
V-pipe
FPU-pipe
com circuitosdedicadospara soma,divisão e
multiplicação
MICROPROCESSADOR INTEL PENTIUM PRO
(P6)
• Re-estruturação do Pentium (P5)
– Mesmas características de 80386 (mem. virtual) e do
Pentium (largura de dados de 64 bits)
– FPU
– cache de 16 KByte (2 x 8 KByte)
• 5 instruções extras (162 + 5 = 167 instr. básicas)
• Operação super-escalar
• 14 unidades internas
• Execução fora de sequência
• Execução especulativa
Microprocessador Intel Pentium MMX
• Arquitetura do Pentium (P5)
– Novo tipo de dado: “packed”
– 57 instruções extras (além das 167 instr. básicas)
– Com cache de 32 KByte (2 x 16 KByte)
– Operação super-escalar
– Não possui as características do Pentium Pro (execução
fora de sequência, exec.especulativa)
– Instruções para processamento de vetores (8 bytes, 4
palavras ou 2 palavras duplas)
– 8 novos registradores lógicos (MMX0 a MMX7)
Intel Pentium II (P6)
• Pentium Pro com MMX
– Mesmas características do Pentium Pro
– Instruções MMX
– Cinco unidades internas
– Execução fora de sequência
– Execução especulativa
Pentium
ProMMX
PentiumII
Intel Pentium III
– Novo tipo de dado: “floating packed” (Ponto flutuante)
– 70 instr. extras (além das 167 básicas e 57 MMX)
– Instruções para processamento de vetores inteiros (MMX)
ou de ponto flutuante (SSE)
– 8 novos registradores físicos (XMM0 a XMM7), de 128 bits,
para as instruções SSE
– No de série do processador (Inst. CPUID)
Intel Pentium 4
• Lançado em novembro de 2000
Pipeline de 20 estágios (“hyper pipeline”)
Até 128 instruções em execução (3 vezes mais que
no Pentium III)
Algoritmo melhorado para previsão de desvios, com
tabela de 4K
Novo sistema de cache de nível 1
Cache de execução de 12 K micro-operações
(Execution Trace Cache)
Cache de dados de 8 KBytes
Intel Pentium 4
• Instruções SSE2 (Streaming SIMD Extensions 2) -
144 novas instruções
– 67 instruções para vetores de pontos flutuante de precisão
dupla (64 bits)
– 69 novas instruções MMX, para vetores inteiros de 128 bits
(utilizando os registradores XMM)
– 8 instruções para controle de cache
Barramento do sistema “Net Burst” de 400 MHz
Intel Pentium 4 - Diagrama Resumido
MERCADO DE PROCESSADORES
Low –End Destinado à construção de máquina de baixo poder computacional
Usuário iniciante (Celeron D (Intel), Semprom (AMD)
Mid-Range Destinado à construção de máquinas de maior poder computacional
Ferramentas CAD, design house Pentium IV (Intel), Athlon (AMD)
High-End Destinado à maquinas de alto poder computacional e compartilhamento
Servidores de Rede
Gerenciamento de Clusters Pentium HT (Intel), Athlon 64 D (AMD)
COMPARATIVO ENTRE PROCESSADORES INTEL E AMD
Intel foi isoladamente a líder em fabricação de CPUs até
início dos anos 90
Até a fabricação do 80286 Não houve concorrência da AMD
Concorrência começou devido a fabricação do AM386 DX
Intel Pentium X AMD AM5x86
Intel Pentium, Pentium PRO X AMD K5
Equivalente mas lançado 3 anos depois do Pentium
Intel Pentium MMX, II X AMD K6
Vantagem AMD: Mais barato
Intel Celeron X AMDK6
Celeron:Versão “light” do Pentium II
Intel Celeron X AMD Sempron
ESTADO DA ARTE EM PROCESSADORES
• AMD
• Desktop: AMD Athlon 64 FX,
AMD Athlon 64
• Server: AMD Opteron
• Intel
• Desktop: Intel Pentium 4 w/
HT, Intel Pentium 4 Extreme
Edition
• Server: Intel Itanium 2, Xeon
RESUMO PROCESSADORES CELERON
Os processadores Celeron diferenciam-se dos processadores
Pentium II, III e IV pela limitação das seguintes características:
Tamanho da Cache L2
Clock interno
Clock do barramento externo
RESUMO PROCESSADORES CELERON
Modelo Nome-código
Baseado no Cache L1
Cache L2
Tecnologia
Barramento Externo
Soquete
Celeron SEPP Convington
Pentium II com
núcleo Deschutes
32KB - 0.25µm 66MHz Slot 1
Celeron A Mendocino Pentium II com
núcleo Deschutes
32KB 128KB 0.25µm 66MHz Slot 1
Celeron PPGA Mendocino Pentium II com
núcleo Deschutes
32KB 128KB 0.25µm 66MHz Soquete 370
Celeron Coppermine
Coppermine
Pentium III com
núcleo Coppermine
32KB 128KB 0.18µm 66MHz / 100MHz
Soquete 370
Celeron Tualatin
Tualatin Pentium III com
núcleo Tualatin
32KB 256KB 0.13µm 100MHz Soquete 370
Celeron Willamette
Willamette Pentium 4 com
núcleo Willamette
8KB 128KB 0.18µm 400MHz Soquete 478
Celeron Northwood
Northwood
Pentium 4 com
núcleo Northwood
8KB 128KB 0.13µm 400MHz Soquete 478
Celeron D Prescott Pentium 4 com
núcleo Prescott
8KB 256KB 0.09µm 533MHz Soquete 478 / Soquete 775
RESUMO PROCESSADORES CELERON D
Processador Clock Interno Clock Externo Cache L2 Soquete Hyper-Threading
350 3,2 GHz 533 MHz 256 KB 478 ou 775 Não
345 3,06 GHz 533 MHz 256 KB 478 ou 775 Não
340 2,93 GHz 533 MHz 256 KB 478 ou 775 Não
335 2,80 GHz 533 MHz 256 KB 478 ou 775 Não
330 2,66 GHz 533 MHz 256 KB 478 ou 775 Não
325 2,53 GHz 533 MHz 256 KB 478 ou 775 Não
RESUMO PROCESSADORES SEMPRON
Processador Clock Interno Clock Externo Cache L1 Cache L2 Soquete
Sempron 2200+ 1,50 GHz 333 MHz 128 KB 256 KB 462
Sempron 2300+ 1,58 GHz 333 MHz 128 KB 256 KB 462
Sempron 2400+ 1,67 GHz 333 MHz 128 KB 256 KB 462
Sempron 2500+ 1,70 GHz 333 MHz 128 KB 256 KB 462
Sempron 2600+ 1,83 GHz 333 MHz 128 KB 256 KB 462
Sempron 2800+ 2 GHz 333 MHz 128 KB 256 KB 462
Sempron 3000+ 2 GHz 333 MHz 128 KB 512 KB 462
RESUMO PROCESSADORES CELERON
Exemplo: Celeron D
16Kb Cache L1
256Kb Cache L2
Clock ext. 533MHz (Burst 133MHz)
Clock int. 2,13 GHz a 3,2 GHz
Suporte Hyper – Threading => não disponível
INTEL EXTREME EDITION
INTEL EXTREME EDITION
Características:
•Primeiro processador desktop da Intel com tecnologia dual-core.
•Basicamente é evolução do Pentium IV
•Hyper-Threading (HT) : 2 processadores (lógico + Físico)
•Processador dual-core : 4 processadores (2 lógicos + 2 Físicos)
•Hyper-Threading + dual-core: execução de 4 threadssimultaneamente
INTEL EXTREME EDITION
•Processador “lógico”
•barramentos, caches e unidades de execução são compartilhados
•cada processador lógico tem estado próprio, bem como registradores de propósitos gerais.
•Processador físico
•tem seus próprios conjuntos de registradores e caches.
INTEL EXTREME EDITION
•Cache
•2 caches de 16KB (L1).
•2 caches de 1 MB (L2), sendo 1 MB para cada core.
•principal vantagem: redução do tráfego do barramento.
•Trace cache
•cada core tem uma trace cache de até 12KB de micro-operações já decodificadas.
•principais vantagens: remoção da etapa de decodificação em loops e em execução de desvios.
INTEL EXTREME EDITION
•Segurança: bit para desabilitar execução:
•recurso aliado ao S.O
•define áreas ativas ou não-ativas de memória.
•Conjunto de instruções
•instruções dedicadas ao processamento de imagens e compressão de dados
•mantém compatibilidade com IA-32.
•Gerenciamento de energia: capacidade de desligamento de pinos e outras partes do chip.
INTEL EXTREME EDITION
Perspectivas:
•Aumento da velocidade do barramento PCI e AGP (média de 3.5 vezes).
•Facilidades para os softwares multi-threads do futuro.
•Dual-core : será base para as pesquisas da Intel nas tecnologias Hyper-Threading e EM64T.
AMD ATHLON 64
AMD ATHLON 64
Resumo Processadores AMD Atuais Desktop
Semprom (Low End)
Athlon 64 (Mid Range)
Athlon 64 FX
Athlon 64 X2
Notebooks Athlon 64 Mobile
Turion 64
Servidores Opteron
AMD ATHLON 641975 1979
8080A 8086
1982
286
1991
Am386
1993
Am486
1995
AMD-K5™
1997
AMD-K6®
1999
AMD Athlon™
2002
Transistores 5k 29k 134k 275k 1.200k 3.500k 9.300k 22.000k 37.000k
AMD Athlon XP™
2003
0.80um 0.35um 0.25um 0.18um 0.13um
0.13um -> 0.09um
10um
100.000k Transistores
2004
+
2005
AMD ATHLON 64
UCP‘North
Bridge’
L1/L2 L3
‘South
Bridge’
USB
E/ISA
Bus E / ISA
Bus PCI
REDE
LAN
Bu
s S
CS
I
Adaptador
SCSI
Super
I/O
Interface
Gráfica
ROM
BIOS
RA
M
PCI
I/O
PCMCIAInterface
Som
CD-ROM
CD-ROM
HD
HD
Scaner
Floppy
Mouse
RA
M
AG
P
COM
LPT
AMD ATHLON 64
Novas características incorporadas
1MB L2 Cache
Controlador de Memória DDR incorporado
HyperTransport Channel
Menor consumo de potencia
Novo Core Processador
Registradores em dobro
Pipeline maior (10 12 estágios)
Maior “Look Aside Buffer” (TLB)
AMD64 ArchitectureRegister Differences: AMD64 vs x86
• AMD64
– 64-bit integer registers
– 48-bit Virtual Address
– 40-bit Physical Address
• REX - Register Extensions
– Sixteen 64-bit integer registers
– Sixteen 128-bit SSE registers
• SSE2 Instruction Set
– Double precision scalar
and vector operations
– 16x8, 8x16 way vector
MMX operations
– SSE1 already added with
AMD Athlon MP
RAX
63
G
P
R
x
8
7
079
31
AHEAX AL
0715In x86
MMX0S
S
E
127 0
MMX7
EAX
EIP
Added by AMD64
EDI
XMM8
MMX8
MMX15
R8
R15
32-bit
Um Processador AMD64 pode rodar sistemas operacionais de 32 ou 64 bits
START
BOOT UPUsing 32 bit BIOS
Lookat OS
Load 32 bit OS
Run 32 bitApplications
Load 64 bit OS64-bit
Run 32 & 64bit apps
OS for x64-based Systems32-bit and 64-bit on a single platform
Características da arquitetura AMD64
• Processamento nativo em 32 e 64 bits
• Controlador de memória DDR integrado ao processador
• Tecnologia Hyper Transport
• Cool’n’quiet (PowerNow! para servers e mobile)
• Proteção anti-vírus por hardware
• Benefícios
• Excelente desempenho
• Melhor custo/benefício
• Sistemas mais confiávies
• Preparado para software de 64 bits
Arquitetura do sistema com AMD64
Sistema típico
CPU
North
Bridge
South
Bridge
PCIIDE, FDC,USB, Etc.
DDR
Sistema AMD64
CPU
AMD64
PCI Bridge -
Túnel HT
I/O
Hub
IDE, FDC,USB, Etc.
DDR
PCI-X
PCI Express
PCI
PCI
Bridge
PCI-X
PCI Express
Processadores AMD64 de dois núcleos
Diferenças na fabricação e compatibilidade de socket e placa
Núcleo • Athlon 64
• Athlon 64 FX
• Sempron
• Opteron
• Turion
Processador “single-core”
Processador “dual-core”
Núcleos
• Athlon 64 X2
• Opteron
Placa mãe
Processadores AMD64 de dois núcleos
Diferenças na fabricação e compatibilidade de socket e placa
Fluxo de Dados em um AMD64 CPU
1MB
L2 Cache
AMD64CPU
L1
Data
Cach
eL1
In
st.
Cach
e
MemoryController
DRAMController
CrossbarSwitch
64
-bit
s w
ide
Bussing Unit
Processor CoreCache, Load/Store &
Bussing UnitIntegrated North Bridge
Load/StoreUnit
Syste
m R
eq
uest
Qu
eu
e (
SR
Q)
HyperTransport Technology BUS
14
4-b
it w
ide
DR
AM
in
terfa
ce
FP UnitExecution UnitFetch Scan Align
12
8-b
its w
ide
Arquitetura Interna
MemoryController
DRAMController
CrossbarSwitch
Syste
m R
eq
uest
Qu
eu
e (
SR
Q)
HyperTransport Technology BUS
14
4-b
it w
ide
DR
AM
in
terfa
ce
1MB
L2 Cache
AMD64CPU
L1
Data
Cach
eL1
In
st.
Cach
e
64
-bit
s w
ide
Bussing Unit Load/StoreUnit
FP UnitExecution UnitFetch Scan Align
12
8-b
its w
ide
1MB
L2 Cache
AMD64CPU
L1
Data
Cach
eL1
In
st.
Cach
e
64
-bit
s w
ide
Bussing Unit Load/StoreUnit
FP UnitExecution UnitFetch Scan Align
12
8-b
its w
ide
• Processamento nativo em 32 e 64 bits
• Controlador de memória DDR integrado ao processador
• Barramento de sistema Hyper Transport
• Cool’n’quiet para modelos acima do Sempron 2800+
• Proteção anti-vírus por hardware
• Acesso à memória em 64 bits
• Computação do dia-a-dia
Processadores AMD Sempron
• Processamento nativo em 32 e 64 bits
• Controlador de memória DDR integrado ao processador
• Barramento de sistema Hyper Transport
• Cool’n’quiet - Gerenciamento avançado de energia
• Proteção anti-vírus por hardware
• Excelente custo/benefício
• AMD Athlon 64 FX:
• Campeão em aplicações single thread
• Jogos
Processadores AMD Athlon 64
• Dois núcleos AMD64 (Dual Core)
• Processamento nativo em 32 e 64 bits
• Controlador de memória DDR integrado ao processador
• Barramento de sistema Hyper Transport de 2.0GHz
• Cool’n’quiet - Gerenciamento avançado de energia
• Proteção anti-vírus por hardware
• Acesso à memória em 128 bits
• Alto desempenho multi-tarefa
Processadores AMD Athlon 64 X2
• Para servidores com 1, 2, 4 ou 8 processadores
• Processamento nativo em 32 e 64 bits
• Controlador de memória DDR integrado ao processador
• Barramento de sistema Hyper Transport – Sem gargalos de FSB
• Power Now! - Gerenciamento avançado de energia
• Acesso à paralelo à memória, em 128 bits
• Inclui modelos Dual Core
• Excelente consumo de energia
Processadores AMD Opteron
Funcionamento de servidor DualAlta demanda - controlador de memória no chipset
Funcionamento de servidor DualAlta demanda – arquitetura AMD64
Típico sistema multiprocessado
South
BridgePCI
IDE, FDC,USB, Etc.
PCI-XPCI-X
Bridge
North
Bridge
Processor Processor ProcessorProcessor
PCI-XPCI-X
Bridge
PCI-XPCI-X
Bridge
DDR
DDR
Memory
Expander
Memory
Expander
PCI-X
BridgePCI-X
I/O
HubPCI
IDE, FDC,USB, Etc.
AMD
Opteron
AMD
Opteron
AMD
Opteron™
AMD
Opteron
PCI-X
BridgePCI-X
Other
Bridge
OtherI/O
DDR
DDR
DDR
DDR
Sistema AMD Opteron™
Sistema Quad-processadoSolução do problema de gargalo no chipset/FSB
I/O Hub
USB
PCI
PCI-E Bridge
PCI-E Bridge
PCI-E BridgeI/O HubI/O Hub
PCI-E BridgePCI-E BridgePCI-E Bridge
Memory Controller
Hub
CPU CPU
Multiprocessamento com CPUs de núcleo duplo
Necessidade da evolução da arquitetura de interconexão
Arquitetura x86 tradicional
• FSB compartilhado por CPUs, Memória e I/O
• Mais CPUs ≠ Maior performance
AMD64 com DirectConnect
• Arquitetura x86 padrão de mercado
• Sem gargalo de FSB
• Menor latência no acesso à memória
SRQ
Crossbar
HTMem.Ctrlr
SRQ
Crossbar
HTMem.Ctrlr
CPU CPU CPU CPU8 GB/S
8 GB/S 8 GB/S
8 GB/S
CPU de 16 núcleos
O futuro do MicroprocessadorMais transistores, mais núcleos, mais threads
• Mais núcleos
• Núcleos especializados
• Mais controladores integrados
• ...
BENCHMARK AMD X INTEL
BENCHMARK AMD X INTEL
CONCLUSÕES
Processadores AMD atuais são mais indicados
para aplicativos (Business), Jogos, Aplicativos
2D com melhor taxa de preço
Processadores Intel estão mais indicados para
aplicativos 3D e Multitasking
BIBLIOGRAFIA E SITES RECOMENDADOS
Patterson, D. - Organizacao e projeto de computadores - a interface hard/software
Torres, G. – Hardware – Curso completo
Weber, R. – Arquitetura de computadores pessoais
Intel Home page: http://www.Intel.com
AMD Home Page: http://www.amd.com