Upload
roberto-ramirez
View
186
Download
3
Embed Size (px)
Citation preview
PlataformasMóviles de
Comunicacióny Procesamiento
Arquitectura de las Plataformas Móviles
2Plataformas Móviles de Comunicación y Procesamiento - Arquitectura de las Plataformas Móviles
Contenidos
Motivación
Familias de procesadores ARM
Plataformas actuales para dispositivos móviles
Origen y evolución de ARM
Modelo de negocio de ARM
3Plataformas Móviles de Comunicación y Procesamiento - Arquitectura de las Plataformas Móviles
¿Qué procesadores son los más vendidos?
2006 2007 2008 2009 20100
1000
2000
3000
4000
5000
6000
7000
PCs y Servidores Chips con procesadores ARM
Mil
lon
es d
e u
nid
ad
es
ven
did
as
× 10× 10.7
× 13.2 × 12.7
× 24.8
4Plataformas Móviles de Comunicación y Procesamiento - Arquitectura de las Plataformas Móviles
¿En qué mercados se usan los procesadores de ARM?
37821037
976
305
Millones de unidades (2010)
Dispositivos móvilesProcesadores empotradosEmpresa (Fotocopiadoras, etc.)Hogar
5Plataformas Móviles de Comunicación y Procesamiento - Arquitectura de las Plataformas Móviles
Uso de los procesadores ARM en los teléfonos móviles
2006 2007 2008 2009 20100
0,51
1,52
2,53
1,5 1,61,9 2
2,5
Número medio de chips basados en un procesador ARM que son usados en cada teléfono móvil
0,95
0,05
ARMResto
El 95% de los teléfonos móviles del mundo contienen algún chip
basado en un procesador de ARM
6Plataformas Móviles de Comunicación y Procesamiento - Arquitectura de las Plataformas Móviles
¿Por qué se se venden tantos procesadores ARM?
El equilibrio PPA de los procesadores ARM ha sido la clave de su éxito en los dispositivos móviles.
Actualmente ARM está empezando a abordar otros mercados: electrodomésticos, infotaiment, servidores, etc.
7Plataformas Móviles de Comunicación y Procesamiento - Arquitectura de las Plataformas Móviles
Contenidos
Motivación
Familias de procesadores ARM
Origen y evolución de ARM
Plataformas actuales para dispositivos móviles
Modelo de negocio de ARM
8Plataformas Móviles de Comunicación y Procesamiento - Arquitectura de las Plataformas Móviles
Acorn Computers
Fabricaba computadoresdomésticos muy popularesen el Reino Unido
Acorn BBC Micro (1981) Acorn Electron (1983)
En 1983 decidieron diseñarun nuevo procesador, elARM (Acorn RISC Machine),para competir con los PC,aunque sin mucho éxito
Objetivo: Un procesadorcon prestaciones más queaceptables en PCs de bajocoste
Acorn Archimedes (1987)ARM2 (8MHz)0.5 MIPS / MHz30 000 transistores133.3 MIPS / Mtrans
IBM Personal System 2 (1987)Intel 386DX (33MHz)0.35 MIPS/MHz275 000 transistores41.45 MIPS / Mtrans
1.4 veces más paralelo
9.2 veces más transistores
3.2 veces más eficiente
9Plataformas Móviles de Comunicación y Procesamiento - Arquitectura de las Plataformas Móviles
ARM LTD
En 1990 Apple buscaba un procesador RISC de altas prestaciones, bajo consumo y bajo coste para un nuevo tipo de dispositivo, el primer PDA
Apple y el equipo de desarrollo de los ARM de Acorn se unieron para fundar Advanced RISC Machines LTD
Nuevo modelo de negocio: Vender los derechos para fabricar sus procesadores
Apple Newton (1993)
ARM610 (ARMv3)20 Mhz0.85 MIPS/MHz 35000 transistores
DEC StrongARM (1996)
SA-110 (ARMv4) 233MHz233 DMIPS 1 DMIPS/MHz2.5 Mtrans 93.2 MIPS/M trans1 Watt 233 MIPS/Watt
<
Intel Pentium 200MHz (1996) 333 MIPS 1.67 MIPS/MHz3.3 Mtrans 101 MIPS / M trans6.5 Watt 51.23 MIPS / Watt
× 4.5
× 1.67
10Plataformas Móviles de Comunicación y Procesamiento - Arquitectura de las Plataformas Móviles
Intel 80286 (1982)134×103 transistores12 Mhz, 68,7 mm2
Evolución de los procesadores para PCs
Intel 80386 (1985)275×103 transistores
33 Mhz, 104 mm2
Intel Pentium (1993)3.1×106 transistores66 Mhz, 264 mm2
Intel Pentium II (1997)7.5×106 transistores300 Mhz, 209 mm2
Intel Pentium III (1999)28×106 transistores733 Mhz, 140 mm2
Intel Pentium 4 (2000)42×106 transistores1.5 Ghz, 224 mm2
Notable mejora de las prestaciones, sin cuidar demasiado el consumo o el área del procesador
11Plataformas Móviles de Comunicación y Procesamiento - Arquitectura de las Plataformas Móviles
ARM ha ido mejorando en otra dirección
800 veces más eficiente energéticamente
500 veces más pequeño
12Plataformas Móviles de Comunicación y Procesamiento - Arquitectura de las Plataformas Móviles
Aunque tampoco ha descuidado la mejora de prestaciones
13Plataformas Móviles de Comunicación y Procesamiento - Arquitectura de las Plataformas Móviles
Los procesadores ARM tienen arquitectura RISC
CISC (60's)
Instrucciones complejasque requieren múltiples ciclos
Diferentes formatos y tamaños de instrucción,difíciles de decodificar, microcódigo
Muchas instruccionespueden acceder a datos en memoria
Las instruccionesse ejecutan de una en una
Pocos registros de propósito general
RISC (80's)
Instrucciones sencillasque sólo requieren un ciclo
Formato fijo, decodificación y modos de direccionamiento sencillos, sin microcódigo
Sólo los LOADS y STORESpueden acceder a datos en memoria
Usa segmentación de cauce parasolapar la ejecución de instrucciones
Muchos registros de propósito general
Objetivos: Programación en ensamblador, códigos compactos
Objetivos: Generación automática de código, mejorar las prestaciones
El código tiende a ser más compacto El código tiende a ocupar más memoria
14Plataformas Móviles de Comunicación y Procesamiento - Arquitectura de las Plataformas Móviles
Mejoras de ARM a la arquitectura RISC para Sistemas Empotrados
Tiempo de ejecución variable para ciertas instrucciones: Load-Store-múltiple
▪ Aumenta la densidad de código, ya que se usa en todas las funciones para meter y sacar registros en la pila ▪ Su tiempo de ejecución depende del número de registros transferidos y de si las direcciones son consecutivas
Ejecución condicional de instrucciones: ▪ Aumenta la densidad de código ▪ Mejora las prestaciones al evitar muchos saltos condicionales
Uso de un desplazador de bloques en una de las entradas de la ALU:
▪ Genera constantes de 32 bits a partir de un operando inmediato que se desplazará antes de entrar a la ALU ▪ Se aumentan las prestaciones y la densidad de código
Modos de ejecución Thumb y Jazelle:
▪ Thumb es un repertorio de instrucciones de 16 bits. Mejora la densidad de código sobre el 30% ▪ Jazelle permite ejecutar bytecodes de Java directamente por el procesador (sin máquina virtual)
Adición de instrucciones específicas: ▪ Instrucciones específicas para aplicaciones multimedia, DSP, FP, seguridad, etc. ▪ Mejoran las prestaciones de ciertos algoritmos muy usados en aplicaciones actuales
15Plataformas Móviles de Comunicación y Procesamiento - Arquitectura de las Plataformas Móviles
Contenidos
Motivación
Origen y evolución de ARM
Plataformas actuales para dispositivos móviles
Modelo de negocio de ARM
Familias de procesadores ARM
Clásicos Cortex-M Cortex-R Cortex-A
16Plataformas Móviles de Comunicación y Procesamiento - Arquitectura de las Plataformas Móviles
Familias de procesadores de ARM
Procesadores más que probados y muy baratos para aplicaciones muy sensibles al coste
Tienen una buena eficiencia energética para sistemas empotrados
Acortan el time-to-market. Mucha documentación, herramientas, …
Se siguen vendiendo miles de millones cada año
17Plataformas Móviles de Comunicación y Procesamiento - Arquitectura de las Plataformas Móviles
ARM7
ARM7TDMI(-S)
Arquitectura: ARMv4TCaracterísticas: Pipeline de 3 etapas, modo de ejecución Thumb, soporte para
Depuración, Multiplicador hardware, ICE. Hay versionesSintetizables
Prestaciones: 0.9 DMIPS / MhzConsumo: 0.8 mW / Mhz
Lanzamiento: 1994Objetivos: Teléfonos móviles, agendas, impresoras, cámaras, PDAs, …Tecnología: 800 nanómetros, 33 MHz
ARM7EJ-S
Arquitectura: ARMv5TEJCaracterísticas: Pipeline de 5 etapas, añade Enhanced DSP y modo de ejecución
JazellePrestaciones: 1 DMIPS / MHzConsumo: 1.5 mW / Mhz
18Plataformas Móviles de Comunicación y Procesamiento - Arquitectura de las Plataformas Móviles
Comparativas de los ARM7 con procesadores de Intel de la época
Prestaciones (MIPS)0
50
100
150
200
Frecuencia (MHz)0
20406080
100120
Eficiencia (MIPS/W)0
20406080
100120140
Paralelismo (MIPS/MHz)0
0,5
1
1,5
2
Consumo (W)0
1
2
3
4
5
ARM7TDMI (1994, 800 nm, Orientado a sistemas empotrados)
Intel 486DX4 75 (1994, 600 nm, orientado a PC/Servidores)
Intel 486SL (1993, 800 nm, versión de bajo consumo del 486DX para portátiles)
Intel Pentium 100 (1994, 600 nm, orientado a PC/Servidores)
12% más MIPSque el 486SL consumiendo 4 veces menos
19Plataformas Móviles de Comunicación y Procesamiento - Arquitectura de las Plataformas Móviles
Evolución del proceso de fabricación del ARM7TDMI
250 nm 180 nm 130 nm 65 nm0
100
200
300
400Frecuencia (MHz)
250 nm 180 nm 130 nm 65 nm0
50100150200250300350
Prestaciones (MIPS)
250 nm 180 nm 130 nm 65 nm0
102030405060
Consumo (mW)
250 nm 180 nm 130 nm 65 nm0
0,20,40,60,8
11,2
Área (mm2)
250 nm 180 nm 130 nm 65 nm0
0,2
0,4
0,6
0,8
1Prestaciones (MIPS/MHz)
250 nm 180 nm 130 nm 65 nm0
10
20
30
40Eficiencia (MIPS/mW)
20Plataformas Móviles de Comunicación y Procesamiento - Arquitectura de las Plataformas Móviles
Aplicaciones del ARM7
Nintendo Gameboy Advance (2001)Consola de videojuegos
Apple iPod (2001)Reproductor multimedia
Nokia 3300 (2003)Teléfono móvil
Ramos RM970 PMP (2007)Reproductor multimedia
Allerta inPulse (2011)Smartwatch
Kodak EasyShare LS753 (2004)Cámara
21Plataformas Móviles de Comunicación y Procesamiento - Arquitectura de las Plataformas Móviles
ARM9
ARM946E-S (1999)
Arquitectura: ARMv5TETecnología: 250 nanómetros, 160 MHzCaracterísticas: Pipeline de 5 etapas, arquitectura Harvard, MPU, TCMs, Thumb,
soporte para Depuración, Enhanced DSP, SintetizablePrestaciones: 1.1 DMIPS / MhzConsumo: 2.5 mW / Mhz
Lanzamiento: 1997Objetivos: Teléfonos móviles, buscas, smartphones, decodificadores de TV, ...
ARM926EJ-S (2000)
Arquitectura: ARMv5TEJTecnología: 180 nanómetros, 200 MHzCaracterísticas: Cambia la MPU por MMU, mejora el repertorio Enhanced DSP
y añade el modo de ejecución JazellePrestaciones: 1.1 DMIPS / MHzConsumo: 1.5 mW / Mhz
22Plataformas Móviles de Comunicación y Procesamiento - Arquitectura de las Plataformas Móviles
Comparativas de los ARM9 con procesadores de Intel de la época
Prestaciones (MIPS)0
50010001500200025003000
Frecuencia (MHz)0
500
1000
1500
2000
Eficiencia (MIPS/W)0
200
400
600
800
Paralelismo (MIPS/MHz)0
0,51
1,52
2,53
Consumo (W)0
10
20
30
40
ARM946E-S (1999, 250 nm)
ARM926EJ-S (2000, 180 nm)
Intel Pentium 4 (2000, 180 nm)
Intel Mobile Pentium III con Speed Step Technology (2000, 180 nm)
Aunque no son tan potentes como los de Intel, su eficiencia energética es notablemente superior
23Plataformas Móviles de Comunicación y Procesamiento - Arquitectura de las Plataformas Móviles
Evolución del proceso de fabricación del ARM926EJ-S
180 nm 130 nm 90 nm0
100
200
300
400
500Frecuencia (MHz)
180 nm 130 nm 90 nm0
100200300400500600
Prestaciones (MIPS)
180 nm 130 nm 90 nm0
200
400
600
800Consumo (mW)
180 nm 130 nm 90 nm01234567
Área (mm2)
180 nm 130 nm 90 nm0
0,20,40,60,8
11,2
Prestaciones (MIPS/MHz)
180 nm 130 nm 90 nm0
0,5
1
1,5
2
2,5Eficiencia (MIPS/mW)
ARM926EJ-S (Diseño optimizado para maximizar las prestaciones)
ARM926EJ-S (Diseño optimizado para minimizar el área)
24Plataformas Móviles de Comunicación y Procesamiento - Arquitectura de las Plataformas Móviles
Aplicaciones del ARM9
Nintendo DS (2004)Consola de videojuegos
HTC TyTN (2006)Teléfono móvil 3G
Canon EOS 5D Mark II (2008)Cámara
LG Arena (2009)Smartphone
Hero H2000 (2011)Smartphone chino Dual-sim
Archos 7 (2010)Tablet
25Plataformas Móviles de Comunicación y Procesamiento - Arquitectura de las Plataformas Móviles
ARM11
ARM1136J(F)-S (2002)
Arquitectura: ARMv6Tecnología: 130 nanómetros, 533 MhzCaracterísticas: Pipeline de 8 etapas, MMU, Extensiones SIMD para multimedia,
TCMs, Thumb, Jazelle, Enhanced DSP, Sintetizable, Opción deVFP
Prestaciones: 1.13 DMIPS / MhzConsumo: 0.38 mW / Mhz
Lanzamiento: 2002Objetivos: Cámaras digitales, smartphones, e-book readers, media centers, ...
ARM1176JZ(F)-S (2004)
Arquitectura: ARMv6KZTecnología: 130 nanómetros, 550 MhzCaracterísticas: Añade la tecnología de seguridad TrustZone y soporte básico para
Adobe FlashPrestaciones: 1.25 DMIPS / MHz
26Plataformas Móviles de Comunicación y Procesamiento - Arquitectura de las Plataformas Móviles
Comparativa entre ARM11 y ARM9
180 130 90 65 400
200400600800
10001200
Frecuencia
nm
MH
z
180 130 90 65 400
500
1000
1500Prestaciones
nm
MIP
S
180 130 90 65 400
200
400
600
800Consumo
nm
mW
180 130 90 65 400
2
4
6
8Área
nm
mm
2
180 130 90 65 401
1,051,1
1,151,2
1,251,3
Prestaciones
nm
MIP
S/M
Hz
180 130 90 65 400
5
10
15Eficiencia
nm
MIP
S/m
W
ARM1176ZF-S (Geometría TSMC 65LP)
ARM1176ZF-S (Geometría TSMC 65GP)
ARM1176ZF-S (Geometría TSMC 40G)
ARM926EJ-S (Diseño optimizado para maximizar las prestaciones)
ARM926EJ-S (Diseño optimizado para minimizar el área)
Hasta 2,4 veces más potenteHasta 5,5 veces más eficiente
27Plataformas Móviles de Comunicación y Procesamiento - Arquitectura de las Plataformas Móviles
Aplicaciones del ARM11
Apple iPhone 3G (2008)
Smartphone
Amazon Kindle 2 (2009)Lector de e-books
Mobinova Elan (2009)Netbook
iRobot aPad (2010)Clon chino del iPad
Nokia X7 (2011)Smartphone
Nintendo 3DS (2011)Consola de videojuegos
28Plataformas Móviles de Comunicación y Procesamiento - Arquitectura de las Plataformas Móviles
Contenidos
Motivación
Origen y evolución de ARM
Plataformas actuales para dispositivos móviles
Modelo de negocio de ARM
Familias de procesadores ARM
Clásicos Cortex-M Cortex-R Cortex-A
29Plataformas Móviles de Comunicación y Procesamiento - Arquitectura de las Plataformas Móviles
Familias de procesadores de ARM
Cores extremadamente sencillos con el mínimo consumo posible para microcontroladores
30Plataformas Móviles de Comunicación y Procesamiento - Arquitectura de las Plataformas Móviles
ARM Cortex-MLanzamiento: 2004Objetivos: Lograr más prestaciones a menor precio
Conectividad, reutilización de código y eficiencia energética.Aplicaciones: Electrodomésticos, automoción, Internet de las cosas, control, …Características: Pipeline de 3 etapas, ejecución determinista, muy bajo consumo,
código muy denso (Thumb-2), interrupciones con muy bajalatencia
Aplicaciones de 8/16 bitsBajo coste y sencillez0.9 DMIPS/MHz
Aplicaciones de 16/32 bitsPrestaciones y eficiencia energética1.25 DMIPS/MHz
Aplicaciones 32 bits/DSPProcesado de señales eficiente1.25 DMIPS/MHz
Optimizado para FPGALas prestaciones dependen de la FPGA y del proceso de síntesis
Predicción de saltosMPU
Predicción de saltosMAC, SIMD, FPU, MPU
31Plataformas Móviles de Comunicación y Procesamiento - Arquitectura de las Plataformas Móviles
Tecnología
Mejor eficiencia energética
- Funcionamiento a baja frecuencia conperiodos de actividad más cortos
- Soporte HW de los modos de reposo
Thumb-2
- Logra un código hasta 3 veces más denso queel de los MCUs de 8 bits
- Reduce los requerimientos de memoria RAM delsistema (sistemas más baratos)
- Aprovecha mejor la memoria FLASH
Mejores prestaciones
- Más prestaciones por Mhz que los MCUs típicos
32Plataformas Móviles de Comunicación y Procesamiento - Arquitectura de las Plataformas Móviles
Comparativa entre Cortex-M y ARM7TDMI
Realmente, las prestaciones y la eficiencia son mejoresDhrystone no usa las extensiones SIMD ni las instrucciones MAC del Cortex-M4
Cortex-M3 (90 nm, Diseño optimizado para minimizar el área)
Cortex-M4 (65 nm, Diseño optimizado para maximizar las prestaciones)
Cortex-M4 (65 nm, Diseño optimizado para minimizar el área)
ARM7TDMI (65 nm)
Cortex-M3 (90 nm, Diseño optimizado para maximizar las prestaciones)
Área (mm2)0
0,1
0,2
0,3
0,4
0,5
Frecuencia (MHz)0
100
200
300
400
Consumo (mW)05
1015202530
Prestaciones (DMIPS/MHz)0
0,20,40,60,8
11,21,4
Prestaciones (DMIPS)0
100
200
300
400
Eficiencia (DMIPS/mW)0
10
20
30
40
33Plataformas Móviles de Comunicación y Procesamiento - Arquitectura de las Plataformas Móviles
Aplicaciones de los Cortex-M
Bosch Tassimo (2010)Cafetera. Cortex-M3
Electrodomésticos: Smart grid:
e-health:Web of things:
Itron Openway Centron(2009) Smart meter
Cortex-M3
34Plataformas Móviles de Comunicación y Procesamiento - Arquitectura de las Plataformas Móviles
Contenidos
Motivación
Origen y evolución de ARM
Plataformas actuales para dispositivos móviles
Modelo de negocio de ARM
Familias de procesadores ARM
Clásicos Cortex-M Cortex-R Cortex-A
35Plataformas Móviles de Comunicación y Procesamiento - Arquitectura de las Plataformas Móviles
Familias de procesadores de ARM
Ejecución determinista, altas prestaciones y bajo consumo para aplicaciones con restricciones fuertes de tiempo real
36Plataformas Móviles de Comunicación y Procesamiento - Arquitectura de las Plataformas Móviles
ARM Cortex-R
Lanzamiento: 2006Objetivos: Altas prestaciones para sistemas empotrados con restricciones
de tiempo realCaracterísticas: Superescalar, ejecución determinista, MPU, Thumb-2,
memorias RAM con paridad y ECC
37Plataformas Móviles de Comunicación y Procesamiento - Arquitectura de las Plataformas Móviles
Comparativa entre Cortex-R4 y los procesadores clásicos de ARM
ARM1176ZF-S (65 nm, Geometría TSMC 65GP)
Cortex-R4 (65 nm, Diseño optimizado para maximizar las prestaciones)
Cortex-R4 (65 nm, Diseño optimizado para minimizar el consumo)
ARM926EJ-S (90 nm, Diseño optimizado para maximizar las prestaciones)
ARM926EJ-S (90 nm, Diseño optimizado para minimizar el área)
Área (mm2)0
0,5
1
1,5
2
2,5
Cortex-R4 (65 nm, Diseño optimizado para minimizar el área)
Frecuencia (MHz)0
200
400
600
800
1000
Consumo (mW)0
50
100
150
200
250
Prestaciones (DMIPS/MHz)0
0,5
1
1,5
2
Prestaciones (DMIPS)0
200400600800
10001200
Eficiencia (DMIPS/mW)0
5
10
15
20
38Plataformas Móviles de Comunicación y Procesamiento - Arquitectura de las Plataformas Móviles
Comparativa entre los diferentes Cortex-R
Cortex-R7 (65 nm, Diseño optimizado para maximizar las prestaciones)
Cortex-R7 (28 nm, Diseño optimizado para maximizar las prestaciones)
Cortex-R4 (65 nm, Diseño optimizado para maximizar las prestaciones)
Cortex-R5 (65 nm, Diseño optimizado para maximizar las prestaciones)
Área (mm2)0
1
2
3
4
5
6
Frecuencia (MHz)0
200
400
600
800
1000
1200
Consumo (mW)0
100
200
300
400
500
Prestaciones (DMIPS)0
1000
2000
3000
4000
5000
Eficiencia (DMIPS/mW)02468
10121416
Prestaciones (DMIPS/MHz)0
1
2
3
4
5
39Plataformas Móviles de Comunicación y Procesamiento - Arquitectura de las Plataformas Móviles
Aplicaciones de los Cortex-R
• Banda ancha móvil
LTE-A, WiMax, HSDPA
• Almacenamiento
Controladores de HDD y SSD
• Empresa
Impresoras multi-función, fotocopiadoras
• Automoción
Control de airbags, ABS, estabilidad, motor, etc.
• Dispositivos médicos• Hogar
TV Digital, BlueRay. …
40Plataformas Móviles de Comunicación y Procesamiento - Arquitectura de las Plataformas Móviles
Contenidos
Motivación
Origen y evolución de ARM
Plataformas actuales para dispositivos móviles
Modelo de negocio de ARM
Familias de procesadores ARM
Clásicos Cortex-M Cortex-R Cortex-A
41Plataformas Móviles de Comunicación y Procesamiento - Arquitectura de las Plataformas Móviles
Familias de procesadores de ARM
Altas prestaciones para dispositivos móviles con sistema operativo y conexión a Internet
Opción de coma flotante (VPN) y extensiones multimedia (NEON)
Versiones multi-core de hasta 4 cores
42Plataformas Móviles de Comunicación y Procesamiento - Arquitectura de las Plataformas Móviles
Aplicaciones: Dispositivos con un SO completo y aplicaciones de usuario
Cortex-A5 (2009)Aplicaciones: Pensado para reemplazar a los ARM9 y ARM11. Mejores prestaciones y
todas las características de la arquitectura ARMv7A con un consumo mínimoPrestaciones: 1.57 DMIPS / Mhz por core (hasta 4 cores, hasta 1GHz)Consumo: 0.08 – 0.12 mW / Mhz (según se optimice para consumo o prestaciones)
ARM Cortex-A
Cortex-A8 (2006)Aplicaciones: Prestaciones, bajo consumo y conectividad (Smartphones, tablets, netbooks)Prestaciones: 2 DMIPS / Mhz (superescalar, no hay versión multi-core, hasta 1GHz)Consumo: 0.45 mW / MHz
Cortex-A9 (2008)Aplicaciones: Altas prestaciones con un consumo muy reducidoPrestaciones: 2.5 DMIPS / Mhz (superescalar, hasta 4 cores, hasta 2GHz)Consumo: 0.48 – 0.95 mW / Mhz (según se optimice para consumo o prestaciones)
Cortex-A15 (¿2013?)Aplicaciones: Dispositivos móviles de muy altas prestaciones, servidores de bajo consumoPrestaciones: 2.5 DMIPS / Mhz (superescalar, virtualización, 4 cores por cluster, 2 clusters
por chip, hasta 2.5GHz)
43Plataformas Móviles de Comunicación y Procesamiento - Arquitectura de las Plataformas Móviles
Comparativa entre Cortex-A5 y los procesadores clásicos de ARM
ARM1176ZF-S (65 nm, Geometría TSMC 65GP)
Cortex-A5 (40 nm, Geometría TSMC 40G, 1 core)
ARM926EJ-S (90 nm, Diseño optimizado para maximizar las prestaciones)
Área (mm2)0
0,5
1
1,5
2
2,5
Frecuencia (MHz)0
200
400
600
800
1000
1200
Consumo (mW)0
50
100
150
200
250
Prestaciones (DMIPS/MHz)0
0,5
1
1,5
2
Prestaciones (DMIPS)0
500
1000
1500
2000
Eficiencia (DMIPS/mW)0
5
10
15
20
25
Notable mejoría de las prestaciones y disminución del consumo
44Plataformas Móviles de Comunicación y Procesamiento - Arquitectura de las Plataformas Móviles
Comparativa entre los Cortex-A e Intel Atom
Intel Atom 330 (45 nm, dual-core)
ARM Cortex-A9 (40 nm, optimizado para mejorar las prestaciones, dual-core)
ARM Cortex-A5 (40 nm, optimizado para mejorar las prestaciones, 1 core)
ARM Cortex-A8 (65 nm, optimizado para mejorar las prestaciones, 1 core)
Frecuencia (MHz)0
500
1000
1500
2000
2500
Consumo (W)0
2
4
6
8
10
Prestaciones (DMIPS/MHz)0123456
Prestaciones (DMIPS)0
2000400060008000
1000012000
Eficiencia (DMIPS/mW)0
5
10
15
20
25
El Cortex-A9 es 1,5 veces más potente que el Intel Atom 330 consumiendo 4 veces menos
45Plataformas Móviles de Comunicación y Procesamiento - Arquitectura de las Plataformas Móviles
Aplicaciones de los ARM Cortex-A
Apple iPhone 4 (2010)Smartphone
Apple A4 (Cortex-A8)
Barnes & Noble Nookcolor (2010)e-reader
Texas Instruments OMAP3621 (Cortex-A8)
Apple iPad 2 (2011)Tablet
Apple A5 (Dual Cortex-A9)
Samsung Galaxy SII (2011)Smartphone
S5PV310 Exynos 4210 (Dual Cortex-A9)
46Plataformas Móviles de Comunicación y Procesamiento - Arquitectura de las Plataformas Móviles
Contenidos
Motivación
Familias de procesadores ARM
Origen y evolución de ARM
Plataformas actuales para dispositivos móviles
Modelo de negocio de ARM
47Plataformas Móviles de Comunicación y Procesamiento - Arquitectura de las Plataformas Móviles
Sistema basado en PCB
Formado a partir de microchips que se ensamblan e interconectan mediante un circuito impreso en una placa
System on Chip
Formado a partir de componentes (cores IP) interconectados en el diseño del propio chip
Los cores IP pueden ser propios o licenciados de otras compañías
Sistemas-en-un-Chip (SoC)
48Plataformas Móviles de Comunicación y Procesamiento - Arquitectura de las Plataformas Móviles
Componentes típicos de in SoC
Resto de componentes (dependientes de la aplicación):
Bus de interconexión:
Propietarios: ARM AMBA, IBM CoreConnect, Altera Avalon, ...Abiertos: OpenCores Wishbone
Procesador:
Hard cores: ARM, MIPS, PowerPC, …Soft cores: Xilinx Microblaze, Altera Nios II, ...
En los dispositivos móviles multimedia:
Procesador de Gráficos 3D: Para los juegos, interfaz de usuario, etc.Procesador de imagen: para gestionar las imágenes capturadas por la
cámaraProcesador de Vídeo: Soporte HW para los códecs de compresión y
descompresión habitualesControladores para los dispositivos habituales: HDMI, touch-screen,
tarjetas de memoria, USB, Wi-Fi, Bluetooth, GPS, etc.
49Plataformas Móviles de Comunicación y Procesamiento - Arquitectura de las Plataformas Móviles
Tipos de licencias:
Licencias de ARM
Licencia de implementación:
Lo que realmente se compra es el core IP el procesador (hard o soft).
Ejemplos: TI, NXP, Freescale, Samsung, Apple, LG, Broadcom, …
Licencia de la Arquitectura:
Se compran los derechos para fabricar un chip que tenga un ISA deARM
Ejemplos: Qualcomm (Snapdragon), Marvell (Armada), nVidia (Tegra 2)
ARM no fabrica ni vende procesadores, sólo los diseña y vende los derechos para su fabricación
Otras empresas licencian el core para que forme parte de sus chips
50Plataformas Móviles de Comunicación y Procesamiento - Arquitectura de las Plataformas Móviles
Licencias de ARM
51Plataformas Móviles de Comunicación y Procesamiento - Arquitectura de las Plataformas Móviles
Contenidos
Motivación
Familias de procesadores ARM
Origen y evolución de ARM
Plataformas actuales para dispositivos móviles
Modelo de negocio de ARM
52Plataformas Móviles de Comunicación y Procesamiento - Arquitectura de las Plataformas Móviles
Ejemplo: nVidia Tegra2
Nvidia Tegra 250 T20 (40 nm, 2010)8 procesadores independientes
260 millones de transistores49 mm2, 500 mW
53Plataformas Móviles de Comunicación y Procesamiento - Arquitectura de las Plataformas Móviles
Componentes del Tegra 250 T20
Procesador de Gráficos 3D: Ultra-Low Power nVidia GeForce GPU a 333MHz 8 núcleos, totalmente programable (OpenGL ES 2.0, OpenVG 1.1, EGL 1.4)
Procesadores: ARM Cortex-A9 (sin NEON) dual core a 1 Ghz (aplicaciones)ARM7 (ahorro de energía en la reproducción de audio y vídeo))
Procesador de Imagen:Cámara primaria (12MP), cámara secundaria (5MP), zoom digital hasta 16X, estabilizaciónde imagen, compresión/descompresión JPEG, autofocus, filtrado de imagen
Procesador decodificador de Vídeo (HD): H.264, VC-1 AP, MPEG2, MPEG-4, DivX 4/5,XviD HT, H.263, Theora, VP8, WMV, Sorenson Spark, Real Video, VP6
Procesador de Audio:Decodificación: AAC-LC, AAC+, EAAC+, MP3, MP3 VBR, WAV/PCM, AMR-NB, AMR-WB,
BSAC, MPEG-2 Audio, Vorbis, WMA 9, WMA Lossless, WMA ProCodificación: AAC LC, AAC+, EAAC+, PCM/WAV, AMR-NB, AMR-WB
Controlador de pantalla dual:HDMI 1.3 (1920x1080), LCD (1920x1080), CRT (1600x1200)
Procesador codificador de Vídeo (HD): H.264, MPEG4, H.263, VP8
54Plataformas Móviles de Comunicación y Procesamiento - Arquitectura de las Plataformas Móviles
Aplicaciones del Tegra2
LG Optimus 2X (2011)Smartphone
Motorola Xoom (2011)Tablet
Motorola Atrix 4G (2011)Smartphone
Asus/Pegatron Neo (2010)Smartbook
Full HD. Autonomía de 24h con la Wi-Fi activa
55Plataformas Móviles de Comunicación y Procesamiento - Arquitectura de las Plataformas Móviles
Ejemplo: Texas Instruments OMAP4
TI Omap4430 (45 nm, 2011)9 procesadores independientes
56Plataformas Móviles de Comunicación y Procesamiento - Arquitectura de las Plataformas Móviles
Susbsistema DSP: TI C64xApoyo al procesado de audio y vídeo y soporte para futuros codecs
Subsistema de pantallaHasta 2 pantallas LCD y 1 HDMI
Procesador codificador de Vídeo (HD): H.264, MPEG4, H.263, VP8
Subsistema Imágenes:Captura de imágenes (16MP) y vídeo (Full HD), zoom digital hasta 16X, estabilizaciónde imagen, compresión/descompresión JPEG, autofocus, filtrado de imagen, ...
Componentes del OMAP4430
Subsistema de Gráficos 2D/3D: Imagination Tech. PowerVR SGX544 a 304 MHzTotalmente programable (MS DirectX 9.0, OpenGL 2.1, OpenGL ES 1.1 & 2.0,OpenVG 1.1 y OpenCL 1.1).Codificación y decodificación de H.264, H.263, MPEG-4 (SP), WMV9 y JPEG
Procesadores: 1 ARM Cortex-A9 dual core a 1 Ghz (para las aplicaciones)2 ARM Cortex-M3 (para el RTOS, y apoyo al ISP)
Subsistema de codificación y decodificación de Vídeo (HD): IVA HDMPEG-1/-2/-4, Divx, Sorenson Spark (decod.), H.263, H.264, Video estereoscópico, JPEGVC-1 SP/MP/AP, AVS-1.0, RealVideo 8/9/10 (decod.), On2 VP6.2/VP7 (decod.)Contiene otros dos ARM968E-S (apoyo a la secuenciación de vídeo y control de DMA)
Subsistema de detección de caras
57Plataformas Móviles de Comunicación y Procesamiento - Arquitectura de las Plataformas Móviles
Aplicaciones del OMAP4
Archos 101 G9 (2011)Tablet
Blackberry Playbook (2011)Tablet 4G
Motorola Droid 3 (2011)Smartphone
LG Optimus 3D (2011)Smartphone
58Plataformas Móviles de Comunicación y Procesamiento - Arquitectura de las Plataformas Móviles
Ejemplo: Qualcomm Snapdragon
Procesador: Qualcomm Scorpion dual a 1.2 Ghz
Snapdragon MSM8660 (45 nm, 2010)850 mW, controlador 3G integrado
GPU: Qualcomm Adreno 220
Cámara principal (13MP),cámara secundaria (1MP)
Adobe Flash, OpenGL ES 2.0, OpenGL ES 1.1, OpenVG 1.1, EGL 1.3, Direct3D Mobile, SVGT 1.2, Direct Draw y GDI
Codificación y decodificación de vídeo HD
Reproducción de vídeo 3D por HDMI
DSP (600 MHz): Procesamiento de Audio (Dolby 5.1)
59Plataformas Móviles de Comunicación y Procesamiento - Arquitectura de las Plataformas Móviles
Aplicaciones del Snapdragon
HTC Flyer (2011)Tablet
HP TouchPad (2011)Tablet
HTC Thunderbolt (2011)Smartphone 4G LTE
Sony Ericsson Xperia Play (2011)Smartphone
60Plataformas Móviles de Comunicación y Procesamiento - Arquitectura de las Plataformas Móviles
Ejemplo: Apple A5
Apple iPad 2 (2011)Tablet
ARM Cortex-A9
Apple A5 (45 nm,122 mm2, 2011)ARM Cortex-A9 dual core 1GHzGPU: Imagination Technologies PowerVR SGX 543MP2 GPU (2 cores)
61Plataformas Móviles de Comunicación y Procesamiento - Arquitectura de las Plataformas Móviles
Samsung Exynos 4210 (Orion)
Samsung Exynos 4210 (45 nm, 2011)ARM Cortex-A9 dual core 1.2GHz
GPU: ARM Mali 400MP (4 cores, Full HD)Samsung Galaxy SII (2011)Smartphone
62Plataformas Móviles de Comunicación y Procesamiento - Arquitectura de las Plataformas Móviles
Comparativa (PowerVR, GeForce ULP Adreno 220)
63Plataformas Móviles de Comunicación y Procesamiento - Arquitectura de las Plataformas Móviles
Para saber más
• Historia de los procesadores ARM:– Ken Polson. Chronology of Microprocessors. http://processortimeline.info/
– C. Atack y A. van Someren. The history of the ARM CPU. http://www.ot1.com/arm/armchap1.html
– Markus Levy. The History of The ARM Architecture: From Inception to IPO. Information Quarterly, 4(1). From Acorns to Mighty Oaks. Commemorating the 20th Anniversary of the ARM Architecture, 2005. http://www.reds.ch/share/cours/ReCo/documents/TheHistoryOfTheArmArchitecture.pdf
– Nota de prensa. ARM announces new higher performance, low power ARM9 processor architecture. http://bwrc.eecs.berkeley.edu/CIC/announce/1997/arm9.annc.html
– Nota de prensa. ARM11 Readied for Action. http://www.theregister.co.uk/2002/10/15/
– Sir Robin Saxby. Semiconductors + Software Enable Exciting Lifestyles. http://www.docstoc.com/docs/78265677/
– ARM. Annual Reports and Accounts. http://www.arm.com/annualreport10/
• Familias y arquitecturas de los procesadores ARM:– ARM. ARM Processors. http://www.arm.com/products/processors/
– Wikipedia. ARM Architecture. http://en.wikipedia.org/wiki/ARM
64Plataformas Móviles de Comunicación y Procesamiento - Arquitectura de las Plataformas Móviles
Para saber más
• ARM7:– ARM. ARM7TDMI (Rev 3) Core Processor. Product Overview.
http://infocenter.arm.com/help/topic/com.arm.doc.dvi0027b/
– ARM. ARM7 Thumb Family. http://saluc.engr.uconn.edu/refs/processors/arm/arm7_family.pdf
– ARM. ARM7TDMI Datashet. http://www.eecs.umich.edu/~panalyzer/pdfs/ARM_doc.pdf
– Simon Segars. ARM7TDMI Power Consumption. IEEE Micro, 15(5):12-19, 1997.
• ARM9:– ARM. ARM946E-S (Rev 1) Core Processor. Product Overview.
http://infocenter.arm.com/help/topic/com.arm.doc.dvi0027b/
– ARM. ARM9E-S Thumb Family. http://saluc.engr.uconn.edu/refs/processors/arm/ARM9E-S.pdf
– ARM. ARM926EJ-S Featuring Jazelle Technology. http://www.jp.arm.com/naviweb/pdf/ARM926ejs_en.pdf
65Plataformas Móviles de Comunicación y Procesamiento - Arquitectura de las Plataformas Móviles
Para saber más• ARM11:
– ARM. ARM11 Processor Family. http://www.arm.com/products/processors/classic/arm11/
– ARM. ARM1136JF-S and ARM1136J-S Technical Reference Manual. http://infocenter.arm.com/help/topic/com.arm.doc.ddi0211k/
– ARM. ARM1176JZ-S Technical Reference Manual. http://infocenter.arm.com/help/topic/com.arm.doc.ddi0333h/
• ARM Cortex:– ARM. Cortex-M series processors.
http://www.arm.com/products/processors/cortex-m/http://infocenter.arm.com/help/topic/com.arm.doc.set.cortexm/
– ARM. Cortex-R series processors.http://www.arm.com/products/processors/cortex-r/http://infocenter.arm.com/help/topic/com.arm.doc.set.cortexr/
– ARM. Cortex-A series processors.http://www.arm.com/products/processors/cortex-a/http://infocenter.arm.com/help/topic/com.arm.doc.set.cortexa/http://www.embedinfo.com/en/ARM_Cortex-list.asp?id=15
66Plataformas Móviles de Comunicación y Procesamiento - Arquitectura de las Plataformas Móviles
Para saber más• SoC:
– Special Issue de IEEE Micro en Systems on a Chip: The Next Electronic Design Frontier. IEEE Micro, 22(5), 2002.
– Wikipedia. System-on-a-Chip. http://en.wikipedia.org/wiki/System_on_chip
• ARM AMBA:– ARM. AMBA Open Specifications.
http://www.arm.com/products/system-ip/amba/amba-open-specifications.php
– Wikipedia. Advanced Microcontroller Bus Architecture. http://en.wikipedia.org/wiki/Advanced_Microcontroller_Bus_Architecture
• nVidia Tegra2:– nVidia. Tegra 2. http://www.nvidia.com/object/tegra-2.html
– Wikipedia. nVidia Tegra. http://en.wikipedia.org/wiki/Nvidia_Tegra
– Anand Lal Shimpi. NVIDIA Introduces dual Cortex A9 based Tegra 2. http://www.anandtech.com/show/2911/
– Cyril Kowaliski. Tegra 2 debuts, runs Unreal Engine 3. http://techreport.com/discussions.x/18254
– Brian Klug & Anand Lal Shimpi. LG Optimus 2X & NVIDIA Tegra 2 Review: The First Dual-Core Smartphone. http://www.anandtech.com/show/4144/
–
67Plataformas Móviles de Comunicación y Procesamiento - Arquitectura de las Plataformas Móviles
Para saber más
• Texas Instruments OMAP4:– Wikipedia. Texas Instruments OMAP.
http://en.wikipedia.org/wiki/Texas_Instruments_OMAP
– Texas Insruments. OMAP4430 Multimedia Device Silicon Revision 2.x. Technical Reference Manual, 2011.
• Apple A5:– Paul Boldt and Don Scansen. A5: All Apple, part mystery.
http://www.eetimes.com/electronics-news/4215094
– Anand Lal Shimpi, Brian Klug & Vivek Gowri. Apple iPad 2 Preview. http://www.anandtech.com/show/4215/
– Anand Lal Shimpi. Apple iPad 2 GPU Performance Explored: PowerVR SGX543MP2 Benchmarked. http://www.anandtech.com/show/4216/
• PowerVR:– Imagination Technologies. SGX Series5 Graphics IP Core Family.
http://www.imgtec.com/powervr/sgx_series5.asp
68Plataformas Móviles de Comunicación y Procesamiento - Arquitectura de las Plataformas Móviles
Para saber más
• Qualcomm Snapdragon:– Qualcomm. Snapdragon. http://www.qualcomm.com/snapdragon
– Qualcomm. Snapdragon Mobile Development Platform. http://developer.qualcomm.com/dev/development-devices/snapdragon-mdp
– Wikipedia. Snapdragon (System on Chip). http://en.wikipedia.org/wiki/Snapdragon_(System_on_Chip)
– bSquare. Snapdragon Mobile Development Platform MSM8860. http://developer.qualcomm.com/sites/default/files/snapdragon-mdp-8660.pdf
– Linley Gwennap. Two-Headed Snapdragon Takes Flight. Qualcomm Samples Dual-CPU Mobile Processor at 1.2GHzA. Microprocessor Report, Julio 2010. http://www.qualcomm.com/documents/linley-report-dual-core-snapdragon
– Brian Klug. Dual Core Snapdragon GPU Performance Explored - 1.5 GHz MSM8660 and Adreno 220 Benchmarks. http://www.anandtech.com/show/4243/
– Wikipedia. Imageon. http://en.wikipedia.org/wiki/Imageon
– Qualcomm. Adreno Graphics Processors. http://developer.qualcomm.com/dev/gpu/processors
69Plataformas Móviles de Comunicación y Procesamiento - Arquitectura de las Plataformas Móviles
Para saber más
• Samsung Exynos 4210:– Samsung. Samsung Orion.
http://www.samsung.com/global/business/semiconductor/support/brochures/ downloads/systemlsi/Orion.pdf
– Anand Lal Shimpi. Going Out of Order: Samsung Announces Orion Cortex A9 SoC. http://www.anandtech.com/show/3901/
– Samsung. Exynos 4210. http://www.samsung.com/global/business/semiconductor/productInfo.do?fmly_id=844&partnum=Exynos%204210
– Anand Lal Shimpi & Brian Klug. Samsung's Galaxy S II Preliminary Performance: Mali-400MP Benchmarked. http://www.anandtech.com/show/4177/
• ARM Mali:– ARM. Mali-400 MP. http://www.arm.com/products/multimedia/mali-graphics-
hardware/mali-400-mp.php