La micro-arquitectura Intel Haswell: Parte 1

La nueva micro-arquitectura en la que estarán basados los futuros microprocesadores Intel Core de cuarta generación (2013).

En abril de este año Intel lanzó sus primeros microprocesadores basados en la micro-arquitectura Ivy Bridge: los CPU Core de tercera generación; microprocesadores que representaron una ligera evolución sobre la anterior micro-arquitectura Sandy Bridge. Pero el próximo año Intel tiene planeado dar el gran salto con su nueva micro-arquitectura Haswell, la que tendrá significativas mejoras.

La micro-arquitectura Haswell

Si Ivy Bridge fue un ligero refinamiento por sobre Sandy Bridge, gracias al cual se mejoró el rendimiento por ciclo en aproximadamente entre 3 a 7%, y se trajeron mejoras en el consumo de entre 15 a 20%, siendo el proceso de manufactura de 22nm el principal autor de este menor consumo; Haswell introduce consistentes mejoras arquitectónicas enfocadas a mejorar tanto el rendimiento por ciclo como el consumo energético.

Si bien Haswell no es la completamente renovada micro-arquitectura que se rumoreaba, ello no quiere decir que no existan grandes mejoras. Para empezar Haswell mantiene el diseño base estrenado en Sandy Bridge, por lo que continúa basado en módulos (unidades de enteros, SIMD FPU, Bus DMI, controlador de memoria integrado e IGP) interconectados por un bus interno en forma de anillo (Ring Interconnect); pero cada uno de sus módulos ha sufrido consistentes evoluciones.

Mayor rendimiento por ciclo

Intel ha modificado profundamente su arquitectura empezando por añadir dos etapas adicionales a su pipeline de ejecución fuera de orden, gracias a las cuales es ahora capaz de ejecutar un máximo de ocho instrucciones por ciclo (Ivy Bridge ejecuta un máximo de seis instrucciones por ciclo); con esto se persigue incrementar el rendimiento del chip, tanto en su modo estándar como en su modo SMT (HyperThreading).

Aunque Intel no lo menciona, asumimos que Haswell mantiene la estructura de datos dinámica estrenada en Ivy Bridge, la que sumada al mayor rendimiento por ciclo del chip, debe disminuir aún más la penalización al rendimiento al ejecutar aplicaciones no optimizadas para HyperThreading al estar habilitada esta característica, además de favorecer su rendimiento en aplicaciones optimizadas para ella.

También tenemos una nueva y mejorada unidad de predicción de saltos condicionales,un cache L2 (TLB de mayor tamaño) con menores latencias y el doble de ancho de banda, y un cache L1D (datos) de mayor tamaño.

 

Las nuevas unidades FMA

La unidad de punto flotante es donde observamos los cambios más drásticos de Haswell por sobre sus predecesores, pues Intel abandona el uso de sus dos unidades SIMD de 128 bits para estrenar su nueva unidad de punto flotante (FPU) compatible con instrucciones FMA, la cual es muy similar a la presente en las micro-arquitecturas Bulldozer y Piledriver de AMD, y al igual que ellas está conformada por dos unidades FMA de 256 bits por núcleo.

Ambas FMA de 128 bits, al ser usadas en conjunto (también operan simultáneamente de forma individual), son capaces de ejecutar instrucciones AVX2 de 256 bits; además de que pueden operar tanto bajo cálculos de punto flotante, como bajo cálculos de números enteros. Al igual que las unidades FMA de la micro-arquitectura AMD Piledriver son capaces de ejecutar instrucciones FMA3, las que requieren menos transistores que las unidades FMA4 usadas en la micro-arquitectura Bulldozer de AMD, al usar únicamente tres operandos (FMA4 posee cuatro operandos, esto complica el diseño de la unidad).

Turbo Boost 3.0

Como se filtró hace algún tiempo, Haswell integra un regulador de voltaje en el propio chip, el cual proporciona un ajuste y control mucho más precisos, gracias a los cuales Intel ofrecerá unas frecuencias de funcionamiento más agresivas en las variantes orientadas al alto rendimiento, y optimizadas para el bajo consumo en las variantes orientadas a equipos portátiles.

Además Intel ha mejorado el tiempo de respuesta de Turbo Boost en un 25% comparado con Ivy Bridge; esto proveerá de un mayor rendimiento en el instante que una amplicación lo requiera.

Mayor eficiencia energética

Intel trae una completamente nueva lógica de administración de energía denominada Haswell Power Managemment, la que añade un nuevo modo de ahorro energético denominado S0ix, el cual se une a los tradicionales modos S0 (carga) y S3/S4 (reposo). Podríamos definir a S0ix como un modo reposo, pero que ante el sistema operativo se reporta en modo activo; mejorando el tiempo de respuesta al cambiar entre el modo carga y reposo.

S0ix actúa sobre todas las unidades de Haswell (no únicamente sobre el CPU y GPU) y gracias a este nuevo modo se consiguen ahorros de energía mayores a 20 veces por sobre Ivy Bridge (en modo reposo requiere tan sólo 5mW), con lo cual Intel pretende traer la misma experiencia de las tablets a los equipos portátiles y de escritorio.

Los invitamos a leer la 2º parte de nuestro artículo sobre Haswell.

 

--------------------

También pueden comentar en nuestro foro.

powered byDisqus