AMD Bulldozer: ¿Por qué su rendimiento no fue el esperado?
Hace apenas 2 semanas que AMD lanzó al mercado sus esperados microprocesadores AMD FX, conocidos por su nombre código Zambezi, y los primeros basados en la nueva arquitectura Bulldozer de AMD; los que en nuestro review mostraron un rendimiento comparable al Core i7 2600K de Intel en aplicaciones de retoque fotográfico con filtros intensivos, trazado de rayos (raytracing), render de video, y otras aplicaciones profesionales que hacen uso intensivo de cuantos hilos de procesamiento posea el equipo; pero que sin embargo no lucieron tan bien en las pruebas con juegos; rendimiento algo dispar, que aprovechando un excelente análisis realizado por Ars technica, trataremos de explicar, y además poner algo de información y gráficos adicionales que por motivos de tiempo no se pudo incluir en el review de CHW; por lo que en esencia este artículo es distinto al original, el que es de lectura recomendada.
Ya hablamos detalladamente sobre el diseño modular de la arquitectura Bulldozer, y de su arquitectura CMT, responsable de compartir de recursos entre los 2 núcleos ALU presentes en cada uno de sus módulos; pero no tocamos otros aspectos del chip que son los causantes de que el punto fuerte de Bulldozer sean las aplicaciones multi-hilo intensivas y no las aplicaciones comunes usadas típicamente por el usuario promedio.
Bulldozer por dentro
Según Ars Technica, los planes originales de AMD tenían contemplado el lanzamiento de un chip tope de gama con una frecuencia base de 4.4GHz, y que gracias a su modo Turbo llegara a una frecuencia de 5GHz; pero ello no le fue posible por temas de consumo lo que la obligó a reducir sus frecuencias objetivo y sus proyecciones. Para lograr un chip que llegue a tan elevadas frecuencias de funcionamiento lamentablemente se requiere incrementar las etapas del pipeline, y con Bulldozer AMD las incrementó sensiblemente (20 aproximadamente) en comparación con su anterior arquitectura K10.5 usada en sus Phenom II (pipeline de 12 etapas). Alimentar las tuberías de un chip con un alto número de etapas requiere el uso de grandes caches, y Bulldozer tiene muchos de sus transistores dedicados a sus caches, los que si bien crecieron en tamaño (L2 y L3), incrementaron sensiblemente sus latencias, factor que afectó también a su controlador de memoria.
Si bien cada módulo Bulldozer incluye 4 decoders x86 (K10.5 incluye 3) el número de schedulers de enteros se reduce a 1 por ALU, pero al cada scheduler estar presente en la unidad ALU, no es posible usar 2 de ellos en un único hilo (para efectos comparativos K10.5 posee 3 schedulers). Esto nos resulta en que un módulo Bulldozer es capaz de ejecutar 2 operaciones de enteros simultáneamente, mientras que K10.5 puede ejecutar 3; detalle que es compensado con su mayor número de decoders x86. AMD piensa que las aplicaciones mostrarán un mayor rendimiento al procesar varios hilos de procesamiento dentro de un mismo módulo compartiendo sus L1 y L2, pues el hacer ello ahorra la latencia adicional que se daría al acceder a la L2 de otro de los módulos, o peor aún recurrir a la L3; característica que aún no ha sido posible comprobar bajo Windows 7.
Quizá el área en la que Bulldozer prometía un mayor rendimiento: su unidad de punto flotante FlexFP, la responsable de su extendido soporte a los modernos juegos de instrucciones, si bien en concepto suena impresionante por su gran flexibilidad al dividir su trabajo entre 2 hilos de procesamiento; en la práctica obedece a la nueva visión de AMD, donde el GPU será el encargado de realizar los cálculos de coma flotante, y siguiendo dicha visión usa 2 unidades FMAC de 128 bits, las que usadas en conjunto son capaces de ejecutar instrucciones AVX de 256 bits; pero una de ellas realiza el trabajo combinado de ejecutar instrucciones x87 y MMX, mientras que la otra se dedica a ejecutar instrucciones SSE y AVX. Para efectos comparativos otros CPUs poseen 3 unidades de punto flotante dedicadas a x87, MMX, y SSE/AVX, es decir mayor fuerza bruta. Debido a ello hemos apreciado que el rendimiento de test sintéticos como SuperPi, no resulta muy bueno; pues AMD espera que su rendimiento en aplicaciones SSE y AVX compense ello terminando por ofrecer un rendimiento mayor que el de su predecesor.
Hemos elaborado una tabla con todos los datos mencionados y que facilitarán su interpretación:
¿Windows 8 ofrecerá un rendimiento muy superior con Bulldozer?
Como comentamos en el review, Windows 7 no reconoce bien la arquitectura CMT y desaprovecha parte del potencial de Bulldozer, y origina un consumo mayor al tener activos todos los módulos innecesariamente, quedando sólo el throttle de frecuencias como su único método de ahorro de energía. Tomando como ejemplo al FX-8150 (3.6GHz), Windows 7 es capaz de usar el modo Turbo Core All Cores (3.9Ghz), pero no el modo Turbo Core Max (4.2GHz), característica que si podrá ser usada bajo el próximo Windows 8, logrando usar el modo Turbo Core Max (4.2Ghz) en los 2 primeros módulos (4 hilos de procesamiento), es decir una mejora del 7.7% en frecuencia, además Windows 8 podrá hacer uso del procesamiento CMT de la forma como AMD la ideó, tratando de procesar el mayor número de hilos dentro del propio módulo; brindando según AMD un rendimiento hasta 10% superior en las aplicaciones que usen pocos hilos de procesamiento (4 o menos); y quizá algunas pocas ganancias en aplicaciones que usen más de 4 hilos. Pero definitivamente ningún cambio drástico al rendimiento.
Aprovechamos para actualizar uno de los gráficos del review mostrando como se comportaría Bulldozer bajo Windows 8, además mostrando los modos Turbo:
Bulldozer: ¿Un gran diseño lanzado en el momento equivocado?
La arquitectura Bulldozer es sin dudas una de las más interesantes e innovadoras en el mundo x86; pero quizá su enfoque no se adapta mucho al usuario promedio que usa pocas aplicaciones simultáneamente, y juegos que en su mayoría apenas hacen uso de más de 2 hilos de procesamiento; siendo en la actualidad Dirt3 (EGO 2 engine) y Battlefield 3 (Frostbite 2 engine), los únicos juegos que hacen uso de múltiples hilos de procesamiento que demuestran el potencial de Bulldozer; por lo que no cabe dudas de que considerando que muchos de los nuevos motores gráficos usaran muchos núcleos para procesar muchos efectos como inteligencia artificial y físicas por CPU, Bulldozer es una apuesta a futuro.
Dejando el lado gamer y de los usuarios promedio, el rendimiento de Bulldozer en aplicaciones profesionales y nuevos softwares que le saquen provecho a sus nuevas características luce prometedor. Los de Ars Technica comentan sobre el mayor enfoque del microprocesador hacia tareas típicas de servidor y estación de trabajo, donde las aplicaciones se benefician de su capacidad multi-hilo, y su alejamiento del usuario promedio y gamer, pues los sistemas operativos de escritorio no se benefician mucho del multi-hilo; situación que sin dudas cambiará en el futuro, pero el tema es cuan conveniente será esperar por dicho futuro.
Por el momento Bulldozer es un chip que será visto con muy buenos ojos por los usuarios que usen ambientes multi-hilo intensivo con muchas aplicaciones demandantes funcionando simultáneamente; pero quizá no sea muy bien visto por el usuario promedio y gamer.
Link: Can AMD survive Bulldozer’s disappointing debut? (Ars Technica)
Pueden también comentar esta noticia en nuestro foro.
Un SSD de otro nivel: Kingston HyperX SH100S3 1...
Resumen de todo lo que vimos en el IDF2012 Bras...
IDF2012 Brasil: Intel NUC a primera vista
Aplicaciones que sacan provecho del IGP de Trinity
Trinity supera a los gráficos Intel HD 4000 en ...
Conoce los nuevos APUs AMD A-Series de 2º gener...
AMD Trinity, la segunda generación de APUs
Actualización para Dropbox, ¡bájala ya!


58 Comentarios
AMD Bulldozer: ¿Por qué su rendimiento no fue el esperado?
Si vas a usar un proce de 8 nucleos para hacerlo correr con jueguchos estas perdiendo el tiempo.
ResponderComparar y hacer benchs en juegos con un proce de este tipo no tiene sentido.
La mayoria si no es que todos los juegos corren mejor en hasta 4 nucleos no mas, inclusive rinden mejor los x2.
mientras mas nucleos mas latencia ya que se divide todo desde el sistema operativo...
si bulldozer supero a intel en rendering y video encoding que es lo que realmente deben medir poder bruto del core! todo esta bien.
faltan varios updates de las bios y nuevas tarjetas ke soporten perfectamente el nucleo. ademas de que el sistema operativo sea capaz de usar todo el potencial.
Para uso profesional bulldozer esta perfecto. para los nenes que quieren ganar 1 fps en su juegito de nenas ps mejor quedense con un proce de 2 a 4 nucleos y mejoren su vga o hagan sli o crossfire.
Realmente interesante este como los otros análisis de esta arquitectura, sin ninguna duda, alguna de las empresas grade de micro microchips tenia que cambia los estándares, si no siempre seguiríamos igual(estancado), me párese un genial decisión que a la larga le puede llegar a traer mucho beneficios no fáciles de ver a corto plazo.
ResponderSaludos
Si ahora la escusa es decir que es para server... AMD para algo tiene a su amiguito OPTERON e intel su amiguito XEON!!! asi que basta de tonteras .. Bulldozer fue lo mismo que el pentium D mucho ladrar poco morder!!!
Responderno me agrada la gente que habla y no lee porque queda mal, la verdad como decían mas arriba, para laburar el micro es bueno soy diseñador grafico y en la suite de adobe como en otros programas que sacan frutos de sus múltiples núcleos anda bien, erróneamente algunos creen que los micros para pc de sobremesa solo tienen que ser buenos para juegos, sera porque tienen entre 14 y 18 años no se pero no es asi ademas perder 3 fraps en un juego no es mucho mas si tenes una buena vga.
Responderclaro ademas que hay benchs y reviews no bien optimizados a la nueva arquitectura. los prueban como un procesador mas igual a los demas anteriores y actuales. cuando la funcionabilidad de este es un tanto mas diferente.
yo en cifras lo veo bien igual a los de intel e incluso superior en ciertas areas.
y por menor precio. que mejor.. un user dice algo de tener que cambiar la placa y la ram.. acaso los de intel no tuvieron que cambiar a 2 sockets diferentes?
ademas bulldozer sigue usando ddr3 el unico lio esque am3 no lo soporta. pero bueno es logico. o querian seguir usando la antiguedad de am2 xD? con ddr2 ?
Estos weones son el uno para el otro. Los weones odiosos.
Hex gracias por el apoyo, te comento que bulldozer si es compatible con am3 fue un error la publicacion de hace unas semanas, es compatible con los bios especiales para micros bulldozer lo que no es recomendabe es una ves que ponemos este bios (en el caso de asus el 3017) usar micos phenom II por lo tanto solo se deve actualizar a la misma si vas a usar el mobo con un bull.
Responder@ Mauro el artículo sobre AM3, no afirma que Bulldozer no será compatible con tarjetas madre socket AM3, sino sobre el que Asus no incluyó a estas en su programa de actualización de bios sin costo y como parte de su programa de soporte extendido gratuito para sus usuarios. Se mencionó que desde mayo no actualizan la versión de Bios test AM3+, y que ello no era un buen indicativo de que a futuro actualizen dicho soporte, pero ello es muy distinto a decir que no lo harán, lo que simplemente aún no se puede afirmar o desmentir.
Saludos.
@ Nicolas (Veemon) Si te hubieras molestado en leer y ver las cifras, observarías que no hay excusas, el rendimiento, mono-hilo es inferior al de la arquitectura anterior, por las concesiones que hizo AMD para lograr que este CPU fuera un Speed Demon (pipelines de muchas etapas, latencias altas, entre otras detalladas). Windows 8 tampoco significa una esperanza, pues aunque mejora un poco el rendimiento (entre 2 a 10%), simplemente ¿quien compraría algo para recién sacarle provecho el próximo año? (refiriéndome exclusivamente al sector gamer)
ResponderPara un usuario gamer no es una opción que resulte muy atractiva, salvo que AMD reajuste sus precios en relación a su rendimiento en juegos; pero para los otros usos descritos (multi-hilo) si es buena opción; y ello nada tiene que ver con servidores, pues son muchas las aplicaciones de escritorio y workstation que usan multi-hilo, ellas no son exclusivas para servidores; de otro modo no hubieran podido ser incluidas en el review, el cual se hizo con Windows 7, al igual que casi la totalidad de reviews de Bulldozer publicados en muchas webs.
Saludos.
Vuelvo a decir AMD parece que no tiene claro sus CPUS .. Opteron multi hilo server.. Bulldozer Desktop .. ese es el problema de Bulldozer... es como decir Voy a jugar con un XEON y en realdiad corre incluso peor que un SB ... pero en multi hilo es mucho mejor el XEon que el SB .. amd no tiene idea a que segmento apuntar con sus CPUs
Ahora todos estan o bien decepcionados o bien riendo del resultado. Yo creo que a largo plazo la arquitectura va a rendir. No se olviden que AMD se ajusta a Microsoft que se ajusta a Intel, pero los resultados se van a pulir con el tiempo. Hoy igualan en aspectos al 2600K, en otros es peos y en otros mejor. El problema es que querían el poder de un server de la NASA en un CPU... Con la compra de ATI todo el mundo pensaba que era un error, y hoy son las mejores VGAs en rendimiento por watt consumido. Y VEEMON, no te olvodes que Bulldozer es la misma arquitectura para escritorio y para servers, solo se duplican los módulos.
ResponderPor Dios, en verdad hay gente que cree saberselas toda.. de verdad crees que AMD no sabe lo que hace? seguramente es convirtio en el gigante que hoy en dia es por tomar decisiones al azar, aterriza hermano, AMD sabe lo que hace y nosotros lo sabremos a largo plazo, hace algunos años habrias opinado lo msimo de ATI y veo como estamos hoy, dejemos el fanatismoa un lado, que esto no es un simple juego de pelota, saludos
Por Dios, hay gente que cree saberselas todas,En verdad crees que AMD no sabe lo que hace? que se convirtio en el Gigante que hoy es por tomar decisiones al Azar? aterricen =/.. lo mismo habrian dicho de ATI ahce algunos años, y ve donde estamos, AMD CLARO que sabe lo que hace, y nosotros lo sabremos a largo plazo, esto no es un simple juego de pelotas, Saludos
ResponderEhm te ago un ejemplo De grandes empresas que supuestamente saben lo que hacen ? APPLE ... Nokia... y Codelco... Piensa en los 3 mayores errores que han cometido SI ES QUE SABEN lo que hacen
como me gustaría en estos micros que son de la serie FX dejaran desbloqueado todo, incluso para poder cambiarle la etiqueta al procesador y cambiarla por GeniuneIntel a ver si cambia en algo unas simples letras
ResponderRealmente el mejor comentario. Creo que habría un gran cambio si las aplicaciones "creyeran" que es un procesador Intel.
No solo para un usuario gamer no es atractivo...para aplicaciones profecionales YÓ preferiria un 2600k en funcion de su consumo, a saber:
Responderhttp://www.tomshardware.com/reviews/fx-8150-zambezi-bulldozer-990fx,3043-15.html
el 2600k es mas caro considerablente y rinde muy parecido en aplicaciones profecionales el tema del consumo es un invento, queres ahorrar wats pone lamparas de bajo consumo en tu casa que conque tengas una sola comun ya tenes mas de la diferencia que hay en los micros.
En vista de semejantes atrocidades en los comentarios, los cerraremos un ratito para que se calmen. ¿ok?
ResponderDeja tu Comentario