Errores en DRAM son más frecuentes de lo pensado

Errores en DRAM son más frecuentes de lo pensado

Culpa de las placas madres

Publicado el 05/10/09 a las 3:15 pm por Geovanne Salinas

Un estudio de 2 años y medio de duración realizado en 10 de los cientos de servidores de Google, demostró que la tasa de fallos en módulos DIMM puede ser hasta mil veces más alto de lo que originalmente se piensa.

Este es el primer estudio a gran escala que intenta obtener información sobre los errores de memoria, y para ello se probaron distintas plataformas, proveedores, tamaño de las unidades y tipos de memorias de acceso aleatorio dinámicas (DRAM) como DDR1, DDR2, FB-DIMM:

picture-27

La incidencia de errores puede alcanzar los 4.000 por DIMM al año, y esto se incrementa al utilizar más módulos en la misma maquina. Los servidores de Google utilizan ECC DRAM lo que permite corregir errores de 1 sólo bit, y reportar los demás, pero el tener memorias ECC es bastante caro y sólo es justificable en sistemas grandes, por lo que el reporte nos alerta que podríamos tener problemas de memoria en este mismo momento (SI, ¡AHORA!) y nuestro sistema no tiene como saberlo por la ausencia de ECC.

La pregunta del millón: ¿Es problema realmente de las memorias? La verdad es que no, las distintas plataformas de prueba comprueban que los errores dependían de las placas y no del fabricante o densidad de memoria. Que la ruta de acceso a memoria este cerca de componentes ruidosos (electromagnéticamente) o EMIs con poca higiene serian los causantes del bajo desempeño.

Pero no todo es malo en este estudio, también nos encontramos con varios puntos a favor para quiénes usamos este tipo de memorias como:

  • La temperatura no influye demasiado en los errores, por lo que no es necesario poner un refrigerador en tu PC
  • El uso intensivo de memoria conduce a los errores (como servidores y otros)
  • No existen muchas diferencias entre FB-DIMM, DDR1 o DDR2, por lo que puedes elegir tu sabor favorito
  • Entre menos modulos tengas, menos posibilidad de error. Pequeños sistemas WIN

Sin duda este es un estudio muy interesante de  leer y lo puedes encontrar a continuación, DRAM Errors in the Wild: A Large-Scale Field Study

Link: DRAM error rates: Nightmare on DIMM street (ZDNET)

CompárteloCompártelo

Publicado por Geovanne Salinas el 5 de October 2009, con los tags , , , , en la categoría Noticias

Comenta este Artículo

Comenta este Artículo

Este artículo tiene 6 Comentarios. Deja tu Comentario!

Los Últimos comentarios del foro para esta noticia:

    Avatar
    osea que ya tenemos una mejor explicacion para los errores en procesos que no deberian fallar normalmente ?

    ojala sea asi, y los sistemas que salgan mas adelante vengan mas higienico (electromagneticamente-hablando claro)

    bytes

    Avatar
    A todo esto Glass, te pasaste para ingenuo, se estima que Google posee alrededor de 1 millón de servidores.

    Avatar
    Muy elevada la tasa, pero a mi, el PC no se me cuelga ni tiene errores casi nunca, asi que :dalomismo

    Avatar

    bueno kreo k especifika un poko mas lo de sistemas, pero segun yo entendi que al estar cerka de muchas kosas k producen electromagnetismo, osea, ventiladores, discos duros, inclusive hay placas en donde la conexion de fuente de poder esta muy cerca de la memoria, eso tambien lo provoca, o ...

    Avatar
    No se les ocurrio pensar en la radiación Cósmica, partículas altamentente cargadas provenientes del espacio exterior, salidas de supernovas distantes, que caen y destruyen nuestras cadenas de ADN, y porque no, las frágiles conexiones de memorias

    Un estudio de la NASA rebela que u...

eXTReMe Tracker