miércoles, 17 de marzo de 2010

Qué hago si falla un disco en mi RAID

Existe muchísima información sobre el tema RAID, pero en la mayoría de las ocasiones ésta es "demasiado técnica" e incomprensible para el profano. Podemos llegar a intuir en qué consiste un tipo de RAID y sus ventajas y desventajas, pero lo que es mucho más difícil de encontrar, y más en nuestro caso, es qué hacer cuando hay problemas y cómo resolver éstos.

Que quede claro que un RAID "no hace copias de seguridad" ni supone una garantía absoluta de que no haya pérdida de datos. Lo único que garantiza ésto último es hacer copias de seguridad con la mayor frecuencia posible. Un RAID sirve para aumentar la capacidad de almacenamiento, incrementar la velocidad de acceso a los datos, evitar pérdidas de tiempo en caso de problemas, o minimizar las consecuencias en caso de desastre. Y aún en el caso de que evitemos el desastre por fallo mecánico, un RAID no nos salva del error humano, y si alguien modifica o borra algo por error, de nada sirve que los datos estén en un RAID. Por tanto, hacer "backups", más que aconsejable, debe considerarse imprescindible.

Mi experiencia con configuraciones RAID no es muy amplia. En ocasiones he tratado con RAIDs en "espejo" o en "stripe"" creados en un PC con Windows utilizando una tarjeta controlador. La mayoría de las veces ha sido con RAIDs creados "por software" en ordenadores Mac, o bien se ha tratado de dispositivos RAID específicos, ya sean los sencillos tipo LaCie, Buffalo o iOmega, o los mucho más sofisticados, fiables y caros de StoreData.

Como hemos visto, se pueden crear RAID de discos mediante software, mediante hardware, pero también de forma combinada. Mac OS X, por ejemplo, permite crear RAIDs de forma muy sencilla (RAID 0, RAID 1, JOBD) mediante la "Utilidad de Discos". Pero para otros "niveles de RAID" se necesita de un hardware específico (una tarjeta controlador RAID) que debe instalarse en el ordenador, o recurrir a configuraciones externas de terceras partes.


Además de los que veremos más adelante, existen otros tipos de RAID (RAID 2, RAID 3, RAID 4, RAID 6, RAID 30…) pero o están en desuso, o requieren de configuraciones avanzadas y son para usos muy específicos.

De modo esquemático, y pretendiendo explicarlo de la forma más sencilla y menos técnica posible, éstos serían los "niveles de RAID" más habituales:

RAID 0
Se crea combinando dos o más discos (no han de ser forzosamente del mismo tamaño), formando una única unidad. Es decir, aunque se trate de dos o varios discos, el ordenador los verá como uno solo. Sin embargo, aprovecharemos de cada uno de los discos solo un espacio igual al del disco más pequeño. Por ejemplo, si tengo tres discos de 500GB y uno de sólo 80GB, sólo dispondría de un total de 4 X 80 GB. Por esto, lo normal es utilizarlos todos de la misma capacidad. Y no sólo esto, es recomendable que sean similares en velocidad de giro o revoluciones por minuto (5.400, 7.200, 10.000….) o incluso marca y modelo.

Podemos crear el RAID por software mediante "Utilidad de Discos" utilizando dos o más unidades internas (en un MacPro, por ejemplo). También es posible hacerlo con varios discos externos USB o Firewire, pero esto crea una configuración mucho más inestable e insegura. Si debe hacerse con discos externos, es mucho más fiable utilizar conexiones eSATA; además el rendimiento es mayor.

Existen discos externos ("cajas") de Maxtor, Fujitsu, LaCie, iOmega y otros, con un "RAID por hardware" creado con dos o más discos y una controladora interna. En muchos casos la única configuración posible -si existe- es RAID 0.

VENTAJAS
Conseguimos crear un disco con un gran espacio continuo de almacenamiento. La velocidad de lectura es alta y podemos grabar grandes archivos y proyectos de video, utilizarlo como disco de "Time Machine" o espacio para copia de seguridad, etc.…

DESVENTAJAS
La probabilidad de fallo mecánico de dos discos es el doble que en el caso de una única unidad. Si falla uno de los dos, perdemos TODA la información contenida en ambos. Volvemos a insistir en el tema de las copias de seguridad.

QUÉ HACER SI FALLA UN DISCO
Por lo pronto, ya hemos perdido todos los datos almacenados, a menos que dispongamos de backup. Si hemos creado el RAID con "Utilidad De Discos" en principio podemos sustituir el disco que falla por uno nuevo y volver a restaurar el grupo RAID desde la misma utilidad. Ello supone dejar de trabajar sobre el disco durante el proceso.

Si se trata de un disco externo sin "slots" o discos extraibles, habría que desmontar la unidad, sustituir el disco dañado en el caso de que supiéramos identificarlo, y confiar en que la unidad reconstruya el RAID por si sola, cosa que no siempre ocurre, y se perderán todos los datos. En los modelos más avanzados (iOmega Ultramax Pro, por ejemplo), en los que si se puede reemplazar los discos fácilmente, la unidad avisa del fallo de uno de los discos y permite sustituirlo por uno similar, para a continuación, reconstruir el RAID de nuevo. En todo caso, se pierden los datos grabados.


RAID JBOD (o discos "concatenados")
Como en RAID-0, dos, tres o más discos (incluso de diferente tamaño), formando una única unidad. También, aunque se trate de dos o varios discos, el ordenador los verá como uno solo. La diferencia -y creo que única ventaja- es que los discos pueden ser de diferentes capacidades, aunque "sin perder espacio disponible", y que los datos se graban llenando los discos uno detrás de otro. Personalmente la considero la menos fiable, estable y recomendable de las opciones.

Podemos crear el RAID por software mediante "Utilidad de Discos" utilizando varias unidades internas. También es posible hacerlo con discos externos USB o Firewire (incluso combinar discos externos e internos). Pero como ya hemos dicho, la configuración puede ser inestable e insegura, y es más fiable utilizar conexiones eSATA.

En algunos unidades externas con su propia controlador interna, es posible cambiar la configuración y elegir JOBD. Algunos modelos más caros disponen de "slots" o bandejas que permiten extraer fácilmente los discos.

VENTAJAS
Utilizando diferentes discos y de distintas capacidades, conseguimos crear un disco con un gran espacio contínuo de almacenamiento y podemos grabar grandes archivos o proyectos de video, utilizarlo como disco de Time Machine o espacio para copia de seguridad, etc.… Si falla un disco, en algunos casos perderemos sólo la información almacenada en esa unidad en concreto.

DESVENTAJAS
La velocidad de escritura y el rendimiento no son precisamente ellos mejores. La probabilidad de fallo mecánico de varios discos es mayor que en el caso de una única unidad.

QUÉ HACER SI FALLA UN DISCO
Deberemos intentar rescatar la información de los discos restantes, sustituir el disco dañado y volver a formatear y crear el RAID. A continuación habría que restaurar los datos desde la copia. Todo esto supone dejar de trabajar sobre el disco y la consecuente pérdida de tiempo.

En algunas unidades externas, el fallo de uno de los discos en JOBD supone la pérdida total de los datos. Solo cabe reemplazar el disco dañado y restaurar desde la copia de seguridad.


RAID 1 ("mirror" o "espejo")
Dos discos, que debieran ser de igual capacidad (y marca, modelo, RPM, etc.…), formando aparentemente una única unidad. Si no son de la misma capacidad se considera que ambos tienen la misma que el disco más pequeño. Es decir, aunque se trate de dos discos, uno de 500GB y otro de 750GB, el ordenador los verá como uno solo de 500GB. La diferencia con RAID-0 es que los datos se escriben, modifican y borran simultáneamente en ambas unidades, siendo cada una la copia idéntica de la otra. No se va creando automáticamente una "copia de seguridad", sino que el ordenador escribe y borra los mismos datos en ambos discos y al mismo tiempo.

Podemos crear el RAID por software mediante "Utilidad de Discos" utilizando dos unidades internas. También es posible hacerlo con dos discos externos USB o Firewire, pero esto crea una configuración mucho más inestable e insegura (y mucho peor si combinamos internos y externos). Si debe hacerse con discos externos, es mucho más fiable utilizar conexiones eSATA.

En algunos discos externos de Western Digital, LaCie, Buffalo, iOmega y otros, con RAID y controladora internos, es posible cambiar la configuración y elegir entre RAID 0 y RAID 1. Es más, algunos modelos más caros disponen de "slots" o bandejas que permiten extraer fácilmente los discos, o bien resulta fácil abrir la caja para hacer el cambio.


VENTAJAS
Si falla uno de los dos discos, dispondremos de toda la información en el otro. Conseguimos crear un disco con un gran espacio continuo de almacenamiento. Ofrece una mayor velocidad, aunque solo en la lectura.
Para grabar grandes archivos de video, para utilizarlo como disco de Time Machine o espacio para copia de seguridad, etc.…

DESVENTAJAS
La velocidad de escritura "al repartirse tiempos" es algo menor que en una única unidad, lo cual puede afectar al rendimiento general, aunque en la mayoría de los casos esto no es perceptible.

QUÉ HACER SI FALLA UN DISCO
Es posible que ante un fallo mecánico de uno de los discos el ordenador se cuelgue o de errores, especialmente si el RAID es interno. Deberemos desconectar el disco dañado y reiniciar sólo con "el disco sano". Normalmente no habremos perdido información, pero si no disponemos de copia de seguridad deberemos hacerla inmediatamente.

Si hemos creado el RAID con "Utilidad De Discos" (Mac OS X) en principio podemos sustituir el disco que falla por uno nuevo y "reconstruir el grupo RAID" desde la misma utilidad. Si esto no funciona, habría que volver a crear el RAID, perdiéndose todos los datos, por lo que sería necesario restaurarlos desde la copia de seguridad. Todo esto supone dejar de trabajar sobre el disco y la consecuente pérdida de tiempo.

Si se trata de un disco externo sin "slots" o discos extraibles, habría que desmontar la unidad, sustituir el disco dañado en el caso de que supiéramos identificarlo, y confiar en que la unidad reconstruya el RAID por si sola, cosa que no siempre ocurre, perdiéndose todos los datos. En los modelos más avanzados (iOmega Ultramax Pro, por ejemplo), en los que si se puede reemplazar los discos fácilmente, la unidad avisa del fallo de uno de los discos y permite sustituirlo por uno similar, para a continuación, reconstruir el RAID automáticamente y sin perdida de datos …. al menos en teoría.


RAID 0+1
Viene a ser una combinación de RAID-0 y de RAID-1. A diferencia de RAID 1, los datos se escriben, modifican y borran simultáneamente no en dos discos, sino en dos "stripes" o parejas de discos en RAID 0. Por ejemplo: si disponemos de cuatro discos de 500GB, crearemos dos "RAID-0" de 1TB, y con estos dos un RAID-1 de 1TB.

VENTAJAS
Si falla uno de los dos discos de una de las parejas, dispondremos de toda la información en la otra. Conseguimos crear un disco con mas espacio continuo de almacenamiento que con solo dos discos, pero con la seguridad que proporciona el RAID 0.

DESVENTAJAS
La velocidad de escritura "al repartirse tiempos" es algo menor que en una única unidad, aunque mejor que en un "mirror simple". Las posibilidades de reconstruir el RAID en caso de fallo de uno de los discos, pueden ser menores que en el caso de RAID 0.

QUÉ HACER SI FALLA UN DISCO
También en este caso es posible que ante un fallo mecánico de uno de los discos el ordenador se cuelgue o de errores. Deberemos desconectar los discos de la pareja afectada y utilizar sólo la otra, y aunque tampoco habremos perdido información, si no disponemos de copia de seguridad deberemos hacerla inmediatamente.

Si hemos creado el RAID con "Utilidad De Discos" (Mac OS X) en principio podemos sustituir el disco que falla por uno nuevo e intentar "reconstruir el grupo RAID" desde la misma utilidad. Si esto no funciona, habría que volver a crear el RAID, perdiéndose todos los datos, por lo que sería necesario restaurarlos desde la copia de seguridad. Todo esto supone dejar de trabajar sobre el disco y la correspondiente pérdida de tiempo.

Si se trata de un disco externo sin "slots" o discos extraibles, habría que desmontar la unidad, sustituir el disco dañado en el caso de que supiéramos identificarlo, y cruzar los dedos para que la unidad reconstruya el RAID ella solita, cosa que no siempre ocurre, perdiéndose todos los datos. Como en el caso de RAID 0, sólo en los modelos más avanzados que soporten RAID 0+1 y en los que se pueda reemplazar los discos fácilmente, la unidad avisará del fallo de uno de los discos y permitirá sustituirlo por uno similar, para a continuación, reconstruir el RAID automáticamente y sin perdida de datos …. al menos en teoría.

Existe una variante, menos habitual, llamada RAID 1+0, en la que en vez de combinar dos RAID 0 para crear un RAID 1, se crea el RAID 0 partiendo de dos RAID 1. La ventaja con respecto a RAID 0+1, es que pueden fallar simultáneamente un disco de cada grupo RAID 1 sin que se pierdan datos.


RAID 5
Es la solución más equilibrada en cuanto a espacio / rendimiento / seguridad, pero a menos que podamos instalar una tarjeta controladora (por hardware) en nuestro ordenador, sólo podremos hacer esto utilizando un configuración RAID externa como las de StoreData, LaCie, iOmega, iData, etc…
Se utilizan un mínimo de tres discos, y los datos se guardan en éstos -sin entrar en tecnicismos- de tal modo que cada uno de ellos guarda parte de la información de los otros. Es decir, si uno disco falla, no perdemos la información porque sus datos también son conservados por los demás discos.

VENTAJAS
Conseguimos crear un disco con un gran espacio contínuo de almacenamiento, pero en el que si falla una de las unidades, no perderemos los datos. El rendimiento es alto y es adecuado para grabar grandes archivos de video, para ser utilizado en un servidor sobre el que trabajan muchos usuarios, etc.… Y algo muy importante, a pesar del fallo de una unidad, el RAID sigue funcionando y sigue siendo accesible, por lo que se evita una interrupción brusca del trabajo. Sin embargo, tan pronto como sea posible habrá que sustituir la unidad dañada. En algunas configuraciones es posible extraer el disco dañado "en caliente" (sin apagar nada) y sustituirlo por uno nuevo, del tal manera que el RAID "se reconstruya" automáticamente y sin pérdida de datos. Todo ello, sin que los usuarios deban interrumpir forzosamente el trabajo.

DESVENTAJAS
"Perdemos" el espacio correspondiente a uno de los discos. Se suele calcular como "n-1", es decir, la suma de la capacidad de todos los discos menos uno (suponiendo que todos los discos sean de la misma capacidad).

QUÉ HACER SI FALLA UN DISCO
Lo normal es que el RAID avise de los fallos mediante una alarma sonora (pitidos), LEDs luminosos y mensajes en el display, si dispone de él. Normalmente no habremos perdido información, pero si no disponemos de copia de seguridad deberemos hacerla inmediatamente.
En teoría, incluso en las configuraciones más económicas, se puede -sin apagar el RAID- sustituir el disco dañado por otro y el RAID-5 se reconstruye automáticamente, pero esto no siempre funciona. En ese caso habrá que sustituir el disco dañado, formatear de nuevo el RAID y restaurar los datos desde la copia, lo cual supone dejar de trabajar sobre el disco y con una gran pérdida de tiempo. Sin embargo, en dispositivos avanzados como los de StoreData sí que se puede sustituir sin ningún problema un disco dañado, y sin que los usuarios que trabajan sobre el se enteren de nada. Es muy aconsejable disponer desde el principio, de un disco de reserva "por si acaso".
Es muy importante saber, que es demasiado habitual que tras fallar uno de los discos, comiencen a fallar los demás en breve espacio de tiempo. Lo desastroso sería que fallase un segundo disco antes de que terminase de reconstruirse el RAID, lo que supondría la pérdida total de los datos.  Hasta el punto de que hay algunos que montan los RAID con discos de la misma marca y modelo, pero de diferentes fechas de fabricación o lote, para evitar en lo posible la coincidencia en el tiempo de posibles fallos.


RAID 5E o con "Spare Drive" (Con disco de respaldo)
También requiere de una tarjeta controladora o de hardware externo (caja y controladora), como las de LaCie, iOmega, iData, etc… Se utilizan un mínimo de cuatro discos, pero se reserva uno como "disco de respaldo" y los datos se guardan en el resto de ellos como en el caso del RAID-5. Es decir, si uno disco falla, no perdemos la información porque sus datos también son conservados por los demás discos de ese grupo. La diferencia está en que en éste caso, el disco de respaldo pasa automáticamente a ocupar el lugar del disco dañado, y el RAID queda a la espera de que el "slot" o bandeja de éste venga a ser ocupado por un disco de respaldo nuevo.

VENTAJAS
Máxima fiabilidad, "automatismo" y facilidad de restauración combinadas con la las ventajas de RAID-5. A pesar del fallo de una unidad, el RAID sigue funcionando y no supone una interrupción del trabajo, aunque lo prudente es sustituir la unidad dañada tan pronto como sea posible. Por supuesto, es posible extraer el disco dañado "en caliente" y sustituirlo por uno nuevo, del tal manera que el RAID "se reconstruya" automáticamente y sin pérdida de datos.

DESVENTAJAS
"Perdemos" el espacio correspondiente a dos de los discos. Si disponemos de cuatro discos de 1TB de capacidad, solo dispondremos de 2TB para guardar datos.

QUÉ HACER SI FALLA UN DISCO
Es la configuración que más fácil nos lo pone. Lo normal es que el RAID avise de los fallos mediante una alarma sonora (pitidos), LEDs luminosos y mensajes en el display, si dispone de él. Muy raramente habremos perdido información, pero si no disponemos de copia de seguridad deberemos hacerla inmediatamente.
Al contrario que en las configuraciones más económicas tipo RAID-5, el disco de respaldo pasa automáticamente a ocupar el lugar del disco dañado, y el RAID queda a la espera de que el "slot" o bandeja de éste venga a ser ocupado por un disco de respaldo nuevo.
Recordemos, como decía antes, que es habitual que tras fallar un disco, fallen otros en poco tiempo; así que no debemos dejar transcurrir ni siquiera horas antes de sustituir el disco.









9 comentarios:
  1. Hola! Tu post es realmente bueno. Yo tengo un Iomega Ultramax Pro, ya llene los 2 discos que han venido de fabrica y los estoy reemplazando al mismo tiempo, pero no consigo hacerlos aparecer en el finder de mi Mac. Alguna sugerencia? puedes escribirme a felixbusso@gmail.com Gracias!

    ResponderEliminar
  2. Entiendo que has sustituido los dos discos originales por dos nuevos. Deberías ir a Utilidad de Discos para ver si la nueva "unidad de disco" (formada por los dos nuevos discos) es visible y necesita ser formateada.

    ResponderEliminar
  3. Es importante indicar que ante una falla fisica de uno o mas discos del RAID lo importante cuando se quiere recuperar la informacion es saber que hacer. Una opcion es la de llamar a alguna empresa especializada en recuperaciones de datos. Algunas a nombrar: OnRetrieval, Ontrack, Onrescue,...
    El coste del servicio dependera del problema, la complejidad y el volumen de informacion a recuperar.
    Lo cierto es que si estas empresas no pueden solucionar el inconveniente, nadie podra...

    ResponderEliminar
  4. HOLA TENGO UN PRROBLEMA he adquirido un NAS llamado Netgear Stora con un Solo Disco .
    al momento de ingresar el segundo disco en Formato Ntfs no sirve pues el NAS solo lee Formato JBOD ..... el problema es que he intentado todo y no he podido formatear el Disco en JBOD..... con que programa podría hacer este formato ? GRACIAS

    ResponderEliminar
  5. HOLA TENGO UN PRROBLEMA he adquirido un NAS llamado Netgear Stora con un Solo Disco .
    al momento de ingresar el segundo disco en Formato Ntfs no sirve pues el NAS solo lee Formato JBOD ..... el problema es que he intentado todo y no he podido formatear el Disco en JBOD..... con que programa podría hacer este formato ? GRACIAS

    ResponderEliminar
  6. explicación clara y precisa para los que apenas estan conociendo como funcionan los diferentes tipos de RAID

    ResponderEliminar
  7. Hola tengo una controladora LSI en SAS2 pero el equipo no levanta se queda inicializando
    que puedo hacer para recuperar el arreglo de discos que tengo en raid5

    ResponderEliminar
  8. Hola buenas tardes:

    Tengo un dvr ipela con raid 5 para grabacion, 4 discos de 1 tb cada uno, con un total de 11 tb de almacenamiento. Tuve que sustituir un disco pero no de iguales caracteristicas al reemplazado, a raiz de esto el sistema del dvr se ha tornado lento y problema de funcionamiento, el cambio de disco seria factor para ello?

    ResponderEliminar
  9. Espero pueda compartir con nosotros más información sobre la recuperacion raid o configuraciones que faciliten la seguridad de la información

    ResponderEliminar