Protección de datos en la era de la nube

Desde finales de la década de 1980, RAID ha sido un método fundamental de protección de datos. Pero RAID surgió en un mundo de SAN y NAS en productos de matriz de hardware. Ahora la nube y tecnologías como el almacenamiento de objetos están en ascenso y están predominantemente protegidas no por RAID, sino por codificación de borrado.

La codificación de borrado promete acabar con el tipo de tiempos de reconstrucción prolongados que vienen con los tamaños de disco grandes y RAID. Entonces, ¿la codificación de borrado es un reemplazo potencial para RAID? Analizamos los pros y los contras de la codificación de borrado.

Resumen de RAID RAID virtualiza varios discos para formar una unidad lógica. Si una o más unidades fallan, el usuario puede recuperar datos reemplazando la unidad defectuosa y reconstruyendo la matriz. Esto proporciona una protección de datos sólida a un costo relativamente bajo.

Pero los crecientes volúmenes de datos y el desarrollo de tecnologías como la nube y el almacenamiento de objetos han ejercido presión sobre la tecnología RAID convencional.

La recuperación de un gran volumen RAID puede llevar demasiado tiempo para ser práctica en un entorno empresarial de trabajo. Los expertos de la industria generalmente dicen que cualquier volumen superior a 8 TB provocará reconstrucciones inaceptablemente lentas.

Y la copia de seguridad RAID convencional no puede manejar completamente la hiperescala o almacenamiento distribuido hiperconvergente , donde los proveedores de almacenamiento de objetos, incluidos los proveedores en la nube, mantienen los datos en múltiples arreglos en múltiples ubicaciones físicas. Y los controladores RAID añaden complejidad.

Ingrese la codificación de borrado Codificación de borrado proporciona una respuesta para conjuntos de datos muy grandes y para aplicaciones como el almacenamiento definido por software y objetos.

La codificación de borrado se basa en la paridad, lo que significa que los datos se dividen en fragmentos y se codifican, por lo que se pueden almacenar en cualquier lugar. Esto lo hace adecuado para proteger el almacenamiento en la nube. La codificación de borrado también utiliza menos capacidad de almacenamiento que RAID y permite la recuperación de datos si fallan dos o más partes de un sistema de almacenamiento.

Usos de codificación de borrado corrección de errores hacia adelante . Esto es similar a la tecnología utilizada en transmisiones de radio, incluso en móviles GSM. Otra forma de ver la codificación de borrado es como una forma de compresión con pérdida, en la línea de la tecnología utilizada para crear un archivo MP3 o un CD de música. En estos, si un dato se divide en 16 componentes, el original se puede recuperar con solo 10.

Esto hace que la codificación de borrado sea más económica que RAID. Como señala Bryan Betts, analista de Freeform Dynamics, la forma más simple de EC usa "medios códigos" para cada dato. Entonces, la codificación agrega un requisito de almacenamiento del 50%.

Y debido a que los datos pueden estar en cualquier lugar, el sistema es potencialmente mucho más robusto. Un volumen de almacenamiento protegido por codificación de borrado debería tener un riesgo de falla de hardware mucho menor que uno protegido por RAID.

Los tiempos de recuperación también serán más rápidos, dependiendo de cómo esté configurado el sistema de almacenamiento. En realidad, los sistemas codificados por borrado no necesitan reconstruirse, por lo que potencialmente podría haber una falla sin que el usuario se dé cuenta, siempre que haya suficientes símbolos para recrear los datos. La reconstrucción de la paridad para las nuevas unidades puede ocurrir en segundo plano.

La codificación de borrado no es una copia de seguridad Sin embargo, la codificación de borrado tiene desventajas. El principal de ellos es la sobrecarga de procesamiento. La codificación de borrado es UPC -intensivo. RAID, por su parte, simplemente almacena copias de los datos en otro disco o banda RAID. El impacto de la carga de la CPU también puede generar latencia. Pero este no es el único inconveniente.

“Desde el punto de vista arquitectónico, la codificación de borrado puede ser más exigente para el sistema para calcular paridad ”, Dice Scott Sinclair del analista ESG.

“También es importante comprender que la codificación de borrado es solo un nivel de protección y no reemplaza la copia de seguridad. Es solo una forma eficiente de protegerse contra fallas de discos duros o SSD ".

La codificación de borrado no reemplaza la copia de seguridad convencional, especialmente para los sistemas locales. "Son totalmente diferentes", dice Betts. "Copia de seguridad significa tomar una segunda copia independiente, preferiblemente almacenada con un ' entrehierro '. El hecho de que sus datos primarios estén protegidos por códigos de borrado no impide que se corrompan o eliminen accidental o maliciosamente ".

Las organizaciones aún necesitan copias de seguridad para protegerse contra amenazas como el ransomware.

Además, la codificación de borrado no es un reemplazo completo de la replicación de datos. Para las empresas que utilizan la codificación de borrado para proteger los datos en sus propias instalaciones, en lugar de a través de un servicio en la nube, es vital considerar cómo se recuperarían de una falla en el sitio.

La replicación completa fuera del sitio permite que las operaciones se reinicien desde el sitio de conmutación por error, pero la codificación de borrado no proporciona una copia completa de los datos. Sinclair de ESG recomienda que las empresas tengan una copia secundaria de todos los datos de producción, incluso si utilizan codificación de borrado.

La codificación de borrado se puede configurar como una alternativa a la replicación fuera del sitio, pero hacerlo requiere una planificación cuidadosa.

Los directores de TI deben saber dónde se almacenan los elementos de datos y asegurarse de que estén en ubicaciones suficientes para permitir la recuperación si una ubicación sufre una falla total.

Y los entornos distribuidos pueden afectar el rendimiento debido a la sobrecarga del procesador de decodificación.

¿Mantenerlo en la nube? Hasta la fecha, la codificación de borrado se asocia principalmente con el almacenamiento de objetos y, por lo tanto, con la nube. Se considera menos adecuado para bloquear o archivar. Pero los proveedores de NAS ahora utilizan la codificación de borrado (NetApp la implementa en su StorageGRID), pero también se usa en vSAN de VMWare, Hadoop y AOS de Nutanix.

Normalmente, la codificación de borrado funciona en sistemas distribuidos diseñados para aceptar un cierto nivel de latencia, o donde la latencia no es crítica para el usuario final. Nutanix, por ejemplo, recomienda la codificación de borrado para copias de seguridad, archivado, GUSANO cargas de trabajo y correo electrónico, pero no para aplicaciones de escritura intensiva.

Pero para conjuntos de datos muy grandes, la codificación de borrado podría ser la única opción práctica para proteger los datos.

“Los entornos de almacenamiento de objetos suelen ser demasiado grandes para poder realizar copias de seguridad completas con regularidad”, dice Sinclair. “Necesitan una tecnología de protección que garantice niveles más altos de disponibilidad con la copia principal.

“Además, a gran escala con unidades de gran capacidad, las reconstrucciones RAID tradicionales a menudo pueden llevar demasiado tiempo, lo que puede poner en riesgo los datos si ocurre otra falla durante la reconstrucción”.

Como resultado, la codificación de borrado parece estar preparada para desempeñar un papel cada vez más importante en la empresa, pero es solo una herramienta en la caja de herramientas de protección de datos.