La Deduplicación: eficiencia máxima por ti datacenter

La palabra Deduplicación se está poniendo de moda en todos los catálogos de cabinas de almacenamiento. Se está convirtiendo en la funcionalidad más buscada. Por mucho que los fabricantes de discos digan que el coste por GB es muy bajo, la realidad es que el almacenamiento sigue siendo muy caro. Cuanto más se pueda ahorrar en él, mejor.

¿Qué es la Deduplicación?

En mi anterior artículo, hablo sobre qué es y cómo afecta a nuestras máquinas la Deduplicación. En resumen, un almacenamiento deduplicado contiene una colección de bloques únicos y conjuntos de metadatos que permiten a estos blogs ser identificados y representados en un sistema informático. Estos blogs son los que componen cada una de nuestras VMs (Máquinas Virtuales), las cuales en gran mayoría no son más archivos de disco.

Los metadatos

Simplificando conceptualmente, los metadatos son una lista de qué bloques únicos de datos son los necesarios para construir la VM. En el almacenamiento tradicional, cada bloque de información de cada VM ocupa un bloque de espacio en el disco, haciendo que éste contenga muchísimos blogs duplicados que podrían ser optimizados. Un almacenamiento deduplicado guarda únicamente un bloque único de cada, reduciendo considerablemente el espacio necesario y brindando a los administradores de sistemas mucho más espacio disponible. Esto supone un ahorro de coste para la empresa. Y es que, al final, su clúster de VMs son decenas de clones de una plantilla de una VM con un Windows 2012 R2 instalado, modificados y adaptados a cada una de las funciones de sus servicios.
simplivity-1

La Deduplicación de Simplivity

SimpliVity crea un sistema de archivos basado en estos metadatos. Cuando la VM hace una escritura o lectura, lo primero que hace es consultar esta lista para comprobar si existe este blog y/o dónde se encuentra realmente en el disco. Si el blog existe, no se escribe. Sólo actualizamos los metadatos. Si no existe, entonces lo escribe en el almacenamiento.
simplivity-3
Normalmente, los metadatos son un archivo de texto con una tabla de punteros en los blogs. Por tanto, ocupan un espacio en disco que varía según el tamaño de datos que representa. Por ejemplo: un vmdisk de una VM es un archivo de 100 GB lleno de datos, pero que en realidad sólo ocupan 25 GB en bloques únicos y 10 MB en metadatos (ojo, los números son inventados – ¡no son reales!) Esta combinación de blogs únicos y los metadatos es lo que realmente necesitamos almacenar en nuestros discos para representar un vmdisk en un instante concreto de su vida.
simplivity-2

La clonación de una VM en un almacenamiento deduplicado

En un sistema de almacenamiento deduplicado, clonar una VM es tan simple como realizar una copia de los metadatos. Éstas se convierten en punteros en bloques de datos únicos que ya han sido almacenados y no hay ninguna necesidad de volverlos a almacenar. Esto significa que para hacer una copia de nuestra VM de 100 GB, basta con copiar los 10 MB de metadatos, que además en un nodo de SimpliVity, están almacenados en los discos SSD. Dicha operación de lectura/escritura es prácticamente instantánea. Con esto, podemos realizar un número considerable de clonados de VMs en pocos segundos. Por este motivo, para entornos VDI con creación de máquinas, eliminamos el tanto temido bootstorm al inicio de la jornada laboral.
A priori pensará: "no necesito un sistema capaz de clonar una VM 100 por minuto y, salvo que administre el CPD de una multinacional con cientos de usuarios conectándose a sus VDIs a las 8:00, dudo mucho que esto me sea relevante" . Pero mirémoslo desde otro punto de vista.

¿Qué causa tener un entorno virtualizado con 100 VMs?

Tienes un entorno virtualizado con 100 VMs y no puedes hacer otra cosa que una copia entera de cada una de ellas en un horario nocturno. Todo se debe a las limitaciones de las ventanas temporales que nos dan a los administradores de TI.

¿Y si deseara hacer un backup varias veces al día de estas 100 VMs?

Para un almacenamiento deduplicado, un backup y un clonado son exactamente lo mismo. Por tanto, podemos hacer tantos backups de nuestro entorno como queramos. Al final, el impacto en volumen de almacenamiento es mínimo. Además, el impacto en el rendimiento de las máquinas, ¡mucho menos!
Esto abre un mundo de posibilidades a los administradores de tareas rompiendo el concepto tradicional de las copias de seguridad. Ahora puedes hacer copias de los sistemas de archivos varias veces al día. Si un usuario comete alguna imprudencia (recuerda el nocivo que ésta siente CryptoLocker, Ramsonwares, etc.), tienes un punto de recuperación muy cercano. Así, se minimiza los daños en el sistema con un rollback a sólo minutos antes del desastre. Esto te permite restaurar, si quieres, un único archivo: ¡no todo un VM!

El almacenamiento virtual de Simplivity

Lo más importante de la propuesta de SimpliVity es que el sistema ha sido diseñado desde 0 exclusivamente para ser eficiente. Por este motivo, la Deduplicación se aplica sólo cuando se realiza la escritura del dato. Todas estas tareas con los metadatos (comprobar bloques duplicados, escrituras, lecturas, etc.) son absorbidas por la Tarjeta Aceleradora OMNISTACK de SimpliVity. En ese caso, elimina el impacto en las VM de producción. Gracias a un sistema de archivos bien diseñado, se obtiene toda esta “magia” de SimpliVity.

Infordisa

Infordisa

Departamento de Marketing

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos requeridos están marcados *

Publicar comentario

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.