,

La Deduplicación: eficienca máxima para tu datacenter

La deduplicacion el almacenamiento virtual eficiente 1

La palabra Deduplicación se está poniendo de moda en todos los catálogos de cabinas de almacenamiento. Se está convertiendo la funcionalidad más buscada. Por mucho que los fabricantes de discos digan que el coste por GB es muy bajo, la realidad es que el almacenamiento sigue siendo muy caro. Cuanto más podamos ahorrar en él, mejor.

Qué es la Deduplicación?

En mi anterior artículo, hablo sobre qué es y cómo afecta a nuestras máquinas la Deduplicación. Resumiendo, un almacenamiento deduplicado contiene una colección de bloques únicos y conjuntos de metadatos que permiten a estos bloques ser identificados y representados en un sistema informático. Estos bloques son los que componen cada una de nuestras VMs (Máquinas Virtuales), las cuales en gran mayoría no son más ficheros de disco.

Los metadatos

Simplificando conceptualmente, los metadatos son una lista de qué bloques únicos de datos son los necesarios para construir la VM. En el almacenamiento tradicional, cada bloque de información de cada VM ocupa un bloque de espacio en el disco, haciendo que este contenga muchísimos bloques duplicados que podrían ser optimizados. Un almacenamiento deduplicado guarda únicamente un bloque único de cada, reduciendo considerablemente el espacio necesario y brindando a los administradores de sistemas mucho más espacio disponible. Esto supone un ahorro de coste para la empresa. Y es que, al final, vuestro clúster de VMs son decenas de clones de una plantilla de una VM con un Windows 2012 R2 instalado, modificados y adaptados a cada una de las funciones de vuestros servicios.

simplivity-1

La Deduplicación de Simplivity

SimpliVity crea un sistema de ficheros basado en estos metadatos. Cuando la VM hace una escritura o lectura, lo primero que hace es consultar dicha lista para comprobar si existe este bloque y/o donde se encuentra realmente en el disco. Si el bloque existe, no se escribe. Sólo actualizamos los metadatos. Si no existe, entonces lo escribe en el almacenamiento.

simplivity-3

Normalmente, los metadatos son un fichero de texto con una tabla de punteros a los bloques que identifican. Por lo tanto, ocupan un espacio en disco que varía según el tamaño de datos que representa. Por ejemplo: un vmdisk de una VM es un fichero de 100 GB lleno de datos, pero que en realidad solo ocupan 25 GB en bloques únicos y 10 MB en metadatos (ojo, los números son inventados. ¡No son reales!) Esta combinación de bloques únicos y los metadatos es lo que realmente necesitamos almacenar en nuestros discos para representar un vmdisk en instante concreto de su vida.

simplivity-2

La clonación de una VM en un almacenamiento deduplicado

En un sistema de almacenamiento deduplicado, clonar una VM es tan simple como hacer una copia de los metadatos. Estos esdevienen punteros a bloques de datos únicos que ya han sido almacenados y no hay necesidad alguna de volverlos a almacenar. Eso significa que realizar una copia de nuestra VM de 100 GB, solo es necesario copiar los 10 MB de metadatos, que además en un nodo de SimpliVity, están almacenados en los discos SSD. Dicha operación de lectura/escritura es prácticamente instantánea. Con esto, podemos realizar un número considerable de clonados de VMs en apenas segundos.  Por este motivo, para entornos VDI con creación de máquinas, eliminamos el tan temido bootstorm del inicio de la jornada laboral.

A priori pensaréis, “no necesito un sistema capaz de clonar una VM 100 por minuto y, a no ser que administre el CPD una multinacional con centenares de usuarios conectándose a sus VDIs a las 8:00, dudo mucho que esto me sea relevante”. Pero vamos a mirarlo desde otro punto de vista.

¿Qué supone tener un entorno virtualizado con 100 VMs?

Tienes un entorno virtualizado con 100 VMs y no puedes hacer nada más que una copia entera de cada una de ellas en un horario nocturno. Todo es debido a las limitaciones de las ventanas temporales que nos dan a los administradores de TI.

¿Y si deseara hacer un backup varias veces al día de estas 100 VMs?

Para un almacenamiento deduplicado, un backup y un clonado son exactamente lo mismo. Por lo tanto, podemos hacer tantos backups de nuestro entorno como queramos. Al final, el impacto en volumen de almacenamiento es mínimo. Además, el impacto en el rendimiento de las máquinas, aún menos!

Esto abre un mundo de posibilidades a los administradores de tareas, rompiendo el concepto tradicional de los backups. Ahora puedes hacer copias de los sistemas de ficheros varias veces al día. Si un usuario comete alguna imprudencia (recuerda lo dañino que esta siendo CryptoLocker, Ramsonwares, etc), tienes un punto de recuperación muy cercano. Así, se minimiza los daños al sistema con un rollback a apenas minutos antes del desastre. Esto te permite restaurar, si deseas, un único archivo; ¡no toda una VM!.

El almacenamiento virtual de Simplivity

Lo más importante de la propuesta de SimpliVity es que el sistema ha sido diseñado desde 0 exclusivamente para ser eficiente. Por este motivo, la Deduplicación se aplica nada más se realiza en la escritura del dato. Todas estas tareas con los metadatos (comprobar bloques duplicados, escrituras, lecturas, etc,) son absorbidas por la Tarjeta Aceleradora Omnistack de SimpliVity. En este caso, elimina el impacto en las VM de producción. Gracias a un sistema de ficheros bien diseñado, se obtiene toda esta “magia” de SimpliVity.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *