Deduplicació vs. Compressió: què són?

Deduplicacio vs compressio

El descontrolat creixement de dades dels nostres usuaris provoquen més d’un mal de cap als administradors de sistemes de les nostres empreses. A més a més, l’alt preu dels discos durs no ajuda en absolut a poder solucionar aquest problema. Per aquest motiu, cada vegada més fabricants de cabines o servidors incorporen als seus catàlegs aquesta opció de deduplicació i compressió.

Què són i com afecten al teu datacenter?

Compressió

És el procés de reducció de mida de cada element de dades. No totes les dades poden ser comprimides com, per exemple, l’àudio o el vídeo. No obstant, el text es comprimeix perfectament. El desafiament és que no hi ha cap manera d’esbrinar exactament com les dades seran comprimides fins que no ho estiguin realment.

Hi ha dues maneres de comprimir les dades del datacenter:

In-line Compression o Compressió a temps real

inline-compression

  • Requereix d’una gran quantitat de CPU.
  • Esdevé un procés que consumeix força temps a la CPU, per la qual cosa augmenta la latència.
  • Reduïm l’espai de disc necessitat.

Post-Process Compression o Compressió diferida

post-processing-compression

  • Primer de tot, escriurà les dades en el disc i, més tard, tornarà a llegir les dades per iniciar el procés de compressió.
  • Es requereixen IOPS addicionals a la primera escriptura per tal de ser llegits i comprimits.
  • Es requereix de CPU després de la primera escriptura i per al procés de compressió.
  • Calen més IOPS en els discos per a l’escriptura una vegada les dades són comprimides.
  • Reduïm l’espai de disc necessitat.

Deduplicació

La deduplicació és una tècnica especial d’optimització de dades per eliminar còpies duplicades o repetides de dades amb l’objectiu d’optimitzar al màxim l’espai d’emmagatzematge utilitzat. Els chunks (o trossos de dades) són identificats i guardats durant el procés d’anàlisi. Molts sistemes deduplican en alguna fase del cicle de vida de les dades. Per definició, la deduplicació passa després d’algun esdeveniment.

Deduplicació inline o deduplicació en temps real

inline-deduplication

 

  • Comporta una penalització del rendiment en totes les operacions I/S. Necessita CPU i recursos de memòria.
  • Les dades són escrites per l’aplicació al servidor i després són tractades. Finalment, es transfereixen a la SAN o discos locals.
  • Sistema de Backup: les dades, primer, són escrites al servidor/emmagatzematge, previ a ser copiades i deduplicadeos a l’appliance de backup.
  • Es reduirà l’espai de disc necessitat.

Post-Process Deduplication o Deduplicació diferida:

  • Primer les dades són escrites en disc, i es programa una tasca perquè a una hora en concret, totes les dades escrites entre tasca i tasca, siguin deduplicades.
  • Requereix d’espai suficient per moure les dades durant el procés de deduplicació
  • Necessita IOPS addicionals per llegir totes les noves dades, deduplicar i finalment tornar a escriure les dades deduplicades.

Hiperconvergència Simplivity

L’únic fabricant del mercat capaç d’aprofitar els avantatges de la deduplicació i la compressió de les dades en temps real i sense penalitzar el més mínim rendiment del sistema és SimpliVity. I tot és possible gràcies al disseny d’una solució basada en una targeta acceleradora anomenada Omnistack Accelerator Card.

Amb SimpliVity un bloc de dades és escrit, comprimit i optimitzat una única vegada i mai més tornarà a ser reescrit o duplicat al sistema. D’aquesta manera es garanteix una màxima eficiència de dades a tots els nivells de rendiment (DRAM, Flash / SSD i HDD).

Vols rebre més informació sobre com la teva empresa pot beneficiar-se de SimpliVity?

 

Deixa un comentari

L'adreça electrònica no es publicarà. Els camps necessaris estan marcats amb *