¿Cómo es la preocupación global de los datos duplicados en servidores y centros de datos?

Es posible que sea escéptico en cuanto a qué tipo de archivos se están copiando o almacenando, pero la duplicación de datos en sus discos duros, servidores, nubes o incluso centros de datos es inevitable. ¿cómo? Por ejemplo, imagina que has recibido un video en tu WhatsApp o cualquier plataforma de redes sociales y, también has recibido el mismo video a través de correo electrónico de una persona diferente. Por lo tanto, la plataforma, la aplicación o incluso el nombre del archivo pueden ser diferentes, pero los datos de video son los mismos. Esto conduce a la duplicación de datos. Del mismo modo, guardar fotos o videos de aplicaciones de redes sociales en la carpeta local del dispositivo también es otro ejemplo. El archivo multimedia que se almacena en el almacenamiento local ya está presente en el almacenamiento desde la aplicación también.

Sin darse cuenta de la cantidad de duplicados de datos, el usuario tiende a comprar unidades adicionales o suscripciones a la nube para almacenar más datos. Se estima que para 2021, los ingresos del mercado de las unidades de almacenamiento de datos serán de 78.1 mil millones de dólares. Cerca del 50% de los datos corporativos se almacenan en servidores en la nube para el archivado de información.

Es posible que se pregunte cómo los clientes o los usuarios se las arreglan para mantener el nivel de duplicación bajo o NULO. Lea la siguiente sección para saber más.

Aplicaciones y utilidades utilizadas por los usuarios para administrar datos duplicados

  • Remo Duplicate File Remover
  • CloneSpy
  • Dupscout
  • Buscador de duplicados
  • Buscador de archivos duplicados de Auslogics

Los avances en el proceso de deduplicación han recorrido un largo camino en comparación con principios de la década de 2000. Muchos centros de datos y en la nube también han comenzado a incluir la copia de seguridad de deduplicación como una opción individual en sí misma. Esta opción le permite minimizar el tamaño del almacenamiento detectando datos redundantes e idénticos y direccionar estos archivos después de que se haya realizado correctamente una copia de seguridad de los datos únicos.

La desduplicación también reduce la carga de red y la distribución del ancho de banda. Si no se vuelve a realizar una copia de seguridad de los archivos redundantes, el ancho de banda de la red aumenta y permite realizar copias de seguridad de datos únicos en menos tiempo.

Las plataformas de almacenamiento en la nube como Google One, Google Drive, Google Photos, Dropbox, Box y Remo Backup también planean agregar una instalación de copia de seguridad de deduplicación en sus aplicaciones o interfaz.

¿Cómo funciona la desduplicación de datos?

La técnica de desduplicación más común compara los datos dividiéndolos en bloques. La unicidad de cada bloque se calcula a través de un valor hash específico y si hay archivos de valores hash similares, se omitirán y no se almacenarán en la unidad o el centro de datos.

Por ejemplo, si hay 10 unidades de almacenamiento virtual de las que se realiza una copia de seguridad mediante el método Deduplication y el proceso ha encontrado 8 bloques con un valor hash similar, solo se envía un bloque para su almacenamiento y se omite el resto. Esta metodología y algoritmo de omitir los mismos bloques de valor ahorra mucho espacio de almacenamiento y reduce el tráfico de red. El uso compartido de archivos entre compañeros de trabajo u organizaciones se realiza a través de Microsoft OneDrive. Como más del 70% de las personas han adoptado Microsoft OneDrive como su plataforma de intercambio de archivos predeterminada. Sin embargo, hay muchas otras técnicas de deduplicación más eficientes / complejas que se están probando y utilizando.

Una vez que el tráfico de red se reduce con la inculcación de nuevas técnicas, esperemos que se pueda usar más ancho de banda para otros procesos y hacer que Internet funcione más rápido. Afortunadamente, el mantenimiento del almacenamiento de datos se ha simplificado a medida que los nuevos componentes / concentradores de almacenamiento de datos se están construyendo con más características. Unidades de almacenamiento de datos como NVRAM, memoria de clase de almacenamiento (SCM) y NVMeOF.

conclusión:

¿Cuáles son las ventajas de estos contenedores de almacenamiento nuevos o próximos?

Una de las principales preocupaciones es que cuantos más datos se almacenen, más desduplicación se producirá. Por lo tanto, la única manera es actualizar a las instalaciones de almacenamiento nuevas o futuras. Se encuentra que sólo el 35% de las empresas a gran escala están utilizando métodos de almacenamiento tradicionales. el resto el 75% de las empresas han cambiado a servidores privados o de almacenamiento en la nube.

NVRAM (Non-Volatile Random-Access-Memory) es conocida por almacenar datos independientemente de si la fuente de alimentación está apagada o encendida por la computadora portátil, MacBook o computadoras de escritorio. Nvram es como una memoria flash que guarda y almacena datos mientras se está ejecutando o en uso. Nvram también requiere muy menos espacio de instalación que hace que sea más rápido.

SCM (Memoria de clase de almacenamiento) es un componente de memoria de almacenamiento que tiene latencia de microsegundos. Esto hace que sea muy rápido en comparación con las otras unidades de unidad de memoria. Sin embargo, todavía se está estudiando y entendiendo cómo incorporar esto en aplicaciones / programas de nivel pequeño y grande. Con suerte, para finales de 2020, la memoria SCM comenzará a implementarse para dispositivos de almacenamiento, computadoras y servidores de datos.

En el futuro, se podrían introducir más avances y tecnología nuevos en nombre de la reducción de los datos duplicados que se acumulan en los servidores. Por lo tanto, con la escritura anterior dada, debe haber sabido cómo funciona la desduplicación de datos y cómo puede administrar los datos duplicados. Si tiene cualquier otro método o herramienta efectiva que ayude a administrar datos duplicados, no dude en comentar a continuación.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

*