Última verificación : 21 de febrero de 2011
Versión : 2.0
La mejor computadora como servidor de respaldo de datos
¿Qué es lo más importante durante la elección de un servidor de respaldo? ¿El procesador, el disco duro, quizás el sistema operativo? ¿Con qué parámetros se debe caracterizar una computadora destinada a ser un servidor de respaldo?
Muy a menudo recibimos preguntas de personas y empresas interesados en Ferro Backup System(tm), o de los que lo utilizan ya pero quieren mejorar el rendimiento de las tareas de copia de seguridad. Las preguntas suelen ser las siguientes: ¿Cuál es la mejor configuración de hardware y software para el servidor de respaldo? ¿Qué procesador elegir, qué disco duro, qué sistema operativo, qué formato de archivos? Obviamente, que hardware se debe elegir y como configurar el sistema operativo, depende del tamaño de la red (número de computadoras que se quiere incluir en las copias de seguridad) y las posibilidades financieras de la empresa. Intentaremos, sin embargo, describir la mejor configuración enumerando primero las cosas que son más significativas a la hora de optimizar el sistema de respaldo, pasando, gradualmente, a cosas menos importantes que permiten obtener la mejor configuración posible. Esta forma de presentar permitirá indicar la dirección y la cronología de mejora que se deberían seguir cuando se quiera modernizar las bases del sistema y del hardware-1. Sistema operativo
El sistema operativo, en el que se instalará y arrancará el servidor de respaldo, tiene una gran importancia en términos de la seguridad de los datos almacenados, la eficiencia de realización de copias de seguridad y la óptima utilización de los recursos hardware.
Muchas veces, hay ciertos aspectos a tener en cuenta a la hora de elegir un sistema operativo:
- Estabilidad y velocidad durante el subprocesamiento múltiple
- Posibilidad de manejar sistemas multinúcleo o multiprocesador
- Rendimiento de las operación de E/S
- Manejo de particiones grandes y matrices de disco
Trabajo multiproceso
Ferro Backup Server es una aplicación multiproceso. Inmediatamente después del inicio, hay cuatro subprocesos activos. Cada conexión TCP/IP se maneja en un nuevo, separado proceso. Así pues, cuantas más computadoras hay en la red, más subprocesos habrá de FBSServer.exe en el servidor de respaldo.
Cada conexión de red servidor-estación de trabajo, manejado por un subproceso, sirve para transmitir datos a la estación de trabajo (manejo) y recibir datos (archivado). Adicionalmente, Ferro Backup System - Server inicia subprocesos de ayuda, que son responsable de la verificación de las copias de seguridad, eliminación de archivos prescindibles, envío de alertas al administrador, etc.
Por ejemplo, durante la copia de seguridad de datos en una red que tiene 50 estaciones de trabajo, la aplicación Ferro Backup System - tendrá activos desde 54 a 60 subprocesos.
La asignación del procesador a otros subprocesos es el trabajo del sistema operativo. El sistema decide cuando y para cuanto tiempo asigna el procesador a cada subproceso.
En sistemas de un solo procesador, en un momento dado, solo un subproceso utiliza el procesador y los demás son pausados.
El intercambio de subprocesos es lo suficientemente rápido que el usuario tiene la sensación de que los subprocesos se ejecutan simultáneamente dentro de una aplicación determinada. En los sistemas multiprocesador, las tareas pueden ejecutarse simultáneamente.
La importancia del sistema operativo en la rapidez y asignación del tiempo del procesado a cada subproceso no es sobreestimado para aplicaciones multiprocesador como Ferro Backup System - Server.
Decidiéndose por un sistema operativo, se debe seleccionar el sistema que se caracteriza por un buen manejo de tareas multiprocesos y la posibilidad de utilizar varios procesadores.
Los sistemas de la familia Windows (sin contar las versiones de 16 bits) se pueden dividir en dos grupos: el primer: Windows 95/98/Me; el segundo: Windows NT/2000/XP/2003/Vista/2008/Windows 7.
Si bien los sistemas de ambos grupos incluyen soporte multitarea de exclusión, la implementación del planificador de tareas (en inglés, scheduler), responsable de compartir el tiempo óptimo de la CPU, es diferente en ambos casos.
El método implementado en sistemas del segundo grupo son significativamente más eficientes, más estables, debido a su mayor resistencia a interbloqueos (en inglés, deadlock), son sencillamente mejores.
Manejo de sistemas multiprocesadores y multitareas
Los sistemas basados en el kernel NT tienen otra característica muy importante desde nuestro punto de vista: permiten el manejo de sistemas multiprocesador.
Se tarta tanto del soporte de plataformas con varios procesadores como de procesadores multinúcleo o con núcleos virtuales (tecnología HT).
Los sistemas de la serie NT separará todos los subprocesos de FBS Server entre las unidades de procesamiento disponibles, lo que aumentará la eficiencia de la tarea de archivado.
Cuanto más procesadores o núcleos de procesador haya en el servidor de respaldo, más rapidez en las copias de seguridad se puede obtener.
Rendimiento de las operaciones de E/S de disco y red
Otro aspecto a tener en cuenta al elegir un sistema de la familia Windows NT es el alto rendimiento de las operaciones de E/S en disco. Durante la realización de una copia de seguridad FBS Server simultáneamente, recibe datos de varias estaciones de trabajo en varios subprocesos y tras su verificación, realiza la operación de escritura en el disco del servidor. Las operaciones de escritura son realizadas cientos de veces, incluso miles de veces por segundo. Aunque todas estas operaciones están respaldadas por un módulo de FBS Server especial para aumentar el rendimiento, se puede ver una diferencia significativa en la velocidad de escritura. Windows NT, es, como se puede apreciar, más eficiente en operaciones de E/S cortas y simultáneas que los sistemas de la familia Windows 9x/Me.
En sistemas Windows Vista y Windows Server 2008 se implementó una nueva generación de la pila TCP/IP. Como asegura Microsoft, la nueva implementación de la pila TCP/IP aumenta significativamente el rendimiento de las operaciones de red.
Por ello, es mejor utilizar en el servidor de respaldo, Windows Vista, Windows Server 2008 o Windows 7 antes que las versiones anteriores.
Para terminar con el SO, se debe tener en cuenta las limitaciones de manejo de discos duros grandes por los distintos tipos de sistemas operativos. ....
2. Sistema de archivos
En caso de un servidor de respaldo, un papel importante lo desempeña el formato del sistema de archivos. Debido a que, el coste de esta implementación no es muy alto, se debería de decidir justo después de la elección del sistema operativo.
Inicialmente, los sistemas de la familia Windows utilizaban el formato FAT. Con la aparición de Windows NT, Microsoft introdujo un nuevo sistema de archivos conocido como NTFS. Las siguientes generaciones de Windows basadas en el NT (2000, XP, 2003, Vista, 2008, 7) podían utilizar tanto el forma FAT como NTFS. Sin embargo, el segundo es el más recomendado. En caso de sistemas Windows 95, Windows 98, Windows Me el sistema de archivos es FAT.
Máximo tamaño de partición
Desde el punto de vista del sistema de respaldo de datos, el formato FAT se diferencia del formato NTFS en varios aspectos.
El primero de ellos, que no apremia al sistema FAT son las limitaciones de tamaño de las particiones y de archivo.
El sistema FAT permite la creación de una partición con un tamaño máximo de 32 GB. En caso de un red LAN grande y la necesidad de almacenar datos de varias computadoras, este tamaño de partición puede ser insuficiente.
Sin embargo, el sistema NTFS no tiene este tipo de limitación. Se puede, por ello, crear particiones para almacenar copias de seguridad que utilizarán todo el espacio ofrecido por el disco duro.
El tamaño máximo de partición en NTFS puede ser, con un tamaño de clúster de 64 KB, hasta 128 TB (terabytes).
Tamaño máximo de archivo
La segunda limitación importante de FAT es el tamaño máximo de un archivo. En caso de copias de seguridad que contienen todos los archivos de una computadora (todo el disco o varios discos) 4 GB, que nos permite el sistema FAT puede ser insuficientes.
En el sistema NTFS el tamaño máximo de un archivo está limitado por el tamaño de la partición en la que está almacenado.
Limitación | NTFS | FAT32 | FAT16 |
---|---|---|---|
Tamaño de archivo | 2^64 - 1 bytes | 2^32 - 1 bytes | 2^32 - 1 bytes |
Tamaño mínimo de clúster | 512 bytes | 512 bytes | 512 bytes |
Tamaño máximo de clúster | 64 KB | 64 KB | 64 KB |
Tamaño mínimo del volumen | 1 MB | 2 GB | 2,091,520 bytes |
Tamaño máximo del volumen | 2^32 unidades de asignación | 4,177,198 clústers | 4 GB
Windows 9x/Me:2 GB |
Archivos en el volumen | 2^32 - 1 | 2^28 | 2^16 |
Archivos o subdirectorios en el directorio | Sin límites | 2^16 - 2 | 2^16 - 2 |
Fallo del sistema de archivos
El tercer aspecto, también que favorece al formato NTFS, sobre todo en su versión 5.0, son sus pocos fallos. La estructura de los archivos y directorios almacenada en este formato es más resistente a cualquier tipo de avería que el sistema FAT. El principal mérito de esto es que las operaciones de E/S se realizan en el modo transaccional. Es decir, por ejemplo, si se produce alguna avería en el suministro de corriente que causará una interrupción en la operación de escritura, toda la transacción es anulada y no repercute en el resto de datos. Otra propiedad NTFS consiste en que este sistema utiliza datos redundantes para proteger la estructura de datos. El daño en la estructura de datos suele ser la causa de la pérdida de datos en el sistema FAT. También es importante el hecho que NTFS admite configuraciones de disco para garantizar una mayor seguridad de los datos (mirroring y RAID5).Si ya se ha decidido por el sistema operativo que admite el formato de archivo NTFS, el uso de particiones justamente en este formato es la mejor opción.
3. Procesadores
Como ya se mencionó al hablar de los sistemas operativo, FBS es una aplicación multiprocesos. Cuantos más procesadores haya, incluidos procesadores virtuales, las copias de seguridad se harán de forma más rápida, sin pausas innecesarias y "congelaciones" del sistema.Por ejemplo, durante el archivado de una red que tiene 200 computadoras conectadas, FBS Server inicia más de doscientos subprocesos. Estos subprocesos sirven, generalmente, para manejar las conexiones TCP/IP y la escritura de datos en disco. No son tareas que pueden llegar a cargar mucho el procesador, por ello no es necesaria tanta potencial de cálculo. Sin embargo, cuantos más procesadores tengamos a nuestra disposición, menor será el tiempo de espera para la ejecución de subprocesos individuales y, por lo tanto, la velocidad de archivado aumentará significativamente.
Desde el punto de vista económico, podría ser una buena solución emplear una plataforma con un solo procesador que maneja procesadores multinúcleo. Para entornos más exigentes, se pueden utilizar placas madre multiprocesador. Es altamente recomendada la plataforma binúcleo de Intel basada en unidades de cálculo Xeon. AMD también tiene soluciones parecidas.
4. Discos duros
Los discos duros cada vez son de mayor capacidad y a su vez son menos costosos. En un futuro próximo, la escritura paralela utilizada en los discos duros será reemplazada por la escritura perpendicular. El cambio de la tecnología de escritura, seguramente, hará que los precios sigan bajan y permitirá el almacenamiento de una cantidad de datos mayor. En los sistemas de archivado, cualquier espacio disponible en disco es bienvenido.Un disco duro destinado a almacenar las copias de seguridad debe tener una capacidad adecuada, ofrecer una velocidad de escritura alta junto a una carga mínima de la CPU.
Capacidad del disco duro
La capacidad del disco duro en el que se pretende almacenar las copias de seguridad, se debe decidir antes en base a la cantidad de computadoras que se quieran archivar, más concretamente, en base al número de discos duros que se quieran incluir en las copias de seguridad y la capacidad de cada uno.Antes de decidir la capacidad del disco duro, se debe pensar que es lo que se desea archivar y, más importante, lo que no se quiere archivar. Más información sobre este tema de rango de copia de seguridad, lo puede encontrar en el boletín FS-FBS-20051119-I01.
Tras sumar el tamaño de todos los datos en todos los discos duros, tenemos una estimación sobre cuánta capacidad ocuparán las copias de seguridad en el disco del servidor de respaldo. Obviamente, por ahora este número es solamente una copia (completa) de seguridad de todas las computadoras. En cálculos de este tipo, no se debe tener en cuenta el nivel de compresión de datos debido a que este puede variar dependiendo de los datos que se estén archivando. En los cálculos iniciales, se debe sumar los tamaños de copias incrementales. El tamaño de estas copias de una computadora, puede, aproximadamente, ocupar desde 0 bytes (no hay datos nuevos), hasta el tamaño de una copia de seguridad completa (todos los datos han sido modificados). Obviamente, en las computadoras aparte de los cambios en los archivos, también se añaden otros nuevos. Por ello, durante el cálculo de la capacidad necesaria, se debe mantener un margen. Si las copias de seguridad incrementales serán realizadas todos los días, al tamaño de una copia de seguridad se le debe añadir el tamaño diario de la copia incremental multiplicado por seis. Los cálculos se pueden verificar realizando una copia de seguridad de prueba de algunas estaciones de trabajo y servidores conectados a nuestra red y en base a esta prueba, precisar los cálculos anteriores.
Velocidad de las operaciones de escritura y ancho de banda de la red
El segundo parámetro importante que se tiene que tener en cuenta al elegir un disco duro, es la velocidad de las operaciones de escritura. Se debe tener en cuenta, sobre todo, el parámetro RWS (en inglés, Random Write Speed) mostrado muchas veces en las pruebas de rendimiento de los discos duros. Como ya se mencionó, en un sistema de archivado, mucho subprocesos intentan escribir los datos que les llegan desde las estaciones de trabajo en el disco simultáneamente. Cada subproceso abre un archivo distinto y en el escribe los datos. Estos archivos pueden estar alojados en distintos lugares en disco por el sistema operativo, de aquí el motivo por el que se debe utilizar discos con una alta velocidad de escritura por RWS. En este punto, se debe mencionar la tecnología NCQ (Native Command Queuing) introducida en discos con la interfaz SATA (Serial ATA). La tecnología NCQ permite la escritura de datos en un orden diferente al solicitado por el sistema operativo. La operación de escritura es optimizada para que la distribución física de datos en disco para proporcionar velocidades de escritura más rápidas.Hay otro parámetro más que nos permitirá tomar la decisión correcta para elegir un disco duro. Se trata del ancho de banda de la red LAN. Si nuestra red está construida con la tecnología de 10 Mb o 100 Mb entonces la velocidad del disco no tendrá tanta relevancia como sí la tuviese en una red gigabit. En una red de 100 MBit, la velocidad de recepción de datos por el servidor de respaldo será como mucho de 10 MB. La transferencia de este tipo puede ser manejada incluso por los discos duros antiguos. La red basada en el estándar 1 Gb tiene unas necesidades mayores. La transferencia de datos por una interfaz de red de este tipo puede ser realizada con una velocidad de hasta 100 MB/s, con este tipo de transferencias el "cuello de botella" será el disco duro.
Tipos de interfaz
En el mercado hay muchos discos duros disponibles con diferentes interfaces. Los discos con interfaz SCSI y FC se caracterizan por su alta velocidad, sin embargo, debido a su alto coste, son empleados por empresas con mucho capital. Otro tipo de discos son los con interfaz ATA. Si poseemos este tipo de disco, lo podemos emplear para almacenar las copias de seguridad. Sin embargo, si estamos planeando la compra de un nuevo disco duro, deberíamos encontrar uno que tenga el mejor valor RWS y que tenga implementado el soporte de la tecnología NCQ. Estamos hablando, obviamente, de los discos S-ATA, más concretamente sobre los S-ATA II y SATA 3, o con un ancho de banda teórico de 300 MB/s y 750 MB/s.Carga del procesador durante las operaciones en disco
El tercer aspecto a tener en cuenta es la carga de la CPU por parte del disco duro durante las operaciones de escritura. Si la CPU está bastante cargada durante las operaciones de escritura, la copia de seguridad se realizará más lentamente. Si durante la copia de seguridad simultánea desde muchas computadoras, la carga de la CPU está cerca del máximo, se debe plantear el cambio del disco o del procesador por uno más eficiente. En este punto, también se debe tener en cuenta que una gran carga en la CPU puede ser el resultado de cambiar el modo del disco duro de DMA (en inglés, Direct Memory Access, Acceso directo a la memoria) a PIO (en inglés, Programmed Input Output, entrada salida programados). Este cambio puede ser realizado al detectar alguna avería en el disco duro, pero habitualmente es causado por el mecanismo de manejo del disco IDE integrado en Windows 2000, Windows XP y Windows 2003. La información más detallada la puede encontrar en el artículo: "Tras la aparición de varios fallos por superación del límite de tiempo y CRC, los discos IDE ATA y ATAPI son cambiados al modo PIO".Falla de discos duros
Si de la seguridad de los datos se trata entonces durante la selección de un disco duro, se debe tener en cuenta el valor MTTF (Mean Time To Failure), que los fabricante de discos duros marcan el tiempo medio (en millones de horas) de trabajo sin fallos. Cuanto más alto es el valor más tiempo funcionará el disco.5. Discos de red (NAS)
Por motivos de eficiencia, estabilidad y menor carga de la red, es mejor almacenar las copias de seguridad de datos en discos locales de un servidor de respaldo (discos internos o matrices, así como discos externo y memorias masivas conectadas al servidor de respaldo con conectores SCSI, eSATA, USB). Los discos de red (NAS) se pueden emplear para la replicación de copias de seguridad.Separación de la red
Si a pesar de todo nos decidimos por el uso de discos de red, se debe recordad algunos aspectos. El disco de red se debe caracterizar con la mejor velocidad de lectura y escritura. La conexión del servidor de respaldo y el disco NAS debería realizarse con una red gigabit. La mejor solución para ello es la separación de esta conexión de la red LAN, para que el tráfico en la red generado por la escritura de datos en el disco de red no ralentice las otras operaciones en la red. Se puede separar la red mediante la introducción, en el servidor de respaldo, de una segunda tarjeta de red: una se debe conectar a la red LAN empresarial y la otra directamente al servidor NAS.¿iSCSI, CIFS o FTP?
El servidor de respaldo puede leer y escribir datos desde el disco NAS empleando diferentes protocolos de red. Debido a su alta eficiencia y estabilidad, la mejor conexión a usar es la iSCSI. Si el servidor NAS no soporta este protocolo (todos los discos de red bueno lo soportan), se puede utilizar la conexión SMB/CIFS y asignar el uso del servidor NAS directamente en FBS Server. El tercer protocolo de red, el cual es el más habitual en discos NAS es el protocolo FTP., debe usarse como último recurso. El protocolo FTP es eficiente solamente en la transferencia de archivos grandes de forma secuencial. El servidor de respaldo debe tener garantizado una rápida lectura y escritura de fragmentos de archivos de forma aleatoria. El programa FTPUSE es capaz de emular un acceso aleatorio a los archivos almacenados en el servidor FTP, pero esto a su vez es poco eficiente.Más información sobre el tema de copias de seguridad en discos de red se ha descrito en el artículo: Copias de seguridad en discos de red