¿Qué es la redundancia del Centro de datos? N, N + 1, 2N, 2N+1
Las organizaciones continúan adoptando la transformación digital para respaldar las operaciones e impulsar el crecimiento del negocio. A medida que la tecnología se integra cada vez más en todos los aspectos de las operaciones comerciales, la amenaza y el impacto potencial del tiempo de inactividad crecen exponencialmente. Para respaldar esta necesidad de alta disponibilidad, las empresas confían en centros de datos de terceros para ofrecer entornos resistentes que puedan soportar interrupciones del servicio y garantizar el tiempo de actividad y la continuidad del negocio.
Las causas del tiempo de inactividad se ejecutan en el gambito, desde el mantenimiento rutinario y las fallas de hardware hasta los desastres naturales, los ciberataques y los errores humanos simples. Independientemente de cómo se produzca el tiempo de inactividad, los resultados son los mismos: no puede acceder a sus datos y aplicaciones críticos, operar su negocio y dar servicio a sus clientes. Esto afecta a sus resultados finales al interrumpir los flujos de ingresos, detener la productividad, degradar la experiencia del cliente y dañar su reputación.
La realidad es que el tiempo de inactividad puede afectar gravemente a su negocio. Según Gartner, el costo promedio del tiempo de inactividad es de 5 5,600 por minuto.* Los dólares perdidos se pueden acumular rápidamente durante un corte prolongado. La 11a encuesta Anual de Costos por hora de Tiempo de inactividad del ITIC informó que el 40% de las empresas dijo que el costo de una hora de tiempo de inactividad puede variar de $1 millón a más de 5 5 millones, y eso no incluye honorarios legales, multas o sanciones. La encuesta también señaló que un corte catastrófico que interrumpe una transacción comercial importante o ocurre durante las horas pico de trabajo puede exceder millones de dólares por minuto.
Dado que el Uptime Institute ha informado de que más del 75% de las empresas han sufrido una interrupción que ha causado importantes daños financieros y de marca en los últimos tres años, el tiempo de inactividad es una preocupación real y directa.
Si bien el tiempo de inactividad puede afectar a todas las empresas, cada organización tiene una tolerancia al riesgo diferente. Una pequeña empresa que no opera las 24 horas del día, los 7 días de la semana, puede manejar el tiempo de inactividad programado durante el horario no comercial para el mantenimiento de hardware crítico, como sistemas de fuente de alimentación ininterrumpida (UPS), unidades HVAC o generadores de respaldo. Sin embargo, una interrupción imprevista que no se puede restaurar rápidamente puede ser financieramente devastador. Una empresa con presencia internacional o con operaciones ininterrumpidas no puede cerrar ni siquiera para el mantenimiento planificado y debe confiar en la redundancia de la infraestructura dentro de un centro de datos para su mantenimiento simultáneo.
Si su empresa depende de un centro de datos de terceros para dar soporte a sus servidores críticos, debe comprender el modelo de redundancia que utiliza el centro de datos para garantizar que su arquitectura proporcione las protecciones que su empresa necesita para permanecer en línea.
¿Qué es un centro de datos redundante?
Los centros de datos abordan el tiempo de inactividad mediante la creación de redundancia en su infraestructura. Una arquitectura de centro de datos redundante duplica componentes críticos, como sistemas UPS, sistemas de refrigeración y generadores de respaldo, para garantizar que las operaciones del centro de datos puedan continuar incluso si un componente falla. Si bien los mayores niveles de redundancia evitan mejor el tiempo de inactividad, un diseño totalmente redundante es costoso y no está en el presupuesto de todas las empresas.
La buena noticia es que la redundancia se puede lograr en una variedad de configuraciones, cada una con un nivel progresivo de seguridad para satisfacer necesidades específicas en torno al rendimiento, la disponibilidad y el costo. Para encontrar la arquitectura que satisfaga las necesidades de su negocio, primero debe comprender su tolerancia al riesgo y cómo se alinea con los diversos modelos de redundancia del centro de datos.
¿Cuáles son los niveles de redundancia del centro de datos?
La redundancia del centro de datos no es una tarea única para todos. Construir una arquitectura redundante es cada vez más costoso a medida que se agregan más componentes. Para evaluar la configuración correcta para su organización, es importante reconocer los riesgos y las capacidades de las diversas arquitecturas, incluidas N, N+1, N+2, 2N y 2N+1.
Además, tenga en cuenta que un centro de datos determinado puede funcionar con varios modelos de redundancia. Un UPS puede ser 2N, mientras que el sistema de refrigeración es N + 1. El sistema de refrigeración puede ser N + 1, pero aún tiene un único punto de falla en la tubería. Todos los látigos de potencia, una parte crítica del proceso de flujo de potencia, deben ser 2N para crear redundancias ascendentes; incluir un solo látigo de poder frustraría el propósito de tener UPS N+1 o 2N, ya que es un único punto de falla.
Con todas estas arquitecturas redundantes, el uso de un diseño de energía de transferencia automática minimiza aún más las interrupciones. Un diseño de transferencia automática asegura que cuando una fuente de alimentación se desconecta, la capacidad se desvía instantáneamente a la unidad de respaldo designada. Un diseño de potencia de transferencia automática se puede lograr mediante la instalación de un Interruptor de Transferencia Automática (ATS) o un dispositivo de distribución controlado por lógica. Esto evita el tiempo de inactividad que puede ocurrir esperando que un técnico cambie manualmente a la unidad secundaria.
Definir N
Antes de evaluar cada modelo de redundancia, debe comprender N.
N es la capacidad mínima necesaria para alimentar o enfriar un centro de datos a plena carga de TI. Por ejemplo, si un centro de datos requiere cuatro unidades UPS para funcionar a plena capacidad, N sería igual a cuatro.
Por definición, N no incluye ninguna redundancia, por lo que es susceptible a puntos únicos de falla. Esto significa que una instalación a plena capacidad con una arquitectura N no puede tolerar ninguna interrupción, ya sea un fallo de hardware, un mantenimiento programado o una interrupción inesperada. Con un diseño N, cualquier interrupción dejaría a su empresa sin acceso a sus aplicaciones y datos hasta que se resuelva el problema.
Arquitectura de centro de datos N+1
La redundancia N+1 proporciona un nivel mínimo de resistencia al agregar un solo componente (un SAI, un sistema HVAC o un generador) a la arquitectura N para soportar una falla o permitir el mantenimiento de una sola máquina. Cuando un sistema está fuera de línea, el componente adicional se hace cargo de su carga. Volviendo al ejemplo anterior, si N es igual a cuatro unidades UPS, N + 1 proporciona cinco.
Esta configuración sigue los estándares de diseño reconocidos, que recomiendan un componente adicional por cada cuatro necesarios para admitir la capacidad completa. Si bien N + 1 introduce cierta redundancia, todavía presenta un riesgo en caso de fallas múltiples simultáneas. Para minimizar este riesgo, algunos centros de datos utilizan un diseño de redundancia N + 2 para proporcionar dos componentes adicionales. En nuestro ejemplo, esto proporcionaría seis unidades UPS en lugar de cinco.
Debido a la simplicidad de su arquitectura, un diseño N+1 es más barato y más eficiente energéticamente que los otros diseños más sofisticados.
Arquitectura de centro de datos de 2N
Un modelo de redundancia de 2N crea una imagen especular del UPS, el sistema de refrigeración o la disposición del generador originales para proporcionar tolerancia total a fallos. Esto significa que si se necesitan cuatro unidades UPS para satisfacer los requisitos de capacidad, la arquitectura redundante incluiría cuatro unidades UPS adicionales, para un total de ocho sistemas. Este diseño también utiliza dos sistemas de distribución independientes.
Esta arquitectura permite al operador del centro de datos desmontar un conjunto completo de componentes para el mantenimiento sin interrumpir las operaciones normales. Además, en el caso de que la arquitectura primaria falle, la arquitectura secundaria se hace cargo de mantener el servicio. La resistencia de esta arquitectura disminuye en gran medida la probabilidad de tiempo de inactividad.
Arquitectura de centro de datos 2N + 1
2N + 1 ofrece la arquitectura 2N totalmente tolerante a fallos, además de un componente adicional para una capa de protección adicional. Esta arquitectura no solo puede soportar fallas de múltiples componentes, incluso en el peor de los casos cuando todo el sistema primario se cae, sino que también puede soportar redundancia N+1.
Este nivel de redundancia es generalmente utilizado por grandes empresas que no pueden tolerar ni siquiera pequeñas interrupciones del servicio.
¿Qué tienen que ver los niveles del centro de datos con la redundancia?
La redundancia es inequívocamente integral en la medición de la confiabilidad, el rendimiento y la disponibilidad del centro de datos, pero agregar componentes adicionales a la infraestructura esencial del centro de datos es solo un elemento para ofrecer esta redundancia. Uptime Institute ofrece un Sistema de clasificación de nivel que certifica los centros de datos de acuerdo con cuatro niveles distintos: Nivel 1, Nivel 2, Nivel 3 y Nivel 4.
Los niveles de certificación de nivel de centro de datos progresivos tienen requisitos estrictos y específicos en torno a las capacidades y el nivel mínimo de servicio que proporciona un centro de datos certificado para ese nivel. Si bien el nivel de componentes redundantes es sin duda un factor, el Uptime Institute también evalúa la experiencia del personal, los protocolos de mantenimiento y mucho más. Estos factores se combinan para ofrecer las siguientes garantías de tiempo de actividad mínimo**:
- Tiempo de actividad de Nivel 1 del Centro de datos: 99. 671% o menos de 28,8 horas de tiempo de inactividad al año
- Tiempo de actividad de nivel 2 del centro de datos: 99.741% o menos de 22 horas de tiempo de inactividad al año
- Tiempo de actividad de nivel 3 del centro de datos: 99. 982% o menos de 1,6 horas de tiempo de inactividad al año
- Tiempo de actividad de nivel 4 del centro de datos: 99. 995% o menos de 26,3 minutos de tiempo de inactividad al año
Las capacidades de intensificación de cada nivel pueden proporcionarle otro punto de referencia para ayudarlo a comprender el nivel de rendimiento que puede ofrecer un centro de datos.
¿Cuál es su tolerancia al riesgo?
Elegir la arquitectura redundante que cumpla con los requisitos de su negocio puede ser un desafío. La asignación de las necesidades de su negocio a un modelo de redundancia adecuado es un paso esencial para garantizar que su proveedor de centro de datos pueda ofrecer las protecciones para brindarle una garantía de tiempo de actividad adecuada al tiempo que respeta su presupuesto. Encontrar el equilibrio adecuado entre esta confiabilidad y el costo es clave porque un modelo de redundancia de centro de datos ineficaz puede tener consecuencias devastadoras para su negocio.
El juego final es asociarse con un proveedor de centro de datos que puede satisfacer sus necesidades y ofrecer orientación, así como ofrecer seguridad empresarial, lo que le permite brindar un servicio continuo a sus clientes y construir su negocio.
Leave a Reply