Nueve principios para maximizar la resiliencia de los entornos en la nube

  • Cloud

cloud nube gestion ©Freepik

Los fallos parciales, las degradaciones del servicio y los problemas locales son típicos de estos entornos. “Las nubes deben ser tan o incluso más resistentes que la infraestructura local, pero solo si el equipo de infraestructura y operaciones las utiliza de manera resiliente", señala Chris Saunderson, analista director senior de Gartner.

La nube no es mágicamente resistente y los errores de software causan casi todas las interrupciones de la nube. Así lo recalca Gartner, cuyos analistas han discutido acerca de cómo aceptar y limitar el impacto de los fallos de los proveedores cloud en la Conferencia de Infraestructura de TI, Operaciones y Estrategias de Nube de Gartner.

Para Chris Saunderson, analista director senior de Gartner, "en la nube, las interrupciones casi nunca involucran a todo el proveedor cloud, ni es probable que las interrupciones del servicio sean totales. En cambio, los fallos parciales, las degradaciones del servicio, los problemas de servicio individuales o los problemas locales son típicos".

El equipo de infraestructura y operaciones (I&O) debe comprender las características y las causas comunes de las interrupciones de la nube. La mayoría de los fallos son parciales, tienden a ser intermitentes o implican una degradación del rendimiento, y existen diferencias de resiliencia entre los servicios que ofrecen los proveedores de nube.

"La resiliencia no es un estado binario", apunta Saunderson, "Nadie puede reclamar una resiliencia absoluta, ni usted, ni ningún proveedor de nube. Las nubes deben ser tan o incluso más resistentes que la infraestructura local, pero solo si el equipo de I&O las utiliza de manera resiliente".

Los analistas de Gartner recomiendan que los líderes de I&O se centren en nueve principios clave para mejorar la resiliencia de la nube.

1- Alineación con el negocio: Alinee los requisitos de resiliencia con las necesidades del negocio. Sin esta alineación de los requisitos, los equipos no cumplirán con las expectativas de resiliencia o gastarán de más.

2- Enfoque basado en el riesgo: Adopte un enfoque basado en el riesgo para la planificación de la resiliencia que se extienda más allá de los eventos catastróficos. Ponga más énfasis en los errores más comunes que las organizaciones tienen mayor control para mitigar.

3- Mapeo de dependencias: Cree gráficos de dependencias que asignen todos los componentes de middleware, bases de datos, servicios en la nube y puntos de integración para que puedan diseñarse y configurarse para la resiliencia e incluirse en la planificación de la fiabilidad y la recuperación ante desastres (DR).

4- Disponibilidad continua: El enfoque de disponibilidad continua se centra en mantener las aplicaciones, los servicios y los datos disponibles en todo momento y niveles de servicio sin tiempo de inactividad y con un impacto limitado durante un evento de fallo.

5- Resistente por diseño: La aplicación en sí debe ser resistente por diseño. La resiliencia de la infraestructura por sí sola es insuficiente para ofrecer los servicios sin tiempo de inactividad que esperan los usuarios finales.

6- Automatización de DR: La implementación de la recuperación ante desastres totalmente automatizada (o casi completa), ya sea a través de las propias herramientas de la organización o a través de herramientas de recuperación ante desastres cloud nativas de terceros, proporciona la base necesaria para cumplir con los objetivos de tiempo de recuperación (RTO) agresivos y permite que la recuperación ante desastres se pruebe de forma rutinaria.

7- Estándares de resiliencia: Adopte estándares de resiliencia más allá de la arquitectura y la recuperación ante desastres. Los sistemas resilientes requieren que los equipos se centren en la calidad, la automatización y la mejora continua, e infundan calidad a lo largo del ciclo de vida de una aplicación.

8- Favorecer las soluciones cloud nativas: Los proveedores cloud tienen una gama significativa de soluciones que se pueden utilizar para mejorar la resiliencia. Cuando sea viable, los líderes de I&O deben aprovechar estas soluciones en lugar de tratar de inventar sus propias alternativas y agregar aún más complejidad.

9- Enfoque en las funciones empresariales: En lugar de restringir el pensamiento a solo "conmutar" de igual a igual, explore alternativas, como alternativas de TI livianas o sustituciones de aplicaciones livianas que proporcionen la funcionalidad crítica comercial mínima requerida.