jueves, 4 de abril de 2024

Experiencia OCI: Una acción de infarto: cuidado, no apto para personas con inconvenientes cardíacas.


Durante los últimos 3 años y medio, todos los días aprendo algo nuevo del OCI, que en ocasiones me alegra el día y en otras me ocasiona un dolor de cabeza y un conato de infarto.

Voy a darles el contexto.

Durante una ejecución de un proceso, las estadísticas a nivel de sistema operativo, me indican que el monto de recursos disponibles a nivel de OCPU, son insuficientes para atender de manera la demanda de los mismos.


Por tanto, empecé a revisar la información actualizada sobre el "Escalado bajo demanda".

El escalado bajo demanda es una característica de la computación en la nube que le permite ajustar automáticamente los recursos asignados a su aplicación o servicio según la demanda actual. Puede aumentar o disminuir la cantidad de servidores, almacenamiento y otros recursos que utiliza en tiempo real, según la carga de trabajo. Por ejemplo, OCI Compute ajusta la cantidad de instancias informáticas en un grupo de instancias en función de las métricas y la programación para cumplir con la capacidad deseada según la configuración.

Por tanto, inicié con crear un pool de instancias en el compartment específico en donde se encontraba el recurso desplegado, así como también, crear una configuración de autoescalación.

Luego, asocié el servicio involucrado con el problema de recursos, a la configuración del pool.

En la carrera que estaba pasando, baje el servicio en cuestión para manualmente modificar los recusos de OCPU y memoria.

En el momento de aprovisionar los recursos, me dió un error de capacidad desplegada. Esto debido a que había hecho una reserva importante de recursos en la configuración del pool.

Al darse el error, procedí de una a borrar el pool de configuración, para liberar los recursos.

Todo iba bien, hasta que me doy cuenta que la instancia de producción, pasa a estado en "TERMINACIÓN". Aquí el corazón empieza a latir rápidamente y tengo una sensación en mi cuerpo, peor que cualquier escena de una película de terror.


Generalmente, cuando uno borra un servicio desplegado, tiende a borrar consigo el almacenamiento adjunto a dicho servicio.

Cuando reviso el estado del disco de arranque del servicio, el mismo esta descoplado del servicio, pero no fue removido. Esto me permitió crear rápidamente de nuevo el servicio y configurarlo con los recursos deseados.

Pero que sucedió?

Al borrar el pool de recursos para escalación y tener asociada la instancia al pool, automáticamente se removieron los servicios configurados, salvo el área de almacenamiento.

Han pasado horas y el ambiente aún continua en estado "TERMINANDO".



La experiencia no fue muy grata. Aún asi, tenía los respaldos pertinentes y el impacto podría haber sido mínimo, sin embargo, los minutos de pánico y terror, fueron interminables.

Consejo: es necesario anter de remover un recurso, validar todas las dependencias y consecuencias que puede tener antes de hacerlo. Parta del hecho, que nada es 100% seguro, hasta que se compruebe lo contrario.

Con la situación pendiente de los recursos no liberados en estado de "TERMINACION", toca esperar un poco más y sino, colocar un SR para atender el tema.







No hay comentarios:

Publicar un comentario

Te agradezco tus comentarios. Te esperamos de vuelta.

Todos los Sábados a las 8:00PM

Optimismo para una vida Mejor

Optimismo para una vida Mejor
Noticias buenas que comentar