jueves, 24 de junio de 2010

Cinco de algunos de los grandes errores que cometí como DBA Oracle en estos 20 años.

Por lo general, a todos nos gusta hablar de nuestros éxitos, pero escondemos hasta donde sea posible, nuestros fracasos.  Como ser humano que somos, nos da miedo reconocer, que producto de nuestras acciones muchas otras personas, han sufrido algún daño colateral, como resultado de una mala decisión, desatención o simplemente negligencia.

Con la frente en alto y la mirada fija en los ojos de la gente, puedo sentirme orgulloso, de que nunca, jamás y lo recalco, jamás, las decisiones que tomé, los errores que cometí, lo hice de manera deliverada con el afán de crear o hacer un daño a un tercero, simplemente, me equivoqué.

Y como producto de ese aprendizaje perenne, que es nuestra vida, ofrezco a ustedes, mi confesión, cinco de los grandes errores que he cometido durante estos 20 años de dedicación, al trabajo como DBA. 

No les he querido presentar estos datos en un orden específico, ustedes jusguen, si ha bien lo tienen y hagan su propio "ranking".

  1. Durante una ejecución de una tarea delicada, recibí una llamada telefónica.  En lugar de detenerme en ese momento, continúe con el trabajo y la llamada en paralelo.  Había generado una copia de respaldo de la tabla de datos, de una planilla y la conversación se volvió acalorada.  Mi estado de ánimo cambió y sin notarlo, empecé a discutir por teléfono.  Sin darme cuenta, como parte de la conclusión del trabajo que estaba haciendo, debía borrar la tabla temporal de datos.  Al no estar centrado totalmente sobre lo que estaba haciendo, borré la tabla transaccional y no la de pruebas.  Poco después, me llamaron y me preguntaron, que si sabía que había pasado con los datos de los empleados, ya que ese día se debía generar la planilla.  Como respuesta dí un no muy seguro.  Un análisis con Logminer de los redologs, arrojó, que yo había dropeado la tabla de producción.  Cuál fue mi error.?  Nunca, jamás, en ningúna situación, uno debe conversar cosas personales, que son de importancia, durante el período en que se esta laborando.  Los asuntos familiares deben atenderse en la casa y los asuntos laborales en el trabajo.  De ahí en adelante, cada vez que sonaba el teléfono, quitaba las manos del teclado y procedía a atender la llamada.  Tienen razón cuando dicen, que conducir un automovil y hablar por teléfono, es una combinación mortal, se ha comprobado que el hecho de hablar por teléfono móvil mientras se maneja reduce el tiempo de reacción en un 9% al momento de tener que frenar y en 19% cuando se debía acelerar luego de haber frenado.  Esto fue lo que me sucedió.

  2. Después de más de 48 horas sin dormir, por atender una emergencia de trabajo, emprendí el regreso a mi hogar.  Con una distancia por recorrer de más de 220 kilómetros y 5 horas y media de viaje, apresuré el paso, para que no me llegará la noche en la carretera.  Había recorrido la mitad del camino, cuando por un instante nada más, cerré los ojos, producto del cansancio mental, que me había dado el recuperar un servidor con una falla de hardware y luego montar todo a partir de respaldos y dejarlo nuevamente funcionando como se debía.  Por algún motivo, en fracciones de segundos, volví a abrir los ojos y me encontraba en medio de un puente sobre un río caudaloso por aquel entonces - tiempo de invierno- y bastante profundo, en el carril contrario.  Un autobus, venía de frente, tocando su pitoreta, para que me quitará del frente.  Apenas por algunos metros, pude pasarme nuevamente a mi carril, terminé de cruzar el puente y seguidamente, me estacioné al costado de la carretera y descanse por una hora y media.  En mi casa me esperaban, mi esposa y mis dos hijos pequeños por aquél entonces- al final tuve el honor de tener 2 varones y una niña, el mayor actualmente tiene 13 años, el que le sigue 11 años y medio y mi princesa 10 años-, el mayor tenía 3 años de edad, pude no verlos crecer y estar orgulloso como lo estoy hoy en día de lo que son cada uno de ellos.  El trabajo de DBA es sumamente agotador.  Si estamos concientes, que la labor va ha ser larga, mejor dejemos el auto en la casa y trasladémos al lugar en taxi.  Si es en una zona alejada, siempre planifíque, descansar una noche en el lugar.  Nunca maneje de noche, con más de 10 horas de labor realizada.

  3. Qué password le puse al usuario root ó administrator, en la instalación.?  Muchas veces hacemos las cosas de manera mecánica.  La confianza que dá los años de experiencia, nos hacen cometer errores tan simples y tontos, que cuando suceden, siempre buscamos alguna escusa tonta, para salir del paso.  Yo les recomiendo, siempre documentar todo, por más obvio que sea, es mejor "invertir" algunos segundos documentando, que "perder" una buena cantidad de tiempo, reinstalando todo.

  4. No leyó el readme.txt.? Upppsss!!!, que error más grande, el archivo de texto, indicaba el procedimiento que se debía seguir, para poder realizar un "rollback", de la aplicación de un parche.  Realizó el respaldo que se le solicitaba.?  Verificó que las cintas en dónde se bajo el respaldo podían ser leídas.?  Si iba a "raspar" el servidor ( reinstalar ), verificó que tenía todos los drivers del mismo, para la versión del sistema operativo.?   Este último fue mi error, siempre cuidé mucho, las letras menudas y antes de aplicar un parche de base de datos o sistema operativo, sobre todo en ambiente Linux ó Unix, verificaba que los respaldos se hubieran hecho de la manera adecuada.  Pero hasta que no me pasó, no verificaba con el cliente, que tuviera a la mano, todos los drivers del hardware requerido.  Anteriormente recordemos, era más difícil, buscar los drivers de hardware específicos, como controladores de disco, discos duros SATA o SCSI, tarjetas de video, puertos seriales, etc.  Todo un día tuve que invertir, en bajar de INTERNET, los drivers, que requería para reinstalar el equipo.  El proceso se atrasó un día por completo, cuando se había estimado, que el trabajo duraría 4 horas.

  5. Salió de gira a realizar un trabajo y no llevó su propio juego de cd´s, con el software requerido.?  Qué haría usted, si va para un lugar a realizar un trabajo, dónde no se tiene conexión a INTERNET y el cliente, se equivocó al indicarle, que tenía todo el software listo para instalar.  En una ocasión, despues de viajar casí 4 horas en auto, llegué a un lugar a instalar un Linux y el motor de la base de datos y según la información que me habían dado, ellos lo tenían todo.  Para resumir, la distribucción del Linux, era muy antigua y los discos del motor de la base de datos, era para plataforma MS Windows.  En otra ocasión, la versión del sistema operativo era x86 y los discos de instalación del software del motor de base de datos, eran de 64bits.  La inexperiencia y exceso de confianza, no me dejó ver, que podrían no tener los medios correctos para la instalación.  De ahí en adelante, cada vez, que me trasladaba a un cliente lejano, llevaba conmigo, mi propio juegos de cd´s.  En 6 de cada 10 ocasiones que debía hacer una instalación entre el 2000 y el 2007, el cliente no contaba con el software correcto.
Estos son algunos ejemplos, no necesariamente, los más malos, que por razones de confidencialidad puedo contarles, pero que sirven de ejemplo, para que ustedes no los cometan en el futuro.
Cuando inicié, era muy joven y las ganas de hacer y hacer, te hacía emprender muchas cosas, pero a la vez también cometer muchos errores.

Hoy que ya peino algunas canas, la experiencia me ha enseñado, que aún, estando completamente seguro de que todo va a salir bien, debo nuevamente hacer el chequeo, para evitar una sorpresa.  Guardar siempre un poco de humildad, para reconocer el error cometido y un poquito menos de soberbia, para brindarme apoyo en los momentos de gloria

1 comentario:

  1. Ronald:

    No estás sólo. Ciertamente, muchos de los errores vienen por descuido o por exceso de confianza. Una dosis de desconfianza en uno mismo, nunca está de más. En los casos de los errores de los clientes, como cuando bajan el software equivocado, uno podría pensar que es culpa de ellos y siempre se les va a cobrar por el viaje, ¿a quien le gusta viajar varias horas, para luego tener que devolverse a casa y volver luego con el software correcto? Como dices, mejor prevenir y de ser posible llevar el software, sólamente por si acaso.
    Gracias por tu confesión. Que sirva de recordatorio para algunos y de prevención para otros.

    ResponderEliminar

Te agradezco tus comentarios. Te esperamos de vuelta.

Todos los Sábados a las 8:00PM

Optimismo para una vida Mejor

Optimismo para una vida Mejor
Noticias buenas que comentar