Um servidor típico
Imagem via Wikipedia
É um saco ter de escrever sobre isso ao invés de dar alguma dica maravilhosa de alguma descoberta sensacional, ou de falar sobre alguma coisa bacana que tenhamos visto ou vivido.
Mas o que se nos apresenta é uma downtime não programada no final da tarde de hoje, de cerca de uma hora de duração.
A causa do problema foi uma queda de energia no data center que nos abriga, além da capacidade de energia reserva deles. Quando a energia de reserva acabou demorou mais cerca de 15 minutos até que o fornecimento de energia se restabelecesse, e mais cerca de 25 minutos para fazer o servidor voltar a funcionar a contento.
Nesses 25 minutos tivemos indisponibilidade dos serviços devido à necessidade de executar a checagem dos discos (afinal, o servidor foi desligado na marra) e outras rotinas de segurança.
Quando pudemos restabelecer o funcionamento do Apache (servidor de páginas) os serviços ainda não estavam em velocidade plena devido à checagem da integridade do MySQL. Usuários do 1BlogCacher provavelmente não perceberam a diferença, mas sites sem recursos de cache devem ter parecido bem mais lentos.
Neste exato momento em que finalizo este texto, os serviços estão normalizados, embora o servidor esteja com constantes 16% de uso de CPU (nossa meta é manter esse valor abaixo de 10%), o que deve significar serviço de páginas normalizado.
Qualquer problema, por favor me contatem, senhores e senhoras VIPs. No MSN consta o novo número de meu telefone celular, que inclusive aceita SMS.
