Apr 28 2008

Downtime não programada - a volta

Arquivado em: Status

A typical server

Um servidor típico
Imagem via Wikipedia


É um saco ter de escrever sobre isso ao invés de dar alguma dica maravilhosa de alguma descoberta sensacional, ou de falar sobre alguma coisa bacana que tenhamos visto ou vivido.

Mas o que se nos apresenta é uma downtime não programada no final da tarde de hoje, de cerca de uma hora de duração.

A causa do problema foi uma queda de energia no data center que nos abriga, além da capacidade de energia reserva deles. Quando a energia de reserva acabou demorou mais cerca de 15 minutos até que o fornecimento de energia se restabelecesse, e mais cerca de 25 minutos para fazer o servidor voltar a funcionar a contento.

Nesses 25 minutos tivemos indisponibilidade dos serviços devido à necessidade de executar a checagem dos discos (afinal, o servidor foi desligado na marra) e outras rotinas de segurança.

Quando pudemos restabelecer o funcionamento do Apache (servidor de páginas) os serviços ainda não estavam em velocidade plena devido à checagem da integridade do MySQL. Usuários do 1BlogCacher provavelmente não perceberam a diferença, mas sites sem recursos de cache devem ter parecido bem mais lentos.

Neste exato momento em que finalizo este texto, os serviços estão normalizados, embora o servidor esteja com constantes 16% de uso de CPU (nossa meta é manter esse valor abaixo de 10%), o que deve significar serviço de páginas normalizado.

Qualquer problema, por favor me contatem, senhores e senhoras VIPs. No MSN consta o novo número de meu telefone celular, que inclusive aceita SMS.


Textos relacionados a este:

Trackback URI | Comments RSS

Leave a Reply

É proibida a reprodução do conteúdo deste site sem prévia autorização por escrito do autor. Citações de no máximo um parágrafo acompanhadas do link para o texto original são permitidas sem necessidade de autorização escrita.