Fundado em 2008 · Edição Digital · 15 Junho 2026

SMB IT Journal

O Recurso de Tecnologia da Informação para Pequenas Empresas

Português
Negócios de TI

Você Realmente Precisa de Redundância: O Verdadeiro Custo da Indisponibilidade

Indisponibilidade – essa é uma palavra que ninguém quer ouvir. Ela provoca medo no coração das empresas, dos executivos e, especialmente, das equipes de TI. A indisponibilidade custa dinheiro e gera frustração.

Como a indisponibilidade desencadeia uma reação emocional, as empresas muitas vezes acabam reagindo a ela de forma diferente dos fatores empresariais tradicionais. Essa abordagem emocional faz com que as empresas, sobretudo as menores, que frequentemente carecem de controles financeiros racionais, tratem a indisponibilidade como algo muito pior do que realmente é. Não é incomum descobrir que empresas menores na verdade causaram a si mesmas mais prejuízo financeiro ao reagir ao medo de uma possível indisponibilidade do que a temida indisponibilidade teria provocado caso de fato ocorresse. Trata-se de um exagero perigoso.

O primeiro passo é determinar o custo da indisponibilidade. Em TI, lidamos com frequência com sistemas bastante complexos, e a indisponibilidade vem em diversas formas, como perda de acesso, perda de desempenho ou a perda completa de um ou mais sistemas. Determinar cada tipo de indisponibilidade e seus custos associados pode ser bastante complexo, mas uma visão de alto nível costuma ser suficiente para elaborar orçamentos racionais ou, no mínimo, é um bom ponto de partida no caminho rumo à compreensão dos riscos empresariais envolvidos na indisponibilidade. Tenha em mente que, assim como gastar demais para evitar a indisponibilidade é prejudicial, gastar demais para calcular os custos da indisponibilidade também é. Não gaste tanto tempo e tantos recursos determinando se você vai perder dinheiro a ponto de teria sido melhor simplesmente perdê-lo. Cuidado com o alto custo da tomada de decisão.

Podemos começar considerando apenas a perda completa do sistema. Qual é o custo da indisponibilidade organizacional para você – ou seja, se você tivesse que interromper todas as operações por uma hora ou um dia, quanto dinheiro seria perdido? Em alguns casos, as perdas poderiam ser drásticas, como no caso de um hospital, em que um dia de indisponibilidade resultaria em perda de confiança e de base futura de clientes, além de potencialmente gerar processos judiciais. Mas, em muitos casos, um dia de indisponibilidade poderia ter um impacto financeiro insignificante – muitas empresas poderiam simplesmente declarar o dia como feriado, deixar a equipe descansar e fazer com que as pessoas trabalhassem um pouco mais nos dias seguintes para compensar o acúmulo do dia perdido. Tudo se resume a como a sua empresa opera e pode operar e a quão bem preparada ela está para mitigar o tempo perdido. Muitas empresas analisam apenas os números de receita diária para determinar a receita perdida, mas isso pode ser extremamente enganoso.

Uma vez que tenhamos um valor aproximado para o custo da indisponibilidade, podemos então considerar o risco de indisponibilidade. Isso é muito difícil de avaliar, pois bons números sobre a confiabilidade de sistemas de TI são praticamente inexistentes, e os sistemas de cada organização são tão singulares que os dados do setor são quase inúteis. Aqui somos obrigados a contar com a equipe de TI para fornecer uma visão geral dos riscos e, com sorte, uma avaliação confiável da probabilidade de cada risco. Por exemplo, em números bem arredondados, se tivéssemos uma aplicação de linha de negócio executada em um servidor com apenas um disco rígido, esperaríamos que, em algum momento nos próximos cinco a dez anos, haveria indisponibilidade associada à perda desse disco. Se tivermos esse mesmo servidor com discos hot swap em um arranjo espelhado, então a probabilidade de indisponibilidade associada a esse sistema de armazenamento, mesmo ao longo de dez anos, é bastante pequena. Isso não significa que um disco não tenha probabilidade de falhar, pois tem, mas sim que o sistema provavelmente não será afetado até que a redundância seja restaurada, sem que os usuários finais percebam que algo aconteceu.

Nossa última ferramenta de estimativa aproximada é aplicar o horário comercial pertinente. Muitas empresas não operam 24×7; algumas operam, é claro, mas a maioria não. A perda de uma aplicação de linha de negócio às seis da tarde é equivalente à perda dessa aplicação às dez da manhã? E no fim de semana? As pessoas a estão usando de forma produtiva às três da tarde de uma sexta-feira, ou perdê-la quase não custaria nada e proporcionaria a satisfação de funcionários que ganhariam uma ou duas horas a mais em seus fins de semana? É possível remanejar os horários em caso de uma perda próxima ao horário de almoço? Esses fatores, embora pareçam triviais, podem ser significativos. Se a indisponibilidade ficar limitada a apenas duas a quatro horas, muitas empresas podem mitigar quase todo o impacto financeiro simplesmente pedindo aos funcionários um pouco de flexibilidade em seus horários para acomodar a interrupção, almoçando mais cedo ou saindo mais cedo do trabalho em um dia e trabalhando uma hora a mais no dia seguinte.

Agora que temos esses fatores – o custo da indisponibilidade, a capacidade de mitigar o impacto da indisponibilidade com base em sua duração e os riscos de eventos de interrupção – podemos começar a traçar um quadro de como provavelmente seria um evento de indisponibilidade. A partir disso, podemos começar a deduzir quanto dinheiro valeria a pena gastar para reduzir o risco de um evento desse tipo. Para algumas empresas, esse número será extremamente alto e, para outras, será surpreendentemente baixo. Esse exercício pode revelar muito sobre como uma empresa opera, algo que normalmente pode não ser tão visível.

É importante observar neste ponto que o que estamos analisando aqui é a perda de disponibilidade dos sistemas, e não a perda de dados. Estamos partindo do princípio de que bons backups estão sendo feitos e de que esses backups não estão comprometidos. Redundância e indisponibilidade não são temas relacionados à perda de dados, apenas à perda de disponibilidade. Os cenários de perda de dados devem ser tratados com igual ou maior diligência, mas constituem um tema à parte. É raro encontrar uma empresa que possa sobreviver a uma perda catastrófica de dados, mas é comum vivenciar e sobreviver com facilidade até mesmo a uma indisponibilidade substancial.

Existem várias maneiras de evitar a indisponibilidade; a redundância é bastante visível e tratada quase como uma palavra da moda, recebendo, portanto, muita atenção, mas há também outros meios. Um bom projeto de sistema é importante; evitar a complexidade do sistema pode reduzir consideravelmente a indisponibilidade simplesmente ao eliminar pontos de risco e fragilidade desnecessários. Usar hardware e software de qualidade também é importante – pois hardware de baixo padrão que seja redundante muitas vezes falhará com a mesma frequência que hardware de classe empresarial não redundante. Contar com uma cadeia de suprimentos ágil de peças de reposição pode ser um fator significativo, frequentemente na forma de contratos de fornecedores de hardware com prazo de quatro horas para reposição de peças. A lista continua. O que abordaremos é a redundância, que é onde temos maior probabilidade de gastar em excesso ao enfrentar o medo da indisponibilidade.

Agora que conhecemos os custos de não dispor de redundância adequada, podemos comparar esse custo potencial com o custo bem real e imediato de fornecer essa redundância. Algumas coisas, como os discos rígidos, têm alta probabilidade de falhar e são relativamente fáceis e econômicas de tornar redundantes – pegando um risco significativo e tornando-o trivial. Estes tendem a ser um primeiro foco. Mas há muitas áreas de redundância a considerar, como fontes de alimentação, hardware de rede, conexões de Internet e sistemas inteiros – muitas vezes tornados redundantes por meio de modernas técnicas de virtualização, que oferecem novos caminhos para a redundância antes inacessíveis a muitas empresas menores.

Novos tipos de redundância, especialmente aqueles disponibilizados por meio da virtualização, são frequentemente um ponto em que as empresas se sentirão tentadas a gastar em excesso, talvez de forma drástica, em comparação com os riscos de indisponibilidade. Pior ainda, no afã de adquirir os modismos mais recentes em redundância, as empresas muitas vezes implementam essas técnicas de forma incorreta e, na verdade, introduzem um risco maior e uma probabilidade mais alta de indisponibilidade em comparação a não ter feito nada. É cada vez mais comum ouvir falar de empresas que gastam dezenas ou até centenas de milhares de dólares na tentativa de mitigar uma perda monetária por indisponibilidade de apenas alguns milhares de dólares – e que então fracassam nessa tentativa, acabando por aumentar seu risco de qualquer modo.

Ao avaliar o custo da mitigação, é fundamental lembrar que a mitigação é uma despesa garantida, ao passo que o risco é apenas um risco. Muito parecido com o seguro automotivo, em que você paga uma pequena taxa mensal garantida a fim de afastar uma despesa enorme e não planejada. A teoria da mitigação de riscos é gastar uma quantia comparativamente pequena agora para reduzir o risco de uma grande despesa depois, mas, se o custo da mitigação ficar alto demais, então passa a ser melhor simplesmente aceitar os riscos.

Os sistemas podem, é claro, ser avaliados individualmente. Manter uma presença na web e um sistema telefônico em funcionamento o tempo todo é muito mais importante do que um sistema de e-mail, em que mesmo horas de indisponibilidade dificilmente seriam detectáveis por clientes externos. Pagar apenas para proteger aqueles sistemas em que o custo da indisponibilidade é significativo é uma estratégia importante.

Não se surpreenda se o que você descobrir for que, além de alguma redundância bem básica (como discos rígidos espelhados), um projeto de rede simples com bons planos de backup e restauração e um bom contrato de suporte de hardware é tudo o que se faz necessário para a maioria, se não para a totalidade, dos seus sistemas. Ao reduzir a complexidade dos seus sistemas, você os torna naturalmente mais estáveis e mais fáceis de gerenciar – reduzindo ainda mais o custo da sua infraestrutura de TI.

Marcadocost analysis downtime redundancy reliability risk uptime

Publicidade

SMB IT Journal — the IT resource for small business