REDUNDÂNCIA DE DATA CENTERS: o que duplicar para ter menos downtime e mais segurança nas operações de TI?

A redundância de Data Center é, basicamente, a repetição de equipamentos vitais que cumprem a mesma função. Caso um deixe de funcionar, o outro assume automaticamente a tarefa.

É o caso de geradores de energia que substituem a rede elétrica em apagões. Ou de unidades redundantes de refrigeração prontas para assumir o trabalho numa falha inesperada do sistema de climatização do Data Center.

O objetivo é impedir que qualquer tipo de problema em equipamentos ou no fornecimento de energia paralise o Data Center gerando os chamados “downtimes”.

Quanto mais camadas de repetição, maior é a redundância no Data Center e, consequentemente, sua confiabilidade e segurança contra falhas e paralisações não programadas.

Fica fácil entender a importância de contar com um elevado nível de proteção quando falamos dos prejuízos que interrupções inesperadas no funcionamento de um Data Center podem causar. Então…

 

Por que evitar downtimes investindo na redundância de Data Center?

 

Downtimes geram enormes prejuízos financeiros para as empresas. E certamente é melhor investir em equipamentos redundantes do que desperdiçar dinheiro arcando com os custos de interrupções não programadas.

Cada minuto de paralisação de um Data Center pode custar 5.600 mil dólares às empresas. É o que afirma a pesquisa Understanding the Cost of Data Center Downtime, realizada pelo Ponemon Institute em parceria com a Vertiv.

Após entrevistar empresários que administram Data Centers corporativos próprios (enterprise), o estudo identificou que uma hora de downtime pode custar mais de US$ 300 mil.

Os elevados custos de um downtime são gerados por impactos diretos e indiretos da paralisação não programada do Data Center, que afetam as rotinas corporativas em aspectos como:

 

  • Corrompimento ou perda de dados cruciais
  • Danos causados a equipamentos
  • Custos de ações emergenciais para a detecção de problemas e sua recuperação
  • Queda na produtividade, já que a paralisação de um Data Center pode imobilizar empresas
  • Com isso, negócios deixam de ser fechados e há perda de receitas
  • Perda de reputação corporativa.

 

Relatório Uptime Institute

 

É por isso que, cada vez mais, as empresas estão investindo em redundância em seus Data Centers. É isso que indica o relatório Uptime Institute 2020 Global Survey.

Segundo os resultados da pesquisa, 52% das empresas consultadas afirmaram que aumentaram a redundância do sistema elétrico.

E 48% apontaram que o sistema de refrigeração de seus Data Centers também ganharam novas camadas de redundância. Isso tudo em um período de apenas cinco anos.

Ou seja, quanto mais “camadas de redundância” o Data Center tiver, melhor, certo?

Sim e não! O nível de redundância de um Data Center deve ser precisamente projetado para atender às necessidades atuais e futuras de cada negócio.

E nisso deve ser considerado o custo-benefício do investimento na aquisição de cada equipamento redundante. Bem como o custo de manutenção da infraestrutura, incluindo questões relativas à eficiência energética do Data Center.

 

 

Em quais situações a redundância de Data Center é fundamental?

 

Sem nenhum equipamento extra, é muito provável que haja a necessidade de parar algum sistema do Data Center em algum momento.

Afinal, paralisações programadas de subsistemas podem ser necessárias para a realização de manutenções, reformas ou upgrade de equipamentos.

E contar com redundância nesses momentos é a garantia de que nada vai deixar de funcionar.

Já as interrupções não programadas – downtimes –  podem ser ocasionadas por uma série de fatores. Entre eles:

  1. Problemas nos equipamentos vitais do Data Center, como no sistema de monitoramento. Ou em condicionadores de ar que, sem o correto funcionamento, podem superaquecer o ambiente, desarmando automaticamente servidores.
  2. Se isso ocorrer, provavelmente houve uma falha na manutenção preventiva do Data Center. A manutenção deve ser feita periodicamente por especialistas segundo protocolos rigorosos de avaliação da infraestrutura.
  3. Outro fator que pode gerar downtimes é o próprio hardware, ou seja, problemas nos servidores e ativos de TI do Data Center.
  4. Também pode haver falhas nos softwares ou sistemas operacionais.
  5. E, claro, os ataques virtuais que miram o coração dos Data Centers.
  6. É possível ainda que um Data Center pare por falhas humanas nos processos de controle, segurança e manutenção.
  7. E há também os fatores externos, como a interrupção de energia elétrica por parte das concessionárias ou mesmo catástrofes, como terremotos, furacões ou enchentes.

Em resumo, são tantos fatores de risco de downtimes que o melhor é investir na redundância do Data Center. E fica claro também que a redundância deve estar presente em diversos equipamentos que compõem a infraestrutura de operação de dados.

Quando falamos em redundância de equipamentos, pensamos rapidamente nos sistemas elétrico e de refrigeração. No entanto, há outros equipamentos que podem ser duplicados para garantir o funcionamento total do Data Center sem qualquer paralisação. Continue lendo e saiba quais são.

 

1. Redundância do sistema elétrico

 

Já falamos bastante aqui sobre a importância do sistema elétrico para um Data Center, afinal a falha na transmissão de energia elétrica é uma das causas mais comuns de uma parada.

E é o tipo de paralisação que afeta todos os outros sistemas. Sem energia, nada feito. Por isso, a redundância dos equipamentos elétricos é absolutamente essencial para um Data Center.

Os Data Centers geralmente são alimentados pela energia que é transmitida pela concessionária. Mas sabemos que não dá para ter certeza de que não haverá quedas, nem que sejam rápidas. E é preciso levar em conta que em casos mais graves, o fornecimento pode ser interrompido por dias.

A redundância de energia normalmente se apoia em dois equipamentos: os UPSs (fonte de alimentação ininterrupta), mais conhecidos como no-breaks, e os geradores.

 

Nobreaks e geradores

 

A primeira camada é o nobreak. Quando há a queda de energia, o nobreak entra em cena para garantir o funcionamento dos equipamentos até que o fornecimento seja retomado. Só que o tempo de atuação dos nobreaks é limitado. Aí é necessário que outra camada seja ativada.

É o caso dos geradores, normalmente movidos a diesel, que geram energia elétrica por muito mais tempo. Eles podem alimentar um Data Center por dias e até semanas, dependendo da capacidade e do abastecimento.

 

→ Leia aqui nosso post completo sobre geradores e no-breaks para Data Centers!

 

Portanto, o caminho mais comum é o seguinte: interrupção de fornecimento da concessionária aciona o no-break, que pode funcionar até o banco de baterias se exaurir. E se a energia não voltar, então o gerador é acionado.

Só que esse não é necessariamente o melhor cenário de redundância de Data Center. É que existem várias configurações e camadas de redundância. Quanto mais equipamentos na fila, maior a confiabilidade. Veja abaixo algumas das possibilidades que podem existir na redundância elétrica de um Data Center:

  • Energia da concessionária + no-break
  • Energia da concessionária + no-break + gerador
  • Energia da concessionária + 2 no-breaks + gerador
  • Energia da concessionária + 2 no-breaks + 2 geradores
  • Energia da concessionária 1 + no-break + gerador + energia da concessionária 2

Veja que essa última opção coloca uma camada extra de redundância, que é a presença de uma outra fornecedora de energia elétrica. Claro que não são todos os locais que contam com essa alternativa, mas quando disponível, ele garante uma rara chance de paralisação.

 

2. Redundância do sistema de climatização

 

O sistema de climatização também precisa ser colocado como prioridade quando o assunto é redundância em Data Center.

Isso porque são as máquinas de ar condicionado que vão manter o ambiente na temperatura ideal de funcionamento dos equipamentos vitais dentro de um Data Center.

E, claro, como qualquer outra máquina, o ar-condicionado pode apresentar falhas. Ainda mais porque os condicionadores de ar precisam trabalhar 24 horas por dia, 365 dias por ano.

Mas para evitar que essas eventuais falhas signifiquem paralisação ou danos, até mesmo irreparáveis, em equipamentos, é importante que haja a repetição de máquinas que compõem o sistema de climatização.

E isso não vale apenas para as unidades de ar-condicionado, que são uma parte do sistema todo. Há também máquinas que controlam a umidade e a qualidade de ar dentro de um Data Center. E falhas nesses sistemas podem também ser muito prejudiciais, por isso também podem ganhar duplicações.

 

→ Para saber mais sobre o sistema de climatização de um Data Center, clique aqui.

 

3. Redundância de rede

 

Qualquer Data Center depende de uma rede de transmissão de dados, notadamente acesso à WEB. Logo, é impossível imaginar um Data Center sem internet. Isso simplesmente não pode acontecer em um ambiente como esse, pois significa paralisação das operações da empresa.

Para evitar esses casos, novamente a redundância de Data Center entra em ação. No aspecto de rede, a redundância está na contratação de pelo menos dois provedores de banda larga. Assim, caso haja instabilidade ou mesmo interrupção do serviço de um provedor, a outra operadora contratada assume as obrigações dentro do Data Center.

 

→ Saiba mais sobre as topologias de redes e cabeamento de comunicação de dados para Data Centers.

 

 

 4. Redundância de dados

 

Os dados são o coração de um Data Center. É por eles que existem os Data Centers, afinal. Ou seja, tudo gira em torno dos dados. E só de pensar em perdê-los, qualquer empresa sabe que precisa investir em redundância também nesse aspecto.

E quando falamos em dados, falamos naturalmente em backup. Ou seja, a cópia de todas as informações já geradas, para que nada seja perdido em caso de paralisação por motivos externos, como problemas elétricos ou ataques virtuais. E mesmo em casos de falha humana que podem degradar os dados.

Existem basicamente dois níveis de proteção dos dados em casos de paralisação. E nesse sentido, um Data Center pode ter:

 

a) Tolerância a falhas (“full tolerance”)

 

Num Data Center tolerante a falhas, a redundância é baseada em harware. Todo o sistema de dados é espelhado. Assim, caso o sistema principal fique indisponível, o sistema de backup assume automaticamente. Esse é o modelo ideal para operações que não aceitam qualquer inatividade, como indústrias ou atividades de risco, porém é mais caro e complexo para ser implementado.

 

 b) Alta disponibilidade

 

Nesse caso, a redundância é baseada em software. Caso ocorra algo errado em um determinado servidor, os softwares de backup assumem e reiniciam os aplicativos que estavam sendo executados no momento da falha. Esse modelo exige, portanto, menos infraestrutura, mas não garante atividade ininterrupta.

 

Redundância de Data Centers

 

Níveis de redundância em Data Centers

 

Independentemente do sistema em que seja utilizada, a redundância em Data Center pode ser medida e certificada a partir de uma norma, que é a ANSI/EIA/TIA-942.

A TIA-942 é feita pela Telecommunications Industry Association (TIA), uma organização dos Estados Unidos especializada em Tecnologia da Informação e comunicação.  E especifica os requisitos para que a infraestrutura do Data Center ofereça graus de disponibilidade e redundância.

De acordo com a norma, existem cinco níveis de infraestrutura que um Data Center pode ter quanto à redundância em um ou mais subsistemas, como elétrico, climatização ou de telecomunicação. São eles:

 

1. Nível N

 

“N” significa a quantidade mínima de equipamentos que cada sistema do Data Center deve possuir. Num Data Center nível N existe apenas a infraestrutura básica para o funcionamento em condições ideais, sem proteções contra falhas. Portanto, não há redundância alguma.

 

2. Redundância N+1

 

Além da infraestrutura mínima necessária, um Data Center com redundância N+1 possui pelo menos um equipamento sobressalente em sistemas críticos.

Se, por exemplo, o sistema de climatização tem dois aparelhos de ar condicionado e foi construído com redundância N+1, isso significa que:

N= 2 condicionadores de ar.

N+1 = 2 condicionadores de ar + 1 ar-condicionado sobressalente.

No entanto, no modelo de redundância de Data Center N+1 os equipamentos repetidos podem compartilhar circuitos e caminhos de alimentação.

 

3. Redundância N+2

 

Nesse caso, o Data Center possui os equipamentos necessários e mais dois redundantes. Portanto, neste caso:

N= 2 condicionadores de ar.

N+2 = 2 condicionadores de ar + 2 ares-condicionados sobressalentes.

 

4. Redundância 2N

 

Nesse modelo, a infraestrutura básica é totalmente duplicada. Portanto, a redundância de Data Center 2N implica em duas unidades, módulos, caminhos ou sistemas completos.

“No caso da alimentação elétrica, por exemplo, o Data Center com redundância 2N deve possuir duas linhas de distribuição totalmente redundantes e independentes. Isso desde os geradores até a régua de alimentação (DU) dos servidores!” – explica o engenheiro Fabrício Costa, diretor técnico da Zeittec Data Center Solutions .

Isso significa que as operações não são interrompidas em caso de falhas ou da realização de manutenção em uma dessas unidades, módulos, caminhos ou no sistema inteiro.

 

5. Redundância 2 (N+1)

 

Num Data Center com redundância 2 (N+1), os sistemas críticos possuem o dobro da quantidade necessária de equipamentos (2N) e mais um módulo adicional para cada N. Com essa estrutura, o Data Center torna-se praticamente infalível.

 

Classificação Tier ou “camadas de redundância” de Data Centers

 

De acordo com os níveis de redundância que acabamos de ver, a norma TIA-942 estabelece quatro “camadas de redundância” de Data Centers.

Essas camadas são chamadas de Tiers, e variam conforme a infraestrutura de repetição em um ou mais subsistemas.

Portanto, um Data Center pode ser, por exemplo, um Tier 2, com duas camadas de redundância em elétrica. E, ao mesmo tempo, ser um Tier 3, com três camadas em refrigeração. Mas o que há em cada camada?

 

Data Center Tier 1

 

Nesse tipo de Data Center, não há necessariamente redundâncias. Mas, de acordo com a norma, o Data Center precisa possuir nobreaks (UPS) no sistema elétrico, além de gerador e um sistema completo de climatização. Uma infraestrutura Tier 1 garante funcionamento das operações durante 99,671% do tempo. Ou seja, permite 28,8 horas de inatividade por ano.

 

Data Center Tier 2

 

Nesse caso, além dos requisitos do Tier 1, o Data Center possui redundância nos sistemas elétrico e de climatização. Como tem  componentes redundantes e de backup, ele reduz a inatividade para, no máximo, 22 horas por ano. Significa que o Data Center vai funcionar por 99,741% do tempo. Utiliza, portanto, a redundância N+1.

 

Data Center Tier 3

 

Aqui a redundância fica ainda mais evidente, não apenas ao agregar tudo o que consta nos Tiers 1 e 2, mas também ao disponibilizar novos caminhos para os sistemas elétrico e de refrigeração. Sem contar os servidores, que possuem um circuito de alimentação próprio. Além disso, os sistemas podem ser atualizados e passar por manutenção sem desligamento. Por tudo isso, o período de inatividade anual é de 95 minutos, com disponibilidade por 99,982% do tempo.

 

Data Center Tier 4

 

É o melhor dos cenários, que entrega praticamente 100% de atividade. Esse nível de redundância vai permitir no máximo 26,3 minutos de downtime por ano, ou seja, disponibilidade durante 99,995% do tempo. Nesse caso, todos os sistemas têm repetição, inclusive fontes de energia, internet e cabeamentos.

 

→ Para saber os mitos e verdade a respeito dos Data Center Tier 3 e Tier 4, clique aqui!

 

 

Diferenças práticas entre Data Centers Tier 1, Tier 2, Tier 3 e Tier 4

 

De modo prático, um Data Center Tier 1 possui estrutura mais simplificada, sendo recomendado para empresas que utilizam operações de TI em processos internos. Ou seja, que possam se organizar para desligar o Data Center durante a realização de manutenções.

O Data Center Tier 2, por sua vez, entrega maior proteção contra paralisações não programadas. E maior autonomia na realização de procedimentos técnicos e manutenções. Por isso, é indicado para negócios que não podem parar suas rotinas de processamento de dados, especialmente em horário comercial.

Já as empresas que dependem totalmente das atividades de TI realizadas pelo Data Center, como grandes e-commerces e operadoras de serviços essenciais, não podem parar nunca, nem mesmo à noite. E por isso precisam de uma infraestrutura como a de um Data Center Tier 3.

Um Tier 3 permite manutenções programadas sem a paralisação de rotinas, entregando ainda alta proteção contra falhas internas ou de fornecimento de energia.

Para corporações que necessitam de garantia total de disponibilidade e segurança no acesso às informações, o ideal é o Data Center Tier 4, tolerante a falhas. Se algo der errado em equipamentos internos ou houver um apagão, as operações continuarão por conta do alto nível de redundância do Data Center. Indicado, por exemplo, para empresas que lidam com informações sigilosas, onde um donwtime traria grandes prejuízos financeiros.

 

Certificação do nível de redundância do Data Center

 

A construção de um Data Center com várias camadas de redundância pode ser certificada ou não. Se sua empresa optar pela certificação, isso gerará um custo.

E nesse caso, o Uptime Institute é uma das certificadoras de Data Centers mais reconhecidas internacionalmente.

Porém, um Data Center pode conter todos os requisitos de redundância estabelecidos pelo Uptime Institute para um Tier 3 ou Tier 4, por exemplo, operando com total segurança sem obter a certificação.

É o caso do Data Center da Celesc, construído pela Zeittec em Florianópolis, SC. Embora não seja certificado, o site possui o mesmo nível de redundância de um Tier 3.

“São dois geradores de 450 kVA, UPS com 300 kVA de nobreaks e mais de 20 quadros elétricos. Se fosse certificado, ele seria um Data Center Tier III com muita folga” – diz Claudenir de OIiveira, diretor comercial da Zeittec Data Center Solutions.

 

→ Aproveite para conhecer o Data Center da Celesc neste vídeo!

 

Como escolher o melhor cenário de redundância?

 

Claro que o desejo de todas as empresas é garantir o maior nível de redundância no Data Center e, assim, garantir o mínimo risco às operações e aos dados.

Mas, antes de tudo, é preciso entender que cada empresa e cada Data Center tem uma realidade, inclusive financeira.

Por isso é importante planejar a redundância com quem entende do assunto. É o caso da Zeittec, que há mais de 20 anos realiza projetos, construção e reforma de Data Centers pelo Brasil, levando a sério a questão de redundância de acordo com as normas mais rígidas.

 

Pergunte a si mesmo!

 

No momento do projeto, o número de camadas ou nível de redundância de um Data Center deve ser pensado de acordo com as respostas a uma série de questões. Entre elas:

  1. Meu negócio paralisa se meu Data Center desligar?
  2. Ou seja, minha empresa depende totalmente das operações de TI realizadas pelo Data Center?
  3. O custo de um downtime seria maior que o investimento em equipamentos de redundância?
  4. O nível de criticidade das operações justifica a necessidade de um Data Center tolerante a falhas ou com alta disponibilidade?
  5. Com base nisso, meu Data Center precisa ter redundâncias compatíveis com um Tier 2, Tier 3 ou Tier4?
  6. Em quais sistemas? No elétrico, na climatização, nos links de internet e comunicação de dados?

Essa definição é feita em conjunto entre o cliente e a equipe de projetistas da Zeittec. E permite planejar a redundância do Data Center levando em conta o crescimento previsto nas metas de cada corporação para determinado período.

“Assim dimensionamos equipamentos e caminhos de distribuição ‘reserva’ ideais para assumir a carga/Data Center em caso de uma falha, seja ela elétrica, de componente ou até erro humano” – explica Fabrício Costa.

Por outro lado, a infraestrutura não pode ser superdimensionada, já que gera custos de manutenção, pessoal e consumo de energia elétrica.

 

Redundância na medida certa

 

Por isso, o nível de redundância de um Data Center precisa ser calculado cuidadosamente, na medida certa para manter a infraestrutura em operação e garantir o “uptime” de acordo com o nível de criticidade das operações. Nem mais, nem menos.

→ Pronto! Agora que você já sabe muito sobre a importância da redundância em Data Centers, entre em contato conosco para saber o que a Zeittec pode fazer para reduzir os riscos das operações de TI da sua empresa.

→ Aproveite para baixar nosso e-book sobre manutenção de Data Centers. E assine nosso newsletter para receber mais conteúdos relevantes do setor. Obrigado pela visita e até logo!

Comentários