Entendendo a Linha de Discos SATA da Western Digital (2014)
Escolho categorizar a linha de discos SATA da Western Digital’ por diversas razões. Uma delas é que a WD é a atual líder de mercado em discos rígidos de pratos giratórios, o que torna a categorização mais útil para o maior número de pessoas; a linha “codificada por cores” é, com base em evidências anedóticas, de longe a família de discos preferida do mercado de pequenas empresas, onde o diagnóstico é mais importante e os discos SATA mantêm a maior disparidade de recursos e fatores, tornando-os muito mais necessários de se compreender bem. Embora, tecnicamente, a única diferença entre um disco SAS (SCSI) e um disco SATA (ATA), ou mesmo um disco Fibre Channel (FC), seja apenas o protocolo de comunicação usado para se comunicar com eles, em termos práticos os discos SAS e FC são fabricados apenas em determinadas configurações de alta confiabilidade e não exigem o mesmo grau de escrutínio nem carregam os mesmos riscos extremos dos discos SATA. Compreender as ofertas de discos SATA é o mais importante para as necessidades práticas e reais de armazenamento.
A WD tornou especialmente fácil compreender sua linha de discos SATA ao adicionar códigos de cores à maioria de suas ofertas de discos SATA – aqueles considerados discos de “consumo” – e uma designação “E” em seus discos SATA corporativos, além de um caso à parte, os discos Velociraptor de alto desempenho, que buscam competir com o desempenho comum de SAS em controladoras SATA. No total, há sete famílias de discos SATA a considerar, cobrindo todo o espectro de fatores de disco. Embora este diagnóstico se aplique à linha de fácil compreensão da WD, comparando os fatores aqui com as ofertas de outros fabricantes de discos, os casos de uso de seus discos também podem ser determinados.
Ao considerar discos SATA, três fatores realmente cruciais se destacam como os mais importantes a serem avaliados (além do preço, é claro).
Taxa de URE: URE, ou Erro de Leitura Irrecuperável (Unrecoverable Read Error), é um evento que acontece, com certa regularidade, em mídias de armazenamento em disco eletromecânico, no qual um único setor não consegue ser recuperado. Em um disco isolado, isso acontece de tempos em tempos, mas geralmente afeta apenas um único arquivo, e os usuários normalmente percebem isso como um arquivo perdido (frequentemente um que nem notam) ou, possivelmente, um sistema de arquivos corrompido que pode ou não ser facilmente corrigido. Em arranjos RAID saudáveis (exceto o RAID 0), o sistema RAID fornece espelhamento e/ou paridade que pode compensar essa falha de setor e recriar os dados, protegendo-nos de problemas de URE. Quando um arranjo RAID está em estado degradado, as UREs voltam a ser um risco potencial. Em seu pior cenário, uma URE em um arranjo de paridade degradado pode, em alguns casos, causar a perda total do arranjo (todos os dados são perdidos). Portanto, considerar as UREs e suas implicações em qualquer compra de disco é extremamente importante e é o principal fator de diferenciação de custo em discos de tipos variados. A URE varia da extremidade inferior, em 10^14, à extremidade superior, em 10^16. Os números são tão grandes que sempre são escritos em notação científica. Não vou entrar em uma explicação aprofundada sobre taxas de URE, ramificações e estratégias de mitigação aqui, mas compreender a URE é fundamental para a tomada de decisão em torno de compras de discos, especialmente no espaço de alta capacidade e menor confiabilidade dos discos SATA.
Velocidade do Eixo (Spindle Speed): Este é um dos maiores fatores para a maioria dos usuários; a velocidade do eixo se correlaciona diretamente com IOPS e taxa de transferência. Embora as medições de velocidade de disco sejam, na melhor das hipóteses, dinâmicas, a velocidade do eixo é a melhor forma geral de comparar dois discos idênticos sob carga idêntica. Um disco de 15.000 RPM entregará quase exatamente o dobro de IOPS e de taxa de transferência de um disco de 7.200 RPM, por exemplo. Os discos SATA comumente vêm nas variedades de 5.400 RPM e 7.200 RPM, com raros discos de alto desempenho disponíveis a 10.000 RPM.
Controle de Recuperação de Erros (ERC): Também conhecido como TLER (Time Limited Error Recovery, ou Recuperação de Erros com Tempo Limitado) na terminologia da WD, o ERC é um recurso do firmware de um disco que permite limites de tempo configuráveis para erros de leitura ou escrita, o que pode ser importante quando um disco rígido é usado em um arranjo RAID, já que muitas vezes a recuperação de erros precisa ser tratada no nível do arranjo, e não no nível do disco. Sem o ERC, um disco tem maior probabilidade de ser incorretamente marcado como falho quando, na verdade, não falhou. Isso é mais perigoso em arranjos RAID de paridade baseados em hardware e apresenta diferentes níveis de eficácia conforme os parâmetros de cada controladora RAID. É um recurso importante para discos destinados ao uso em arranjos RAID.
Além desses fatores-chave, a WD lista muitos outros para seus discos, como tamanho do cache, número de processadores, tempo médio entre falhas, etc. Estes tendem a ser muito menos importantes, especialmente o MTBF e outros números de confiabilidade, pois podem ser facilmente distorcidos ou mal interpretados e raramente oferecem a percepção sobre a confiabilidade do disco que esperamos. O tamanho do cache não é muito significativo para arranjos RAID, pois eles precisam ser desativados por razões de integridade dos dados. Portanto, fora de cenários de uso em desktop, o tamanho do cache de um disco rígido é geralmente considerado irrelevante. A contagem de CPUs também pode ser enganosa, pois CPUs únicas podem ser mais poderosas do que CPUs duplas se as CPUs não forem idênticas e a eficácia da segunda CPU for desconhecida. Mas a WD lista isso como um recurso de destaque de alguns discos, e presume-se que haja um ganho de desempenho mensurável, muito provavelmente na redução de latência, com a adição da segunda CPU. No entanto, continuo a tratar isso como um fator trivial e, em sua maior parte, útil apenas como ponto de interesse, e não como fator de decisão
Os discos.
Todos os discos codificados por cores (Blue, Green, Red e Black) compartilham um fator comum – possuem a classificação de URE de “consumo” de 10^14. “Consumo” é uma descrição ruim aqui, mas é, mais ou menos, o padrão da indústria. Uma descrição melhor seria “classe desktop” ou adequada para usos de RAID sem paridade. A única aplicação verdadeiramente ruim de discos com URE de 10^14 é em arranjos RAID de paridade, e mesmo aí eles podem ter seu lugar se forem devidamente compreendidos.
Blue: Os discos WD Blue são, na prática, o modelo de referência da linha SATA. Eles giram na velocidade “padrão” de 7.200 RPM, não têm ERC/TLER e possuem um único processador. O cache do disco varia entre 16MB, 32MB e 64MB, dependendo do modelo específico. Os discos Blue são voltados para o uso tradicional em desktops – como discos individuais com características de velocidade moderadas, não muito adequados para uso em servidores ou RAID. Os discos Blue são o que se “espera” encontrar em desktops de prateleira. Os discos Blue perderam amplamente popularidade e, muitas vezes, não estão disponíveis em capacidades maiores. Os discos Black e Green substituíram, em grande parte, o uso dos discos Blue, ao menos em cenários de maior capacidade.
Black: Os discos WD Black são uma pequena melhoria em relação aos discos Blue, não mudando nada exceto a atualização de um para dois processadores, a fim de melhorar ligeiramente o desempenho, embora não sejam tão econômicos. Assim como os discos Blue, eles não têm ERC/TLER e giram a 7.200 RPM. Todos os discos Black têm o cache de 64MB. Como os discos Blue, os discos Black são mais adequados para aplicações tradicionais de desktop, onde os discos operam de forma isolada.
Green: Os discos WD Green, como seu nome nominalmente sugere, são projetados para aplicações de baixo consumo de energia. São os mais semelhantes aos discos Blue, mas giram a uma velocidade mais lenta de 5.400 RPM, o que exige menos energia e gera menos calor. Os discos Green, assim como os Blue e Black, são projetados para uso isolado, principalmente em desktops que precisam de menos desempenho de disco do que se espera de um desktop médio. Os discos Green provaram ser muito populares devido ao seu baixo custo de aquisição e operação. Presume-se, também, que os discos Green sejam mais confiáveis do que suas contrapartes de giro mais rápido, devido ao menor desgaste dos eixos mais lentos, embora eu não tenha conhecimento de qualquer estudo nesse sentido.
Red: Os discos WD Red são únicos na linha de discos “codificados por cores” da WD por oferecerem ERC/TLER e serem projetados para uso em pequenos arranjos RAID de servidores de “uso doméstico” e dispositivos de armazenamento (como NAS e SAN). Internamente, os discos WD Red são discos WD Green; todas as especificações são as mesmas, incluindo a velocidade de eixo de 5.400 RPM, mas com o TLER habilitado no firmware. Fisicamente, são os mesmos discos. A WD recomenda oficialmente os discos Red apenas para aplicações de consumo, mas os discos Red, devido ao seu menor consumo de energia e ao TLER, provaram ser extremamente populares em grandes arranjos RAID, especialmente quando usados para arquivamento. Os discos Red, tendo URE de 10^14, são perigosos para uso em arranjos RAID de paridade, mas são excelentes para arranjos RAID espelhados e realmente brilham em necessidades de arquivamento e armazenamento similares, onde a grande capacidade e os baixos custos operacionais são fundamentais e o desempenho de armazenamento não é muito importante.
Fora dos discos codificados por cores, a WD tem três famílias de discos SATA, todas consideradas corporativas. O que esses discos têm em comum é que sua taxa de URE é muito mais alta do que a dos discos “de consumo” codificados por cores. Varia de URE de 10^15 a 10^16, dependendo do modelo. O resultado mais importante dessa taxa de URE é que esses discos são muito mais aplicáveis ao uso em arranjos RAID de paridade (por exemplo, RAID 6).
SE: Os discos SE são os discos SATA corporativos de nível básico da WD, com taxas de URE de 10^15 e velocidades de eixo de 7.200 RPM. Eles têm processadores duplos e um cache de 64MB. O mais importante é que os discos SE têm o ERC/TLER habilitado. Os discos SE são ideais para arranjos RAID corporativos, tanto espelhados quanto de paridade.
RE: Os discos RE são os discos SATA corporativos padrão de ponta da WD, com todas as especificações idênticas às dos discos SE, mas com a taxa de URE ainda melhor, de 10^16. Os discos RE são as estrelas da estratégia de discos RAID da WD, sendo perfeitos para arranjos de capacidade extremamente grande, mesmo quando usados em arranjos de paridade. Os discos RE estão disponíveis em configurações tanto SATA quanto SAS, mas com a mesma mecânica de disco.
Velociraptor: O Velociraptor da WD é um membro um tanto peculiar da categoria SATA. Com URE de 10^16 e uma velocidade de eixo de 10.000 RPM, o Velociraptor é, ao mesmo tempo, altamente confiável e muito rápido para um disco SATA, competindo com os discos SAS comuns e convencionais. Surpreendentemente, o Velociraptor tem apenas um único processador e, ainda mais surpreendente, não possui ERC/TLER, o que o torna questionável para uso em arranjos RAID. Por não ter ERC, o uso em RAID pode ser considerado caso a caso, dependendo de como o sistema RAID interage com a temporização do disco. Com a excelente classificação de URE, o Velociraptor seria uma excelente escolha para arranjos RAID de paridade grandes e de maior desempenho, mas apenas se o arranjo tratar a temporização de erros de forma elegante; caso contrário, o risco de o arranjo marcar o disco como falho é inaceitavelmente alto para um arranjo tão custoso quanto este seria. Vale notar que os discos Velociraptor não vêm em capacidades comparáveis às das demais ofertas de discos SATA – são muito menores.
Claro, a comparação final que se precisa fazer é a de preço. Ao considerar compras de discos, especialmente onde grandes arranjos RAID estão envolvidos ou para outras necessidades de armazenamento em massa, o custo por disco é frequentemente um fator importante, se não o decisivo. O uso de discos mais lentos e menos confiáveis em um nível de RAID mais confiável (como discos Red em RAID 10) versus discos mais rápidos e mais confiáveis em um nível de RAID menos confiável (como discos RE em RAID 6) frequentemente proporciona uma melhor combinação de confiabilidade, desempenho, capacidade e custo. Os preços reais dos discos desempenham um papel significativo nessas decisões. Esses preços, ao contrário das especificações dos discos, podem flutuar de um dia para o outro e direcionar as decisões de planejamento em diferentes sentidos mas, no geral, tendem a permanecer relativamente estáveis em comparação uns com os outros.
Na época deste artigo, no final de 2013, um levantamento rápido de preços de discos de 3TB da WD fornece esta divisão aproximada:
Green US$ 120
Red US$ 135
Black US$ 155
SE US$ 204
RE US$ 265
Como se pode ver, o salto de preço vem principalmente entre os discos de classe consumo ou desktop e os discos corporativos, com suas melhores taxas de URE, sendo os discos Red e RE, ambos com ERC/TLER, numa proporção de preço de quase exatamente 2:1, tornando favorável, para igual capacidade, escolher muitos mais discos Red em RAID 10 do que menos discos RE em RAID 6, por exemplo. Portanto, comparar diversos fatores, juntamente com os preços reais atuais, é crucial para muitas decisões de compra.
Os discos mais novos, recém-lançados, estão começando a apresentar reduções no cache integrado exatamente pelas razões que afirmamos acima: discos projetados em torno do uso em RAID têm pouca ou nenhuma utilidade em ter cache integrado, pois ele precisa ser desativado por motivos de integridade dos dados.
Os fabricantes de discos hoje oferecem uma ampla variedade de opções de discos tradicionais baseados em pratos giratórios para atender a muitas necessidades diferentes. Compreendê-las pode levar a uma melhor confiabilidade e a compras mais econômicas, além de estender a utilidade das tecnologias tradicionais de disco pelos próximos anos.
