Comprendiendo la gama de discos SATA de Western Digital (2014)
Elijo categorizar la gama de discos SATA de Western Digital por varias razones. Una es que WD es el líder actual del mercado en discos duros mecánicos, por lo que esto hace que la categorización sea útil para la mayor cantidad de personas; la línea “codificada por colores” es, según la evidencia anecdótica, con mucho la familia de discos preferida del mercado de la pequeña empresa, donde el diagnóstico es más importante, y los discos SATA conservan la mayor disparidad de características y factores, lo que hace mucho más necesario comprenderlos bien. Si bien técnicamente la única diferencia entre un disco SAS (SCSI) y uno SATA (ATA), o incluso un disco Fibre Channel (FC), no es nada más que el protocolo de comunicación utilizado para comunicarse con ellos, en términos prácticos los discos SAS y FC solo se fabrican en ciertas configuraciones de alta fiabilidad y no requieren el mismo grado de escrutinio ni conllevan los mismos riesgos extremos que los discos SATA. Comprender la oferta de discos SATA es lo más importante para las necesidades de almacenamiento prácticas y del mundo real.
WD ha hecho especialmente fácil comprender su gama de discos SATA al añadir códigos de color a la mayoría de su oferta de discos SATA – aquellos considerados discos “de consumo”, y una designación “E” en sus discos SATA empresariales, junto con un caso atípico, los discos Velociraptor de alto rendimiento que buscan competir con el rendimiento SAS habitual para controladoras SATA. En total tienen siete familias de discos SATA a considerar, que cubren todo el espectro de factores de los discos. Si bien este diagnóstico se aplicará a la fácil de comprender gama de WD, al comparar aquí los factores con la oferta de otros fabricantes de discos también se pueden determinar los casos de uso de sus discos.
Al considerar los discos SATA, destacan tres factores realmente clave como los más cruciales a tener en cuenta (al margen del precio, por supuesto).
Tasa de URE: Un URE, o Error de Lectura Irrecuperable (Unrecoverable Read Error), es un evento que ocurre, con cierta regularidad, en los medios de almacenamiento en disco electromecánicos, en el que no es posible recuperar un único sector. En un disco autónomo esto sucede de vez en cuando, pero por lo general solo afecta a un único archivo, y los usuarios suelen verlo como un archivo perdido (a menudo uno que no notan) o posiblemente como un sistema de archivos dañado que puede o no corregirse con facilidad. En arreglos RAID saludables (salvo RAID 0), el sistema RAID proporciona duplicación o paridad que puede cubrir este fallo de sector y recrear los datos, protegiéndonos de los problemas de URE. Cuando un arreglo RAID se encuentra en estado degradado, los UREs vuelven a ser un riesgo potencial. En su peor caso, un URE en un arreglo de paridad degradado puede, en algunos casos, provocar la pérdida total del arreglo (se pierden todos los datos). Por ello, considerar los UREs y sus implicaciones en cualquier compra de discos es extremadamente importante y es el principal impulsor de la diferencia de coste en discos de distintos tipos. La tasa de URE varía desde el extremo inferior de 10^14 hasta el extremo superior de 10^16. Las cifras son tan grandes que siempre se escriben en notación científica. No entraré aquí en una explicación en profundidad de las tasas de URE, sus ramificaciones y las estrategias de mitigación, pero comprender el URE es fundamental para la toma de decisiones en torno a la compra de discos, especialmente en el espacio de gran capacidad y menor fiabilidad de los discos SATA.
Velocidad del eje (Spindle Speed): Este es uno de los factores más importantes para la mayoría de los usuarios; la velocidad del eje se correlaciona directamente con las IOPS y el rendimiento de transferencia. Si bien las mediciones de la velocidad de un disco son, en el mejor de los casos, dinámicas, la velocidad del eje es la mejor manera global de comparar dos discos por lo demás idénticos bajo una carga idéntica. Un disco de 15.000 RPM ofrecerá casi exactamente el doble de IOPS y rendimiento de transferencia que un disco de 7.200 RPM, por ejemplo. Los discos SATA suelen venir en variedades de 5.400 RPM y 7.200 RPM, con raros discos de alto rendimiento disponibles a 10.000 RPM.
Control de Recuperación de Errores (ERC): También conocido como TLER (Time Limited Error Recovery, Recuperación de Errores con Límite de Tiempo) en la terminología de WD, el ERC es una característica del firmware de un disco que permite establecer límites de tiempo configurables para los errores de lectura o escritura, lo cual puede ser importante cuando un disco duro se utiliza en un arreglo RAID, ya que a menudo la recuperación de errores debe gestionarse a nivel del arreglo y no del disco. Sin ERC, es más probable que un disco se marque incorrectamente como fallido cuando no lo está. Esto es más peligroso en los arreglos RAID de paridad basados en hardware y tiene distintos niveles de eficacia según los parámetros de cada controladora RAID. Es una característica importante para los discos que se supone que se usarán en arreglos RAID.
Además de estos factores clave, WD enumera muchos otros para sus discos, como el tamaño de la caché, el número de procesadores, el tiempo medio entre fallos, etc. Estos suelen ser mucho menos importantes, especialmente el MTBF y otras cifras de fiabilidad, ya que pueden distorsionarse o malinterpretarse fácilmente y rara vez ofrecen la visión sobre la fiabilidad del disco que esperamos o deseamos. El tamaño de la caché no es muy significativo para los arreglos RAID, ya que debe deshabilitarse por motivos de integridad de los datos. Por lo tanto, fuera de los escenarios de uso de escritorio, el tamaño de la caché de un disco duro suele considerarse irrelevante. El número de CPU también podría ser engañoso, ya que una sola CPU puede ser más potente que dos CPU si estas no son idénticas y se desconoce la eficacia de la segunda CPU. Pero WD presenta esto como una característica destacada de algunos discos y se asume que existe una ganancia de rendimiento medible, muy probablemente en la reducción de la latencia, mediante la incorporación de la segunda CPU. No obstante, sigo tratándolo como un factor trivial, útil en su mayor parte solo como un punto de interés y no como un factor de decisión.
Los discos.
Todos los discos codificados por colores (Blue, Green, Red y Black) comparten un factor común – tienen la calificación de URE “de consumo” de 10^14. “De consumo” es una mala descripción aquí, pero es, más o menos, el estándar de la industria. Una mejor descripción es “de clase escritorio” o apto para usos RAID sin paridad. La única aplicación verdaderamente deficiente de los discos con URE 10^14 es en arreglos RAID de paridad, e incluso ahí pueden tener su lugar si se comprenden adecuadamente.
Blue: Los discos WD Blue son el modelo base efectivo de la gama SATA. Giran a las 7.200 RPM “predeterminadas”, carecen de ERC/TLER y tienen un único procesador. La caché del disco varía entre 16 MB, 32 MB y 64 MB según el modelo específico. Los discos Blue están orientados al uso de escritorio tradicional – como discos individuales con características de velocidad moderadas, no muy adecuados para uso en servidores o RAID. Los discos Blue son lo que se “espera” encontrar en los equipos de escritorio comerciales. Los discos Blue han perdido popularidad ampliamente y a menudo no están disponibles en tamaños más grandes. Los discos Black y Green han reemplazado en su mayoría el uso de los discos Blue, al menos en escenarios de mayor capacidad.
Black: Los discos WD Black son una pequeña mejora respecto a los discos Blue, sin cambiar nada salvo pasar de uno a dos procesadores para mejorar ligeramente el rendimiento, a la vez que no resultan tan rentables. Al igual que los discos Blue, carecen de ERC/TLER y giran a 7.200 RPM. Todos los discos Black tienen la caché de 64 MB. Al igual que los discos Blue, los discos Black son más adecuados para aplicaciones de escritorio tradicionales donde los discos funcionan de forma autónoma.
Green: Los discos WD Green, como su nombre sugiere nominalmente, están diseñados para aplicaciones de bajo consumo de energía. Son los más similares a los discos Blue, pero giran a unas 5.400 RPM más lentas, lo que requiere menos energía y genera menos calor. Los discos Green, al igual que los Blue y Black, están diseñados para uso autónomo, principalmente en equipos de escritorio que necesitan menos rendimiento de disco del que se espera en un escritorio promedio. Los discos Green han demostrado ser muy populares debido a su bajo coste de adquisición y operación. También se asume que los discos Green son más fiables que sus homólogos de giro más rápido debido al menor desgaste de los ejes más lentos, aunque no tengo conocimiento de ningún estudio en este sentido.
Red: Los discos WD Red son únicos dentro de la gama de discos WD “codificada por colores” en el sentido de que ofrecen ERC/TLER y están diseñados para su uso en pequeños arreglos RAID de servidores “de uso doméstico” y dispositivos de almacenamiento (como NAS y SAN). Por dentro, los discos WD Red son discos WD Green; todas las especificaciones son las mismas, incluida la velocidad del eje de 5.400 RPM, pero con TLER habilitado en el firmware. Físicamente son los mismos discos. WD recomienda oficialmente los discos Red solo para aplicaciones de consumo, pero los discos Red, debido a su menor consumo de energía y a su TLER, han demostrado ser extremadamente populares en arreglos RAID grandes, especialmente cuando se usan para archivado. Los discos Red, al tener URE 10^14, son peligrosos para usarse en arreglos RAID de paridad, pero son excelentes para arreglos RAID duplicados y realmente brillan en necesidades de archivado y almacenamiento similares, donde la gran capacidad y los bajos costes operativos son clave y el rendimiento del almacenamiento no es muy importante.
Al margen de los discos codificados por colores, WD tiene tres familias de discos SATA que se consideran todas empresariales. Lo que estos discos tienen en común es que su tasa de URE es mucho más alta que la de los discos “de consumo” codificados por colores. Varía desde URE 10^15 hasta 10^16 según el modelo. El resultado más importante de esta tasa de URE es que estos discos son mucho más aptos para su uso en arreglos RAID de paridad (por ejemplo, RAID 6).
SE: Los discos SE son los discos SATA empresariales de nivel de entrada de WD, con tasas de URE 10^15 y velocidades de eje de 7.200 RPM. Tienen dos procesadores y una caché de 64 MB. Lo más importante es que los discos SE tienen ERC/TLER habilitado. Los discos SE son ideales para arreglos RAID empresariales, tanto duplicados como de paridad.
RE: Los discos RE son los discos SATA empresariales estándar de gama alta de WD, con todas las especificaciones idénticas a las de los discos SE, pero con la tasa aún mejor de URE 10^16. Los discos RE son las estrellas de la estrategia de discos RAID de WD, siendo perfectos para arreglos de capacidad extremadamente grande, incluso cuando se utilizan en arreglos de paridad. Los discos RE están disponibles en configuraciones tanto SATA como SAS, pero con la misma mecánica de disco.
Velociraptor: El Velociraptor de WD es un miembro un tanto peculiar de la categoría SATA. Con URE 10^16 y una velocidad de eje de 10.000 RPM, el Velociraptor es a la vez altamente fiable y muy rápido para un disco SATA, compitiendo con los discos SAS comunes y convencionales. Sorprendentemente, el Velociraptor tiene un solo procesador y, aún más sorprendente, carece de ERC/TLER, lo que hace cuestionable su uso en arreglos RAID. Al carecer de ERC, su uso en RAID puede considerarse caso por caso según la implementación, dependiendo de cómo interactúe el sistema RAID con la temporización del disco. Con su excelente calificación de URE, el Velociraptor sería una excelente opción para arreglos RAID de paridad grandes y de mayor rendimiento, pero solo si el arreglo gestiona la temporización de los errores de manera elegante; de lo contrario, el riesgo de que el arreglo marque el disco como fallido es inaceptablemente alto para un arreglo tan costoso como este. Cabe señalar que los discos Velociraptor no vienen en capacidades comparables a las del resto de la oferta de discos SATA – son mucho más pequeños.
Por supuesto, la comparación final que es necesario hacer es la del precio. Al considerar la compra de discos, especialmente cuando se trata de arreglos RAID grandes o de otras necesidades de almacenamiento masivo, el coste por disco suele ser un factor importante, si no el determinante. El uso de discos más lentos y menos fiables en un nivel de RAID más fiable (como discos Red en RAID 10) frente a discos más rápidos y fiables en un nivel de RAID menos fiable (como discos RE en RAID 6) a menudo proporciona una mejor combinación de fiabilidad, rendimiento, capacidad y coste. Los precios reales de los discos juegan un papel significativo en estas decisiones. Estos precios, a diferencia de las especificaciones de los discos, pueden fluctuar de un día a otro e inclinar las decisiones de planificación en distintas direcciones pero, en general, tienden a permanecer relativamente estables unos respecto a otros.
En el momento de este artículo, a finales de 2013, un rápido sondeo de los precios de los discos de 3 TB de WD arroja este desglose aproximado:
Green $120
Red $135
Black $155
SE $204
RE $265
Como puede verse, el salto de precio se produce principalmente entre los discos de consumo o de clase escritorio y los discos empresariales con sus mejores tasas de URE, siendo los discos Red y RE, ambos con ERC/TLER, los que mantienen una relación de precio de casi exactamente 2:1, lo que hace que, para igual capacidad, sea más favorable elegir muchos más discos Red en RAID 10 que menos discos RE en RAID 6, por ejemplo. Así que comparar una serie de factores, junto con los precios reales actuales, es crucial para tomar muchas decisiones de compra.
Los discos más nuevos, que están empezando a lanzarse, están comenzando a ver reducciones en la caché integrada del disco por exactamente las razones que expusimos anteriormente: los discos diseñados en torno al uso de RAID tienen poco o ningún motivo para tener caché integrada, ya que esta debe deshabilitarse por motivos de integridad de los datos.
Los fabricantes de discos de hoy ofrecen una amplia variedad de opciones de discos tradicionales basados en ejes para adaptarse a muchas necesidades diferentes. Comprenderlas puede conducir a una mejor fiabilidad y a compras más rentables, y prolongará la utilidad de las tecnologías de discos tradicionales en los años venideros.
