Ferraris e Caminhões com Carreta

Trabalhando no mundo das PMEs, na verdade é bastante raro precisarmos falar sobre latência. O mundo das PMEs é quase universalmente focado na taxa de transferência do sistema e, em geral, desconhece a latência como uma necessidade. Mas há momentos em que a latência se torna importante e, quando isto ocorre, é fundamental que compreendamos a interação entre taxa de transferência e latência e o que exatamente significa “velocidade” para nós. Assim que começamos a avançar para o espaço corporativo, a latência passa a ser vista com mais frequência como uma preocupação, mas mesmo ali a taxa de transferência quase sempre reina suprema, a ponto de os conceitos de velocidade girarem quase universalmente em torno da taxa de transferência e os conceitos de latência serem frequentemente ignorados ou esquecidos.

Compreender o papel da latência em um sistema pode ser complicado, ainda que a latência em si seja relativamente simples de entender.

Uma ótima comparação entre latência e taxa de transferência que gosto de usar é a ideia de uma Ferrari e um caminhão com carreta. As Ferraris são “rápidas” no sentido tradicional; elas têm um alto número de “milhas por hora”. Poderíamos dizer que são projetadas para a velocidade. Mas será que são?

Geralmente consideramos os caminhões com carreta lentos. São feras grandes e pesadas, com uma baixa velocidade máxima. Mas transportam muita coisa de uma só vez.

Em termos de computação, normalmente pensamos em velocidade como capacidade de transporte – pensamos em termos de “itens” por segundo. No caso de uma Ferrari, ir a duzentas milhas por hora é ótimo, mas ela talvez consiga transportar uma caixa de cada vez. Um caminhão com carreta só consegue ir a cem milhas por hora, mas pode transportar perto de mil caixas de uma vez. Quando falamos sobre taxa de transferência ou velocidade em um computador, é mais nisto que pensamos. Em termos de rede, pensamos em gigabytes por segundo e raramente nos preocupamos com a velocidade de um pacote individual, já que um único pacote raramente é importante. Em termos computacionais, pensamos em ideias como operações de ponto flutuante por segundo, um conceito semelhante. Ninguém realmente se importa com quanto tempo leva um único FLOP (operação de ponto flutuante), apenas com quantos conseguimos realizar em um ou dez segundos.

Assim, ao olhar para uma Ferrari, poderíamos dizer que ela tem uma velocidade útil de duzentas caixas-milha por hora. Isto significa que, para cada hora de operação, uma Ferrari consegue mover uma caixa por até duzentas milhas. Um caminhão com carreta tem uma velocidade útil de cem mil caixas-milha por hora. Em termos de movimentação de encomendas, a taxa de transferência do caminhão com carreta é facilmente quinhentas vezes “mais rápida” do que a da Ferrari.

Portanto, em termos da forma como normalmente pensamos sobre computadores e redes, um caminhão com carreta seria “rápido” e uma Ferrari seria “lenta”.

Mas também há a latência a considerar. Supondo que nossa carga útil seja minúscula, digamos uma carta ou uma caixa pequena, uma Ferrari consegue mover essa única caixa por mais de mil milhas em apenas cinco horas! Um caminhão com carreta levaria dez horas para fazer essa mesma viagem (mas poderia ter MUITAS cartas chegando todas de uma só vez). Se o que precisamos é levar uma mensagem ou uma pequena encomenda de um lugar para outro muito rapidamente, a Ferrari é a melhor escolha porque tem metade da latência (atraso), desde o momento em que iniciamos a entrega até a primeira encomenda ser entregue, em comparação com o caminhão com carreta.

Como você pode imaginar, na maioria dos casos os caminhões com carreta são muito mais práticos porque sua velocidade de entrega é muito maior. E, sendo assim, na verdade vemos caminhões grandes nas rodovias o tempo todo, e a taxa de ocorrência de Ferraris é muito baixa – mesmo que cada um custe aproximadamente o mesmo valor para comprar (de forma bem aproximada). Mas, em casos especiais, a Ferrari faz mais sentido. Só que não com muita frequência.

Este é um conceito de caráter geral e pode se aplicar a inúmeras aplicações. Aplica-se a sistemas de cache, memória, CPU, redes, kernels e escalonadores de sistemas operacionais, a carros e muito mais. Latência e taxa de transferência geralmente estão inversamente relacionadas – abrimos mão da latência para obter taxa de transferência. Para a maioria das operações, isto faz mais sentido. Mas, às vezes, faz mais sentido otimizar para a latência.

O armazenamento é, na verdade, um caso atípico na computação, em que quase todo o foco no desempenho de armazenamento gira em torno de IOPS, que é grosso modo uma medida indireta da latência, em vez da taxa de transferência, que é medida em “dados transferidos por segundo”. Raramente nos importamos com este segundo número, pois ele quase nunca é a fonte de gargalos de armazenamento. Mas esta é a exceção, não a regra.

Latência e taxa de transferência podem ter algumas interações surpreendentes no mundo da computação. Quando falamos sobre redes, por exemplo, normalmente medimos apenas a taxa de transferência (Gb/s), mas raramente nos importamos muito com a latência (normalmente medida em milissegundos). Tipicamente, isto se deve ao fato de que quase todos os sistemas de rede têm números de latência semelhantes e a maioria das aplicações é praticamente indiferente aos atrasos de latência. É apenas a aplicação rara, como VoIP em enlaces internacionais ou por satélite, que a latência afeta a pessoa comum, ou que às vezes pode surpreender as pessoas quando elas tentam algo incomum, como iSCSI em uma conexão WAN de longa distância, e de repente a latência aparece, surpreendendo-as como um problema imprevisto.

Um dos lugares onde a interação entre latência e taxa de transferência começa a se tornar chocante e interessante é quando passamos de redes de dados elétricas ou ópticas para redes físicas. Uma frase famosa no setor é:

Nunca subestime a largura de banda de uma perua cheia de fitas voando pela rodovia.

Esta é uma ótima demonstração de uma enorme largura de banda com uma latência muito alta. Percorrendo cinquenta milhas pela cidade, uma única perua ou SUV poderia transportar centenas de petabytes de dados, atingindo taxas de dados que a fibra de 10 GB/s não chegaria nem perto. Mas o tempo para o primeiro pacote de dados chegar é de cerca de uma hora. Frequentemente descartamos este tipo de rede porque presumimos que a latência deve estar limitada a menos de cerca de 500 ms. Mas nem sempre é esse o caso.

A Austrália recentemente foi notícia ao realizar um teste para ver se um pombo carregando um cartão SD poderia, em termos de taxa de transferência de rede, superar o ISP da região – e o pombo acabou sendo mais rápido do que o ISP!

Em termos de desempenho computacional, frequentemente ignoramos a latência a ponto de nem sequer estarmos cientes dela como um contexto no qual discutir desempenho. Mas, nos círculos de computação de baixa latência, ela é considerada com muito cuidado. A taxa de transferência do sistema é geralmente bastante reduzida (torna-se comum projetar sistemas para atingir apenas dez por cento de utilização de CPU, enquanto sistemas mais tradicionais visam algo próximo de noventa por cento), com conceitos como kernels de tempo real, afinidade de CPU, fixação de processadores, taxas de acerto de cache e medições reduzidas, todos usados para focar em obter a resposta mais imediata possível de um sistema, em vez de tentar extrair o maior processamento total de um sistema.

Lugares comuns onde a baixa latência, de uma perspectiva computacional, é desejada são em sistemas controladores críticos (como controladores de manufatura, onde mesmo um milissegundo de latência pode causar problemas no chão de fábrica) ou em sistemas de negociação financeira, onde alguns milissegundos de atraso podem fazer com que investimentos tenham mudado de preço ou que produtos já tenham sido vendidos e não estejam mais disponíveis. A velocidade, em termos de latência, é frequentemente o fator decisivo entre ganhar dinheiro ou perder dinheiro – até mesmo um único milissegundo pode ser fatal.

Tecnicamente, até mesmo os sistemas de processamento de áudio e vídeo precisam ser sensíveis à latência, mas a maioria dos sistemas de computação modernos tem tanta sobra de capacidade de processamento e a latência é geralmente baixa o suficiente que a maioria dos sistemas, mesmo PABXs VoIP e sistemas de conferência, consegue funcionar hoje precisando apenas muito raramente estar ciente das preocupações com latência do lado do processamento (até mesmo a latência de rede está se tornando cada vez menos comum como uma preocupação). O administrador ou engenheiro de sistemas comum poderia facilmente passar uma carreira inteira sem nunca precisar trabalhar em um sistema que seja sensível à latência ou para o qual não haja tanta sobra de capacidade disponível a ponto de ocultar qualquer sensibilidade à latência.

Definir velocidade, quer isso signifique taxa de transferência, latência ou ainda outra coisa ou alguma combinação das duas, é algo muito importante em todos os aspectos da TI e na vida. Compreender como elas nos afetam em diferentes situações e como reagem uma à outra, geralmente existindo em uma relação indireta em que melhorias na taxa de transferência vêm a um custo para a latência, ou vice-versa, e aprender a equilibrá-las conforme necessário para melhorar os sistemas em que trabalhamos é muito valioso.

Marcadobandwidth iops latency performance speed

Mais para Ler.

Uma Grande Rede Plana

Por Que o QuickBooks Não Pode Ser Armazenado no Google Drive para Múltiplos Usuários

Os Riscos do Licenciamento