Illustration of a large brain with gears next to it, a hand with a chipped payment card connects to the brain; demonstrating how machine learning latency works

A latência é um fator crítico no desempenho de sistemas de machine learning em instituições financeiras. No entanto, muitas vezes é mal compreendida ou mal representada. Este artigo tem como objetivo esclarecer o que é latência, como ela afeta suas operações de fraude e o que você precisa observar ao avaliar as alegações de latência de provedores de serviços.

O que é Latência?

Latência refere-se ao tempo de espera entre uma solicitação e sua resposta correspondente dentro de um sistema. No contexto de transações financeiras, a latência de um determinado sistema representa o tempo que leva para uma transação ser processada por esse sistema, ou seja, desde o início do processamento da transação até o seu término nesse sistema. Compreender a latência é crucial porque impacta diretamente a velocidade e eficiência de suas operações.

Tipos de Métricas de Latência

Existem duas métricas principais usadas para medir a latência: latência média e latência percentil.

  • Latência Média: É o tempo médio levado para processar todas as solicitações em um período determinado. Geralmente é baixo e pode ser enganoso. Por exemplo, uma latência média de 20 milissegundos (ms) pode parecer impressionante, mas não conta toda a história.
  • Latência Percentil: Mede a latência em percentis específicos, como 95% ou 99%. Representa o tempo dentro do qual uma certa porcentagem de transações é processada. Por exemplo, uma latência de 99% de 500 ms significa que 99% das transações são processadas em 500 ms ou menos, enquanto 1% das transações levam mais de 500 ms para serem processadas. Usar um percentil mais baixo destaca que mesmo pequenas porcentagens podem representar um número significativo de transações em sistemas de alto volume.

Por Que a Latência Percentil Importa

A latência percentil oferece uma imagem mais precisa do desempenho do sistema, especialmente naqueles momentos raros, mas críticos, em que as transações demoram mais do que o habitual. Algumas transações lentas podem afetar significativamente o desempenho geral do sistema, como ilustrado abaixo:

Imagine um sistema processando 1.000 transações por segundo em paralelo, lidando com 100 milhões de transações. Se 99% dessas transações são processadas em até 20 ms, mas durante um breve período de 50 segundos, 50.000 transações levam 500 ms devido a uma desaceleração temporária, a latência média ainda pode parecer baixa (cerca de 20,2 ms).

No entanto, a latência de 99% agora refletiria 500 ms. Isso demonstra que, embora a latência média possa parecer boa, uma pequena porcentagem de transações pode experimentar um desempenho significativamente pior. Em sistemas que lidam com milhões de transações, mesmo 1% representa um grande número de transações afetadas. Por essa razão, é relevante para tais sistemas reportar percentis de latência como 99,9% ou superiores – por exemplo, 99,99%.

Como Avaliar Alegações de Latência

Quando provedores de serviços alegam baixa latência, é essencial aprofundar:

  • É Latência Média ou Percentil? Figuras de latência média são mais fáceis de alcançar e, por isso, podem ser enganosas. Sempre peça a latência de 99,9% ou métricas de percentil semelhantes para entender o desempenho real.
  • Inclui Latência de Rede? Algumas medições de latência focam apenas na latência do servidor, ignorando fatores externos como saltos de rede—pontos onde os dados passam por dispositivos como roteadores ou switches ao longo da rede. Isso é especialmente importante em sistemas distribuídos ou em nuvem, onde os dados podem passar por vários saltos, cada um contibuindo com um potencial atraso. Mais importante ainda, os sistemas não podem medir de forma confiável sua própria latência. Quando um sistema experimenta uma desaceleração ou paralisação, as medições internas podem falhar em capturá-la com precisão. Medições externas de latência são essenciais para obter uma visão completa, pois consideram esses saltos de rede e o desempenho geral de todos os componentes.
  • Servidor Local vs. em Nuvem: Verifique se o servidor que processa as transações é local ou está na nuvem, o que pode impactar a latência.

Principais Considerações

Compreender e interpretar corretamente as métricas de latência é vital. Sempre priorize a latência percentil sobre a latência média e certifique-se de que todos os componentes do processo de transação, incluindo a latência de rede, sejam considerados nas métricas. Ao fazer isso, você pode avaliar melhor o desempenho de seus sistemas e tomar decisões fundamentadas ao selecionar provedores de serviços.

  • Latência Média: Fácil de alcançar, mas pode ser enganosa.
  • Latência Percentil: Fornece uma representação mais precisa do desempenho do sistema.
  • Latência de Rede: Deve ser incluída para uma visão completa.
  • Localização do Servidor: Impacta a latência e deve ser considerada.

Compreender essas nuances ajudará a garantir que seus sistemas sejam robustos e capazes de processar transações de forma eficiente, mesmo durante horários de pico ou desacelerações inesperadas.