Guia para o Data Lake da Cato

Este artigo discute os detalhes da taxa de geração de eventos e retenção de dados para o Data Lake da Cato e sua conta.

Visão Geral

O Data Lake da Cato contém os Dados registrados pelos diferentes Serviços na plataforma Cato, como Redes, Segurança, Acesso, e assim por diante. Dados como informações de Eventos são adicionados ao Data Lake em tempo real e retidos por um período específico, conforme definido pelo contrato do Cliente. A Cato usa unidades de Data Lake para definir a retenção de Dados do Cliente de acordo com:

  • Taxa de Eventos Horária (atualmente em unidades de 2,5 milhões de eventos por hora)

  • Tempo de Retenção (ou seja, 3 meses, 6 meses, etc.)

Os Dados que excedem os termos da unidade de Data Lake são Descartados. Por exemplo, se houver mais de 2,5 milhões de eventos dentro de uma Hora ou Dados com mais de 3 meses.

Como parte da plataforma Cato, as Contas recebem uma única unidade de Data Lake que inclui um limite de taxa de eventos de 2,5 milhões de eventos por Hora e um período de retenção de 3 meses. Os Clientes podem optar por comprar unidades adicionais de Data Lake para aumentar a taxa de eventos por Hora e/ou aumentar o tempo de retenção de eventos.

Os Clientes também podem usar diferentes Integrações para encaminhar seus Dados para Armazenamento na Nuvem externo e SIEMs sem custo adicional.

As informações neste artigo se aplicam às Contas da Cato a partir de 1º de janeiro de 2024(*).

Abordagem de Retenção de Eventos

Os Eventos são retidos em tempo real e podem ser acompanhados na Aplicação de Gerenciamento Cato (CMA) na página de Eventos (Inicial > Eventos).

  • A Cato retém um conjunto de núcleo de Eventos de segurança e conectividade chave para cada Cliente

  • Os Clientes podem selecionar, dentro de políticas, eventos adicionais para serem gerados e retidos

  • As Licenças do Cliente definem o limite de taxa Horária para o número máximo de eventos que são gerados e retidos

    • Os Eventos em excesso a este número são Descartados para o restante da Hora

Para mais informações sobre otimização de eventos gerados, consulte Melhores Práticas para Armazenamento e Ingestão de Logs de Eventos da Cato

Medição de Eventos Horários Gerados e Descartados

O Data Lake está sujeito a limitação de taxa com base no número de Eventos gerados por Hora.

O número de Eventos que foram gerados para sua Conta na última Hora é acompanhado por um contador.

  • No início de cada Hora, o contador é Reiniciado

  • Quando o número de Eventos atinge um limite definido para o Cliente, eventos adicionais são Descartados para o restante dessa Hora

    No entanto, a Cato continua a reter eventos do Sistema que estão relacionados aos Processos da Cato

  • A Cato geralmente permite espaço acima do limite, para reduzir a probabilidade de descarte

Limitação de Taxa de Eventos

Os detalhes para a limitação de taxa padrão da Cato para eventos são baseados nas unidades de Data Lake possuídas por uma Conta:

  • A Cato permite até uma unidade de Data Lake, sem custo (atualmente 2,5 milhões de eventos por Hora)

  • Se mais eventos forem gerados do que as unidades de Data Lake licenciadas, os eventos excedentes são Descartados para o restante da Hora

  • Para evitar o descarte de eventos, os Clientes têm a opção de comprar unidades adicionais de Data Lake

Recomendamos que você compre unidades adicionais de Data Lake para atender aos requisitos de Dados da sua organização, para mais informações, veja abaixo Estimando Requisitos de Eventos sem um Histórico de Eventos.

Retenção de Eventos

Para contratos e renovações a partir de 1º de janeiro de 2024, o período de retenção padrão para eventos é de 3 meses.

  • Após o período de retenção (ou seja, após 3 meses), os dados dos eventos são Descartados

  • Os Clientes podem comprar retenção de Dados adicional se desejarem reter os dados dos eventos por mais de três meses

Se um Cliente optar por pagar por retenção de Dados adicional, nenhuma concessão é feita para a retenção gratuita que é fornecida por padrão: toda a retenção de eventos é cobrável.

  • Para mais informações sobre a compra de retenção de Dados adicional, por favor, contate seu representante da Cato.

A Cato suporta as seguintes opções de armazenamento de eventos:

Unidades de Data Lake

Por padrão, cada Conta possui as seguintes unidades de Data Lake:

  • Taxa de Eventos Horária (atualmente em unidades de 2,5 milhões de eventos por Hora)

  • Tempo de retenção (por exemplo, 3 meses, 6 meses, etc..)

Você pode escolher comprar unidades adicionais de Data Lake para aumentar a taxa de eventos horária e/ou o tempo de retenção.

Aumentando o Limite da Taxa de Eventos

As unidades de Data Lake definem o número máximo de eventos que podem ser gerados por hora. Um período em que menos eventos são gerados por hora não terá influência no número que pode ser gerado em horas futuras.

Cada unidade de Data Lake é comprada para aumentar a limitação de taxa em 2,5 milhões de eventos por hora. Então, por exemplo:

  • Duas unidades de Data Lake permitem 2,5 milhões de eventos adicionais por hora (até 5 milhões de eventos por hora no total)

  • Três unidades permitirão 5 milhões de eventos adicionais por hora (até 7,5 milhões de eventos por hora no total)

Aumentando o Período de Retenção de Eventos

As unidades de Data Lake estão disponíveis em três variantes, de acordo com o período de retenção necessário:

  • Uma unidade de três meses

  • Uma unidade de seis meses

  • Uma unidade de doze meses

A variante escolhida se aplica a todos os dados unidades, não é possível misturar unidades.

Exemplos

A tabela abaixo ilustra o uso de unidades de Data Lake para cobrir os requisitos de armazenamento de eventos do cliente.

Número máximo de eventos gerados por hora

Período de retenção necessário

Unidades de Data Lake adicionais necessárias

Tipo de unidade de Data Lake necessário

Até 2,5 milhões

3 meses

0

N/D

Até 2,5 milhões

6 meses

1

unidade de 6 meses

Até 5 milhões

3 meses

1

unidade de 3 meses

Até 7,5 milhões

12 meses

2

unidade de 12 meses

Estimando Requisitos de Unidade de Data Lake com Base no Histórico de Eventos

Clientes com um histórico estável de geração de eventos podem inspecionar o gráfico de eventos no CMA para ver quantos eventos estão sendo gerados. Eles podem usar os picos neste gráfico para considerar seus requisitos de limitação de taxa de eventos.

No gráfico de exemplo abaixo, os picos atingem um máximo de pouco mais de 400.000 eventos por hora. Isso seria coberto pela unidade única de Data Lake gratuita.

Data_SKUs_Event_History_1.png

No gráfico de exemplo abaixo, o número de eventos por hora excede 2,5 milhões a cada hora, e o pico mais alto se aproxima de 3 milhões. Isso é mais do que pode ser coberto pela limitação de taxa de eventos padrão para 1 unidade de Data Lake. 1 unidade adicional cobriria esses requisitos de armazenamento, permitindo gerar até 5 milhões de eventos por hora.

Data_SKUs_Event_History_2.png

Note que a altura exata de cada barra pode ser inspecionada ao passar o cursor sobre a barra, como ilustrado no gráfico abaixo.

Data_SKUs_Event_History_2_hover.png

Outros pontos a serem observados:

  • Esses exemplos cobrem um pequeno período, por conveniência. Um período de análise mais longo seria prudente.

  • O período de tempo representado por cada barra mudará de acordo com o período de tempo coberto pelo gráfico. Preste atenção na Granularidade da Série Temporal ao alterar o período de tempo coberto.

Estimando Requisitos de Eventos sem um Histórico de Eventos

Esta seção ajuda você a criar uma estimativa inicial aproximada dos eventos de pico por hora para entender quantas unidades de Data Lake são necessárias. Recomendamos que você monitore continuamente as taxas de eventos reais e ajuste conforme necessário. Os eventos reais gerados por hora dependem de várias variáveis, como padrões de tráfego e configuração de registro de políticas. Para mais informações, veja Melhores Práticas para o Armazenamento e Ingestão de Logs de Eventos da Cato.

A geração de eventos está correlacionada tanto à largura de banda total em uso na rede quanto ao número de Usuários SDP suportados. Clientes sem um histórico de geração de eventos podem estimar seus requisitos prováveis de limitação de taxa de eventos somando a largura de banda total do site da conta e o número de Usuários SDP. Além disso, os serviços habilitados para a conta também podem impactar os requisitos de eventos. Por exemplo, se o Firewall LAN estiver habilitado, isso aumentará os requisitos de eventos proporcionalmente ao volume de tráfego LAN e ao tráfego que gera eventos.

São fornecidas tabelas abaixo para ajudar a estimar os eventos de pico gerados por hora. Siga este procedimento para calcular os requisitos a partir das tabelas:

  1. Encontre a linha na tabela de Largura de Banda Total que corresponde à largura de banda licenciada de pico para a rede. Leia o estimado eventos de pico por hora que serão gerados

  2. Encontre a linha na tabela de Clientes SDP que corresponde ao número de Clientes SDP em uso. Leia o estimado eventos de pico por hora que serão gerados

  3. Adicione as somas das etapas 1 e 2.

  4. Divida o total de eventos por hora por 2,5 milhões e arredonde para cima, para estimar o número de unidades de Data Lake necessárias para a largura de banda do site e Clientes SDP.

  5. Se você estiver usando vários serviços Cato que geram um grande número de eventos, como CASB ou Firewall LAN, adicione 1 unidade de Data Lake.

Tabelas de Geração de Eventos

Use estas tabelas para estimar o número de pico de eventos por hora gerados para um cliente. Eles assumem que o cliente está registrando todos os eventos.

Largura de Banda Total

Eventos de pico estimados por hora

Clientes SDP

Eventos de pico estimados por hora

Até 2,5Gbps

1.000.000

Até 3K

1.000.000

2,5-6Gbps

5.000.000

3K-7K

5.000.000

6-9Gbps

7.500.000

7K-11K

7.500.000

9-12Gbps

10.000.000

11K-15K

10.000.000

12-15Gbps

12.500.000

15K-19K

12.500.000

15-18Gbps

15.000.000

19K-23K

15.000.000

18-21Gbps

17.500.000

23K-27K

17.500.000

21-24Gbps

20.000.000

27K-31K

20.000.000

24-27Gbps

22.500.000

31K-35K

22.500.000

27-30Gbps

25.000.000

35K-39K

25.000.000

30-33Gbps

27.500.000

39K-43K

27.500.000

Exemplo de Estimativa

Na tabela acima:

  • Um total de 3 Gbps de largura de banda em todos os sites geraria um estimado pico de cinco milhões de eventos por hora

  • A total of 5,000 SDP clients would generate an additional estimated peak of two and a half million events per hour

  • Portanto, o cliente poderia esperar um pico de 5+2,5= 7,5 milhões de eventos por hora (2 unidades)

  • O cliente usa o serviço CASB e RBI (1 unidade)

  • Isso poderia ser coberto comprando três unidades adicionais de Armazenamento Data Lake de duração apropriada.

Estimando a Retenção Real Necessária

A unidade de medida para unidades de Data Lake é o número de eventos gerados por hora. O volume de dados envolvidos não é usado no cálculo ou compra de unidades adicionais e não é relatado pelo CMA.

No entanto, os clientes podem desejar estimar as implicações se planejarem exportar dados para armazenamento externo ou um SIEM. Os clientes podem fazer uma estimativa aproximada do volume de dados envolvidos, assumindo que uma unidade de Data Lake (2,5 milhões de eventos por hora) é muito aproximadamente equivalente a 180 GB por mês de armazenamento de dados, como ilustrado na tabela abaixo.

Nota que esta é uma estimativa muito aproximada. As unidades de Data Lake definem o máximo número de eventos que podem ser gerados em uma hora. É auto-evidente que um cliente que compra unidades para lidar com grandes picos ocasionais na geração de eventos terá um requisito de armazenamento externo muito diferente de um cliente que compra o mesmo número de unidades para lidar com um número consistentemente alto de eventos gerados.

A tabela a seguir mostra uma estimativa muito aproximada do total de GB de acordo com o período de retenção:

Eventos por hora

Unidades de Data Lake

GB por mês (estimado)

3 meses

6 meses

12 meses

2,5 milhões

1

180

540

1080

2160

5 milhões

2

360

1080

2160

4320

7,5 milhões

3

540

2160

4320

8640

(*) Alguns contratos com a Cato podem incluir termos que diferem da informação neste artigo

Esse artigo foi útil?

Usuários que acharam isso útil: 2 de 2

0 comentário