vx-underground, uma equipe de pesquisa que afirma ter a maior coleção de código-fonte de malware do mundo, postou recentemente na plataforma social X que a quantidade total de dados de malware que salva atualmente é de cerca de 30 TB (terabytes). Logo depois, Bernardo Quintero, fundador do serviço online de verificação de vírus multimecanismo VirusTotal, disse em resposta que o número total de amostras de malware enviadas ao VirusTotal pelos usuários ao longo dos anos atingiu aproximadamente 31 petabytes (petabytes). De acordo com conversões comumente utilizadas, um petabyte é aproximadamente igual a mil terabytes, o que significa que a escala de dados de ambos excedeu em muito a imaginação intuitiva dos usuários comuns.

Empresas de segurança cibernética, pesquisadores de inteligência artificial e agências de inteligência de ameaças geralmente consideram esse tipo de biblioteca de amostras de malware como dados básicos essenciais para treinar modelos de detecção, estudar o caminho de evolução das técnicas de ataque e analisar novas ameaças. No entanto, quando estes dados, muitas vezes medidos em terabytes e petabytes, são abstraídos em números, muitas vezes é difícil encontrar uma referência no mundo físico para o quão “grandes” eles são. Portanto, alguém levantou uma questão bastante gráfica: se todos esses dados são armazenados em um disco rígido tradicional e empilhados um por um, até que altura esses “bancos de malware” podem ser acumulados? Como ele se compara aos edifícios emblemáticos do mundo real?

Um repórter do TechCrunch tentou fazer essa pergunta a um chatbot de IA na redação, mas a resposta que obteve foi “tão ultrajante que era tão inacreditável” que ele teve que desistir. Assim, a equipe editorial mudou para o método mais direto - pegando papel e caneta e fazendo alguns “cálculos aproximados no verso de um guardanapo” com base no bom senso. Considerando que tanto o vx-underground quanto o VirusTotal descrevem seu volume de dados em termos de “aproximadamente TB/PB”, o repórter também seguiu essa abordagem “aproximada”.

Para facilitar aos leitores a formação de um conceito intuitivo, o repórter assume que é usado um disco rígido mecânico de desktop padrão de 1 TB e 3,5 polegadas - esse tipo de disco rígido tem basicamente o mesmo tamanho físico para caber em um chassi geral, com uma altura de cerca de 1 polegada (cerca de 2,54 cm). Sob esta premissa, basta prestar atenção à dimensão da “altura” para simular o efeito de “levantar o disco rígido um por um”. O artigo também ignora a diferença entre a capacidade nominal e a capacidade disponível do disco rígido em uso real e calcula-a diretamente com base no 1 TB nominal para simplificar a dedução.

De acordo com os resultados de uma ferramenta de conversão de unidades de armazenamento online, o vx-underground reivindica cerca de 30 TB de dados de malware, o que equivale aproximadamente à capacidade de 30 discos rígidos de 1 TB. Se esses 30 discos rígidos fossem empilhados de baixo para cima, eles teriam cerca de 30 polegadas de altura, ou cerca de 2,5 pés (menos de 1 metro). O autor do artigo usou sua própria altura como comparação. Comparada com sua altura de 1,83 metros (6 pés), essa pilha de discos rígidos se parece mais com uma pequena caixa empilhada a seus pés.

Quando a perspectiva se volta para o VirusTotal, nessa comparação ocorre imediatamente um “salto de magnitude”. Convertendo o volume total de 31 PB, são necessários aproximadamente 31.744 discos rígidos de 1 TB para acomodá-lo totalmente. Se for utilizado o mesmo método de “empilhamento vertical”, a altura teórica desta “torre de dados” composta por discos rígidos atingirá aproximadamente 2.645 pés (aproximadamente 806 metros). Na lista mundial de edifícios superaltos, essa altura já se aproxima da do Burj Khalifa, o edifício mais alto do mundo em Dubai, que tem aproximadamente 2.722 pés (aproximadamente 829 metros).

Em outras palavras, se a amostra de malware do VirusTotal for vista como uma coluna feita inteiramente de discos rígidos, sua altura é apenas menos de 25 metros menor que a do Burj Khalifa, o que é suficiente para rivalizar com o horizonte desta “cidade vertical”. O repórter também escolheu outra referência icônica – a Torre Eiffel, em Paris, que tem aproximadamente 330 metros de altura. De acordo com uma estimativa aproximada neste artigo, a quantidade de amostras de malware atualmente acumuladas pelo VirusTotal é aproximadamente equivalente a uma pilha de discos rígidos tão alta quanto “duas Torres Eiffel e meia”.

O TechCrunch distribuiu um diagrama esquemático de visualização de informações no relatório, organizando vários objetos de referência horizontalmente, de alto a baixo, de acordo com a altura. Da esquerda para a direita: o Burj Khalifa, com aproximadamente 2.722 pés de altura; a "torre de dados" de discos rígidos VirusTotal com aproximadamente 2.645 pés de altura; o One World Trade Center, com aproximadamente 1.792 pés de altura; a Torre Eiffel de aproximadamente 1.083 pés de altura; o próprio repórter de 1,80 metro de altura; e uma pequena pilha de discos rígidos, com apenas 2,5 pés de altura, representando os 30 terabytes de dados do vx-underground. Através deste arranjo, os leitores podem sentir claramente a enorme lacuna no tamanho dos dados entre os diferentes “bancos de malware”.

O relatório finalmente apontou que essas bibliotecas de amostras de malware incrivelmente grandes não são apenas “necessárias” para pesquisas de segurança, mas também retratam de forma invisível a enorme sombra da situação atual de ameaça à rede. Quando as empresas de segurança e os investigadores pesquisam, rotulam e modelam estas pilhas de dados, estão na realidade a competir contra “torres invisíveis” para descobrir as pistas da próxima onda de ataques o mais cedo possível.