O mecanismo de detecção de spam por IA do Gmail conclui sua maior atualização de defesa em anos RETVec é introduzido para identificar caracteres especiais

Uma postagem recente no Blog de segurança do Google detalha novas atualizações nos filtros de spam do Gmail, que o Google chama de “uma das maiores atualizações de defesa dos últimos anos”. A atualização vem na forma de um novo sistema de classificação de texto chamado RETVec (Resilient Efficient Text Vectorizer). O Google diz que isso ajuda a entender a “manipulação de texto adversária” – e-mails cheios de caracteres especiais, emojis, erros de digitação e outros caracteres inúteis que antes eram legíveis para humanos, mas não eram facilmente compreendidos por máquinas. Anteriormente, o spam cheio de caracteres especiais escapava facilmente das defesas do Gmail.

Se você quiser ter uma ideia de como é o “processamento de texto adversário”, aqui está o que está na minha pasta de spam:

Minha experiência pessoal é que no primeiro semestre do ano esses e-mails costumavam ser um grande problema e eu os via na minha caixa de entrada com bastante frequência. No entanto, esta atualização da tecnologia RETVec parece ter feito a diferença, já que não encontrei nenhum desses e-mails nos últimos meses.

E-mails como esse são difíceis de classificar porque qualquer filtro de spam provavelmente interceptará um e-mail que diz "Parabéns! O saldo vencedor da sua conta é de US$ 1.000", mas esse não é o conteúdo real do e-mail. A maioria das letras aqui são "homófonas" - ao mergulhar nas profundezas infinitas do padrão Unicode, você pode encontrar caracteres obscuros que parecem fazer parte do alfabeto latino regular, mas não são.

Por exemplo, o tópico "Check_Your_Account" é estranhamente em negrito, não porque tenha um estilo em negrito, mas porque usa um glifo Unicode como "Math Bold Capital C". É um símbolo matemático que parece com a letra “C” para os humanos, mas os bots de filtragem de spam o veem exatamente como um símbolo matemático e não entendem seu significado em inglês. Quanto mais você olha para um e-mail como este, pior fica: o caractere “O” em “PARABÉNS” é substituído por 0, a letra sublinhada em “Jackpot” é tão estranha que nem pode ser encontrada em uma pesquisa Unicode, e muitos espaços são substituídos por pontos ou sublinhados. Como resultado, os filtros de spam desistem quando veem esses e-mails confusos.

O Google diz que o RETVec está aqui para nos salvar: "RETVec é treinado para resistir a operações em nível de caractere, incluindo inserções, exclusões, erros de digitação, homófonos, substituições LEET e muito mais. Os modelos RETVec são treinados em um novo codificador de caracteres que codifica com eficiência todos os caracteres e palavras UTF-8. Como resultado, o RETVec não requer tabelas de pesquisa ou vocabulários fixos e é executado em mais de 100 idiomas. "

A eficiência é muito importante. Outros métodos que usam "vocabulário fixo" ou "tabelas de pesquisa" homófonas consomem muitos recursos em tempo de execução. Imagine se um ou mais caracteres de “parabéns” fossem substituídos por números, símbolos matemáticos, letras cirílicas, hebraico ou emoticons, então todas as grafias e erros ortográficos possíveis apareceriam em uma lista quase infinita. O Google diz que o RETVec tem apenas 200 mil parâmetros, “não milhões”, portanto, embora a nuvem de filtragem de spam do Google possa ser grande o suficiente para executar qualquer coisa, ela é pequena o suficiente para ser executada até mesmo em um dispositivo local. RETVec é de código aberto e o Google espera libertar o mundo desse tipo de ataque homófono em diferentes codificações.

RETVec parece funcionar de maneira muito semelhante à forma como os humanos leem: é um modelo TensorFlow de aprendizado de máquina que usa “semelhança” visual para identificar o significado das palavras, em vez do conteúdo real dos caracteres das palavras. A demonstração de “semelhança” do Google usou a mesma tecnologia para identificar fotos de gatos, portanto, transformá-la no sistema de reconhecimento óptico de caracteres mais avançado do mundo parece viável.

Claramente, essa abordagem levou a grandes melhorias, com o Google afirmando que “a substituição do vetorizador de texto anterior no classificador de spam do Gmail pelo RETVec melhorou nossa taxa de detecção de spam em 38% em relação à linha de base e reduziu os falsos positivos em 19,4%.

O Google disse que “tem testado o RETVec internamente no ano passado e o implementou em sua conta do Gmail”.