A IA generativa não só mudou a forma como trabalhamos, mas também como os atacantes operam, como os dados se movem e contra o que as equipes de segurança precisam se defender. A mesma tecnologia que torna os funcionários mais produtivos está criando superfícies de ataque totalmente novas, e as ferramentas que usávamos simplesmente não foram feitas para esse mundo.

As soluções tradicionais de DLP (Prevenção contra Perda de Dados) foram projetadas em torno de dados previsíveis e estruturados, como números de cartão de crédito, números de Seguro Social e padrões compatíveis com expressões regulares. Mas as informações confidenciais de hoje não são assim. Trata-se de um documento de estratégia inserido no ChatGPT. Seu código-fonte proprietário inserido em um assistente de codificação com IA. É propriedade intelectual vazando da sua organização, um prompt por vez, silenciosamente, sem que nenhuma política de segurança seja acionada.

O setor de segurança precisa de uma nova abordagem. E, cada vez mais, essa abordagem reside na periferia da rede.

Por que a aplicação de IA baseada em nuvem fica aquém do esperado

É tentador pensar que a solução seja simplesmente encaminhar a atividade da IA ​​por meio de um LLM baseado em nuvem para análise. Mas isso cria uma nova série de problemas que tornam a aplicação de medidas em tempo real impraticável na melhor das hipóteses e perigosa na pior.

  • Política de PrivaciadeOs dados sensíveis precisam sair do dispositivo para serem analisados, o que significa que você está resolvendo um problema de vazamento de dados... enviando os dados para outro lugar.
  • LatênciaAtrasos na comunicação de ida e volta com um endpoint na nuvem comprometem a aplicação de políticas em tempo real — quando uma decisão é tomada, a ação já ocorreu.
  • Tempo de atividade e confiabilidadeA dependência da conectividade de rede cria brechas de segurança justamente quando você menos pode se dar ao luxo de perdê-las.
  • CustoExecutar cada interação do usuário por meio de processamento centralizado em nuvem, em escala empresarial, torna-se caro rapidamente.

A conclusão é clara: se você deseja segurança baseada em IA que seja privada, rápida, sempre ativa e com um bom custo-benefício, a análise precisa ocorrer localmente, no dispositivo, no navegador, no momento da ação do usuário.

O que só um gestor de recursos local pode fazer

É aqui que os Modelos de Linguagem Pequenos (SLMs) executados no dispositivo mudam tudo. Os SLMs não são apenas uma versão mais leve dos Modelos de Linguagem de Longo Prazo (LLMs) na nuvem; eles desbloqueiam recursos que simplesmente não podem ser alcançados de nenhuma outra forma. 

Especificamente, existem quatro capacidades principais que são mais importantes para a segurança da IA.

  1. Classificação de dados verdadeiros
    As ferramentas DLP legadas classificam dados usando regras, palavras-chave e expressões regulares. Isso funciona para dados estruturados, como informações pessoais identificáveis ​​(PII). Mas as informações mais valiosas da sua empresa, como planos estratégicos, roteiros de produtos, pesquisas ainda não publicadas e processos proprietários, não se encaixam em um padrão. Simplesmente não é possível detectá-las apenas com expressões regulares.Um SLM local entende o contexto e o significado. Ele consegue reconhecer que um bloco de texto contém propriedade intelectual comercial sensível, mesmo sem uma única palavra-chave regulamentada à vista. Isso é especialmente crítico na era dos assistentes de IA, porque, embora os LLMs tenham restrições quanto à exibição de números de cartão de crédito, informações comerciais gerais fluem diretamente para os conjuntos de dados de treinamento sem qualquer atrito.
  1. Compreendendo a intenção do usuário
    Detectar uma violação de política não se resume apenas a quais dados estão sendo compartilhados. Trata-se, na verdade, de... porqueSerá que um usuário está inocentemente pedindo ajuda a uma ferramenta de IA para redigir um e-mail, ou está sondando-a sistematicamente para extrair informações estratégicas da concorrência? A intenção é praticamente impossível de avaliar sem manter um histórico de contexto ao longo de toda a sessão. Um SLM local, executado continuamente no navegador, faz exatamente isso.
  2. Detecção de ataques nativos de IA
    Injeção imediata, desbloqueio de sistemas (jailbreaking), manipulação de mecanismos de segurança (guardrails), escapes de sandbox — essas são as novas fronteiras dos ciberataques, e são projetadas especificamente para explorar sistemas de IA. Detectá-las exige uma IA que entenda como os sistemas de IA podem ser manipulados. Um sistema de monitoramento local (SLM) que acompanha as interações em tempo real pode identificar esses padrões de ataque à medida que acontecem, e não depois que já ocorreram.
  3. Monitoramento da produção do LLM
    Às vezes, a ameaça não é o usuário, mas a própria IA. Alucinações que geram informações falsas, resultados tóxicos, respostas antiéticas ou dados obtidos inadvertidamente do conjunto de treinamento de um modelo são riscos reais. Um SLM local fornece uma segunda camada de inteligência que monitora as respostas da IA, sinalizando anomalias antes que elas cheguem ao usuário. É IA monitorando IA, o que só pode ser feito em tempo real, durante a execução.O ponto crucial que une todos os quatro aspectos: toda essa análise ocorre no dispositivo final. Nenhum dado sai do dispositivo. Sem sobrecarga de criptografia. Sem comprometimento da privacidade. Sem espera.

Os SLMs são úteis, mas alguns são mais rápidos que outros.

LayerX é a principal solução de controle de uso de IA para proteger as interações de usuários e agentes de IA no navegador. Estamos trabalhando para implementar a aplicação de SLM local como a arquitetura que torna possível a verdadeira segurança da IA ​​— privada, em tempo real e sempre disponível.

Mas também reconhecemos uma realidade prática: nem todo hardware está preparado para essa carga de trabalho. Executar um SLM (Sistema de Gerenciamento de Linguagem) eficiente localmente exige um poder de processamento de IA considerável no dispositivo, e é aí que nossa colaboração com a Intel se torna a peça-chave do quebra-cabeça.

Os frameworks WebGPU da Intel, como o Intel® Core™ Ultra 3, oferecem o desempenho da NPU (Unidade de Processamento Neural) necessário para executar tarefas de segurança baseadas em SLM sem impactar a experiência do usuário. Para demonstrar isso concretamente, apresentamos comparações de benchmarks em três casos de uso de segurança do mundo real — sumarização de dados, classificação de dados e detecção de phishing — medindo o desempenho em processadores Intel em comparação com chips alternativos e abordagens baseadas em nuvem.

“A Intel está trabalhando com a LayerX para aprimorar os recursos de segurança de PCs com IA, trazendo novos níveis de visibilidade e aplicação de políticas para a força de trabalho moderna, orientada por IA”, disse Dennis Luo, Diretor Sênior e Gerente Geral de Relações com Desenvolvedores de PCs com IA da Intel. “Com as estruturas WebGPU da Intel, o Intel® Core™ Ultra 3 oferece tempos de resposta até 2 vezes mais rápidos em comparação com o AMD Ryzen AI – uma vantagem que se torna crucial à medida que os navegadores corporativos inspecionam cada vez mais todas as interações de usuários e agentes.”

Os resultados contam uma história convincente sobre como a inferência de segurança em dispositivos com latência zero se apresenta na prática: decisões em tempo real, sem requisições à nuvem, menor custo operacional e total soberania dos dados.

Comparando o desempenho do LayerX em relação a O Intel® Core™ Ultra X7 358H, comparado a outros processadores líderes de mercado, apresenta resultados decisivos:

Comparação Consistentes
AMD Ryzen AI 9 365 com Radeon 880M Até Desempenho 2x mais rápido com Layer X em 3 testes de desempenho diferentes no Intel® Core™ Ultra X7 358H vs AMD Ryzen AI 9 365 com Radeon 880M *
Intel CoreUltra 258V Até Desempenho 1.4x mais rápido com Layer X em 3 testes de desempenho diferentes no Intel® Core™ Ultra X7 358H vs Intel Core Ultra 258V *
Maçã M5 Até Desempenho 1.3x mais rápido com Layer X em 3 testes de desempenho diferentes no Intel® Core™ Ultra X7 358H vs Apple M5 *

* Conforme medido pelas cargas de trabalho de prompts da Camada X usando o navegador Chrome. Veja www.intel.com/PerformanceIndex para cargas de trabalho e configurações. Os resultados podem variar.

 

Comparando o desempenho de Intel® Core™ Ultra X7 358H vs. outros processadores líderes (quanto maior, melhor):


LayerX e Intel: Segurança que acompanha a IA

As organizações que estão obtendo sucesso na segurança da IA ​​não são aquelas que a bloqueiam, mas sim aquelas que descobriram como governá-la de forma inteligente, na mesma velocidade em que ela opera. Isso significa levar a aplicação das políticas para a borda da rede, usar modelos inteligentes o suficiente para entender o contexto e a intenção, e fazer tudo isso sem comprometer a privacidade do usuário ou o desempenho operacional.

A colaboração entre a LayerX e a Intel é um passo concreto rumo a esse futuro. Os SLMs locais executados em hardware compatível não são apenas uma curiosidade técnica — eles representam a arquitetura que torna a próxima geração de segurança realmente funcional.

 

Conforme medido pelas cargas de trabalho de prompts da Camada X usando o navegador Chrome. Veja www.intel.com/PerformanceIndex para diferentes cargas de trabalho e configurações. Os resultados podem variar.