生成式人工智能不仅改变了我们的工作方式,也改变了攻击者的行动方式、数据的流动方式以及安全团队需要防御的威胁。这项提升员工效率的技术同时也创造了全新的攻击面,而我们过去依赖的工具根本无法应对这种局面。

传统的数据防泄漏 (DLP) 解决方案是围绕可预测的结构化数据设计的,例如信用卡号、社保号码和易于正则表达式匹配的模式。但如今的敏感信息并非如此。它可能只是粘贴到 ChatGPT 中的策略文档,或是被放入 AI 编码助手的专有源代码。知识产权就这样悄无声息地从您的组织中流出,每次都通过一条提示悄无声息地泄露,而没有任何策略被触发。

安防行业需要一种新的方法。而且,这种方法越来越游走在风险的边缘。

为什么基于云的AI执法存在不足

人们很容易认为,解决之道在于将人工智能活动路由到基于云的LLM进行分析。但这会带来一系列新的问题,使得实时执法充其量是不切实际的,最坏的情况则是危险的。

  • 隐私性敏感数据必须离开设备才能进行分析,这意味着您是通过……将数据发送到其他地方来解决数据泄露问题的。
  • 延迟往返云端的延迟会削弱实时执法——等到做出决定时,行动已经发生了。
  • 正常运行时间和可靠性对网络连接的依赖恰恰会在你最无法承受的时候造成安全漏洞。
  • Cost企业级规模下,将所有用户交互都通过集中式云处理来运行,成本很快就会变得非常高昂。

结论很明确:如果您想要私密、快速、始终在线且经济高效的 AI 安全保障,则分析需要在用户操作的瞬间,在设备上的浏览器中本地进行。

只有本地服务级别经理才能做什么

这就是设备端小型语言模型 (SLM) 改变一切的地方。SLM 不仅仅是云端 LLM 的轻量级版本;它们解锁了其他任何方式都无法实现的功能。 

具体来说,人工智能安全最重要的四个关键能力是:

  1. 真实数据分类
    传统数据防泄漏 (DLP) 工具使用规则、关键字和正则表达式模式对数据进行分类。这种方法适用于结构化数据,例如个人身份信息 (PII)。但贵公司最有价值的信息,例如战略规划、产品路线图、未发布的研究成果和专有流程,并不符合任何既定模式。仅仅依靠正则表达式是无法捕获到这些信息的。本地安全语言管理系统 (SLM) 能够理解上下文和含义。即使文本中没有任何受监管的关键词,它也能识别出这是敏感的商业知识产权。这在人工智能助手时代尤为重要,因为尽管传统语言管理系统 (LLM) 会设置安全措施来阻止显示信用卡号码,但一般的商业信息却会毫无阻碍地直接流入训练数据集。
  1. 了解用户意图
    检测策略违规不仅仅在于共享了哪些数据,更重要的是…… 为什么用户是在无意中请求人工智能工具帮忙撰写邮件,还是在系统性地探查信息以获取竞争情报?如果不维护整个会话期间的上下文信息链,几乎不可能评估用户的意图。而本地安全生命周期管理(SLM)系统,在浏览器中持续运行,正是为此而设计的。
  2. 检测人工智能原生攻击
    即时注入、越狱、操纵防护栏、逃逸沙箱——这些都是网络攻击的新前沿,它们专门针对人工智能系统而设计。检测这些攻击需要一种能够理解人工智能系统如何被操纵的人工智能。本地安全生命周期管理(SLM)实时监控交互,可以在攻击发生时识别这些攻击模式,而不是事后才发现。
  3. 监测LLM输出
    有时,威胁并非来自用户,而是来自人工智能本身。产生虚假信息的幻觉、有害的输出、不道德的回应,或是无意中泄露的模型训练集中的数据,这些都是真实存在的风险。本地安全级别监控 (SLM) 提供了第二层智能,监控人工智能的回应,并在异常情况到达用户之前将其标记出来。这相当于人工智能监控人工智能,而这种监控只能在运行时在线进行。这四个方面的关键在于:所有分析都在终端端完成。数据不会离开设备。没有加密开销。不会​​泄露隐私。无需等待。

SLM(静态线性调制器)很有用,但有些比其他的更快。

LayerX 是领先的 AI 使用控制解决方案,致力于保护浏览器中用户和智能体 AI 的交互安全。我们一直致力于构建基于本地安全级别模型 (SLM) 的强制执行架构,以实现真正的 AI 安全——私密、实时且始终可用。

但我们也意识到一个现实问题:并非所有硬件都能胜任这项工作负载。在本地运行功能强大的SLM需要强大的设备端AI处理能力,而这正是我们与英特尔合作的关键所在。

英特尔® 酷睿™ Ultra 3 的 WebGPU 框架可提供运行基于 SLM 的安全任务所需的 NPU(神经处理单元)性能,且不会影响用户体验。为了具体展示这一点,我们针对三个实际安全用例——数据汇总、数据分类和网络钓鱼检测——进行了基准测试对比,将英特尔的性能与替代芯片和云端方案进行了比较。

英特尔全球人工智能PC开发者关系高级总监兼总经理罗丹尼斯表示:“英特尔正与LayerX合作,推进AI PC安全功能,为现代AI驱动型员工带来更高水平的可见性和执行力。借助英特尔的WebGPU框架,英特尔® 酷睿™ Ultra 3的响应速度比AMD Ryzen AI快2倍——随着企业浏览器越来越多地检查所有用户和代理交互,这一优势变得至关重要。”

结果生动地展现了零延迟、设备端安全推理在实践中的样子:实时决策、无需云端往返、更低的运营成本以及完全的数据主权。

比较 LayerX 在以下方面的性能: 英特尔® 酷睿™ Ultra X7 358H 与其他领先处理器的对比显示出了决定性的结果:

对比 功能验证
AMD Ryzen AI 9 365 搭配 Radeon 880M 显卡 免费长达 性能提升 2 倍 使用 Layer X 在 Intel® Core™ Ultra X7 358H 与配备 Radeon 880M 的 AMD Ryzen AI 9 365 的 3 项不同性能测试中进行了比较 *
英特尔酷睿超 258V 免费长达 性能提升 1.4 倍 使用 Layer X 对 Intel® Core™ Ultra X7 358H 和 Intel Core Ultra 258V 进行了 3 项不同的性能测试 *
苹果M5 免费长达 性能提升 1.3 倍 使用 Layer X 对 Intel® Core™ Ultra X7 358H 和 Apple M5 进行了 3 项不同的性能测试 *

* 根据使用 Chrome 浏览器的 Layer X 提示工作负载进行测量。参见 www.intel.com/PerformanceIndex 因工作负载和配置而异。结果可能有所不同。

 

比较性能 英特尔® 酷睿™ Ultra X7 358H 与其他主流处理器的对比(数值越高越好):


LayerX 和英特尔:与人工智能同步的安全保障

在人工智能安全领域取得成功的组织并非那些阻碍人工智能发展的组织,而是那些找到了以人工智能运行速度对其进行智能治理的组织。这意味着将安全管理转移到边缘,使用足够智能的模型来理解上下文和意图,并且所有这一切都必须在不损害用户隐私或运营性能的前提下完成。

LayerX 与英特尔的合作是迈向这一未来的具体一步。运行在高性能硬件上的本地安全级别管理器 (SLM) 不仅仅是一项技术创新——它们是使下一代安全技术真正发挥作用的架构。

 

根据使用 Chrome 浏览器的 Layer X 提示工作负载进行测量。参见 www.intel.com/PerformanceIndex 因工作负载和配置而异。结果可能有所不同。