作为现象级的开源 AI Agent 项目,OpenClaw 凭借强大的自主执行能力,正迅速成为能够操作文件、调用系统命令、控制浏览器的“数字员工”。同时,这种能力也带来了一系列的安全风险。例如本地敏感信息外发,执行破坏性高危操作或被远程控制,引发数据泄露、系统损毁、业务中断等严重问题。

针对这些问题,火山引擎重磅推出三层纵深安全防护方案,助力企业构建”安全可控“的数字员工。

  • 第一层:平台安全,通过访问控制、指令过滤、执行沙箱、技能准入扫描,确保默认安全。

  • 第二层:AI 助手安全(AI Assistant Security),防范提示词注入、高危操作、敏感信息泄露等导致的风险。

  • 第三层:供应链安全,提供 Skills 的深度安全检测,避免供应链攻击风险。

平台安全

打造“免疫级”底层环境

火山引擎为通过 ECS 和 Agentkit 部署的 OpenClaw 提供基础安全保障方案,从访问控制、指令过滤、执行环境、安全准入四个维度,构建相应的底层防御能力。

  • 入口层: 默认仅绑定本地端口,减少公网暴露面,强制 token/密码认证及网关鉴权,确保每次访问真实可靠。

  • 决策层:镜像预置提示词加固策略,自动识别并过滤恶意注入指令,防止 Agent 被“洗脑”或指令篡改。

  • 执行层:默认在 veFaaS 沙箱中运行,通过容器和网络双隔离机制及非 Root 权限运行,将风险锁定在沙箱内。

  • 生态层:对镜像和预置 Skills 进行深度扫描检查,持续追踪恶意 Skills 并推动修复。

AI助手安全(AI Assistant Security)

打造安全可控的“数字员工”

火山引擎全新发布 AI Assistant Security ,在 OpenClaw 等 AI 助手类智能体的交互环节(如调用大模型、Skills 及工具等),提供针对高危操作、敏感信息泄露、提示词注入等风险的防护和管控。

图片

// 三大典型场景,感受安全价值

个人隐私的脱敏和保护:识别身份证号、手机号等敏感信息,严控敏感数据出域,确保个人隐私不被泄露。

高危操作的拦截:在调用工具和技能前,识别如“资金转账、敏感数据外发、文件恶意删除”等高危操作,实现默认阻断或降级为人工确认,避免模糊指令带来不可逆的损失。

提示词攻击的防护:当 AI 数字员工联网访问到恶意网页,其中暗藏的恶意提示词导致 AI 数字员工被远程控制并带来不可控的后果,AI Assistant Security 会提前识别异常并给出安全提示,确保 AI 只执行用户的真实意图。

// 快速上手,限时免费试用

目前,火山引擎 AI Assistant Security for OpenClaw 的安全防护方案,面向所有用户开启限时免费试用。

👉 火山引擎客户:

  • 已购客户:已购买 OpenClaw ECS 的客户,在云服务器-运维编排-应用更新中点击创建任务,选择安全加固和需要加固的实例,下发任务即可完成防护。

  • 新购客户:火山引擎 ECS 标准镜像已自带该防护插件,初始化即拥有安全能力。

图片

图片

已购客户

新购客户

👉 非火山引擎客户:

通过简单的命令自动完成安装。

  1. 登入到您部署 OpenClaw 的服务器上执行下方命令,安装插件的命令行工具。

npm i -g @omni-shield/openclaw-cli

  1. 安装完成,执行下方命令启动配置流程。

omni-shield-openclaw

  1. 安装过程会自动检测环境并生成一个有时效性的登录 URL,通过浏览器访问 URL 跳转登录火山引擎账号,登录完成后,命令行工具自动检测登录状态,自动执行插件的安装和配置流程。

  1. 安装完成后,按 Y重启 OpenClaw 以使配置生效,或执行 openclaw gateway restart 重启正在运行的 OpenClaw 服务,重启后正式生效。

供应链安全:

让Skills安全调用

Skills 作为 OpenClaw 的“手”,通过封装特定能力供 OpenClaw 调用以完成复杂任务。然而,随着 Skills 的权限过大及恶意 Skills 的涌现,导致账户凭证外泄、执行木马病毒等安全事件频发。

针对此痛点,火山引擎智能体安全管理平台的扫描功能全面升级,支持对 MCP/Skills 的深度扫描。用户可以自行上传任意 Skills 文件,平台提供预置的扫描规则可对上传的 Skills 进行深度扫描,并输出详细的风险详情,实现了覆盖事前检测、定期巡检、事中拦截的全生命周期安全防护:

风险检测:依托平台预置扫描规则,对 OpenClaw 本地部署的 Skills 进行深度扫描

定期巡检:基于 OpenClaw 的 Cron 机制,支持定期对更新的 Skills 进行自动扫描

动态拦截:当 OpenClaw 的 Skills 被加载时,平台会判断其是否经过扫描。若未经过扫描,平台将即时发起检测,并根据风险评估情况决定是否继续执行

图片

预置扫描规则

图片

上传Skills文件

图片

Skills风险详情

<<< 向左滑动,查看更多

// 使用教程

目前,火山引擎智能体安全管理平台私有化版本已上线扫描方案,面向所有用户开启限时免费试用。同时,公有云版本将在2月底对外上线,届时欢迎大家体验。

在私有化版本中,对接 OpenClaw 和智能体安全管理平台对 Skills 进行安全扫描,具体操作步骤如下:

  • 下载智能体安全管理平台的 Skills 扫描安装包;<Skills-Security-Scanner>:https://bytedance.larkoffice.com/file/Rbm0bNBViowSNqxB0Ltc9qBAnNe

  • 将上方压缩包解压至 OpenClaw 目录下 ~/.openclaw/workspace/skills/;

  • 通过 OpenClaw 的对话 Agent 查询 Skills 列表,查看上方 Skills 是否已经被加载;

  • 通过 OpenClaw 提示词用 Skills-Security-Scanner 对1password(OpenClaw平台自带的Skills)进行扫描;

  • 通过 OpenClaw 的控制台展现扫描结果,识别潜在威胁。

安全是 AI 真正成为生产力的底线。火山引擎通过三层纵深安全防护方案,助力开发者在享受 AI 效率的同时,无需担心隐私外泄与操作风险。现在,上火山引擎一键安全防护,让你的 AI 助手安全上岗。

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐