让OpenClaw安全上岗，火山引擎发布业界首个AI助手安全方案

提示词攻击的防护：当 AI 数字员工联网访问到恶意网页，其中暗藏的恶意提示词导致 AI 数字员工被远程控制并带来不可控的后果，AI Assistant Security 会提前识别异常并给出安全提示，确保 AI 只执行用户的真实意图。火山引擎全新发布 AI Assistant Security ，在 OpenClaw 等 AI 助手类智能体的交互环节（如调用大模型、Skills 及工具等），提供针

火山引擎开发者社区

95人浏览 · 2026-02-13 20:23:23

火山引擎开发者社区 · 2026-02-13 20:23:23 发布

作为现象级的开源 AI Agent 项目，OpenClaw 凭借强大的自主执行能力，正迅速成为能够操作文件、调用系统命令、控制浏览器的“数字员工”。同时，这种能力也带来了一系列的安全风险。例如本地敏感信息外发，执行破坏性高危操作或被远程控制，引发数据泄露、系统损毁、业务中断等严重问题。

针对这些问题，火山引擎重磅推出三层纵深安全防护方案，助力企业构建”安全可控“的数字员工。

第一层：平台安全，通过访问控制、指令过滤、执行沙箱、技能准入扫描，确保默认安全。
第二层：AI 助手安全（AI Assistant Security），防范提示词注入、高危操作、敏感信息泄露等导致的风险。
第三层：供应链安全，提供 Skills 的深度安全检测，避免供应链攻击风险。

平台安全

打造“免疫级”底层环境

火山引擎为通过 ECS 和 Agentkit 部署的 OpenClaw 提供基础安全保障方案，从访问控制、指令过滤、执行环境、安全准入四个维度，构建相应的底层防御能力。

入口层：默认仅绑定本地端口，减少公网暴露面，强制 token/密码认证及网关鉴权，确保每次访问真实可靠。
决策层：镜像预置提示词加固策略，自动识别并过滤恶意注入指令，防止 Agent 被“洗脑”或指令篡改。
执行层：默认在 veFaaS 沙箱中运行，通过容器和网络双隔离机制及非 Root 权限运行，将风险锁定在沙箱内。
生态层：对镜像和预置 Skills 进行深度扫描检查，持续追踪恶意 Skills 并推动修复。

AI助手安全（AI Assistant Security）

打造安全可控的“数字员工”

火山引擎全新发布 AI Assistant Security ，在 OpenClaw 等 AI 助手类智能体的交互环节（如调用大模型、Skills 及工具等），提供针对高危操作、敏感信息泄露、提示词注入等风险的防护和管控。

// 三大典型场景，感受安全价值

个人隐私的脱敏和保护：识别身份证号、手机号等敏感信息，严控敏感数据出域，确保个人隐私不被泄露。

高危操作的拦截：在调用工具和技能前，识别如“资金转账、敏感数据外发、文件恶意删除”等高危操作，实现默认阻断或降级为人工确认，避免模糊指令带来不可逆的损失。

提示词攻击的防护：当 AI 数字员工联网访问到恶意网页，其中暗藏的恶意提示词导致 AI 数字员工被远程控制并带来不可控的后果，AI Assistant Security 会提前识别异常并给出安全提示，确保 AI 只执行用户的真实意图。

// 快速上手，限时免费试用

目前，火山引擎 AI Assistant Security for OpenClaw 的安全防护方案，面向所有用户开启限时免费试用。

👉 火山引擎客户：

已购客户：已购买 OpenClaw ECS 的客户，在云服务器-运维编排-应用更新中点击创建任务，选择安全加固和需要加固的实例，下发任务即可完成防护。
新购客户：火山引擎 ECS 标准镜像已自带该防护插件，初始化即拥有安全能力。

已购客户

新购客户

👉 非火山引擎客户：

通过简单的命令自动完成安装。

登入到您部署 OpenClaw 的服务器上执行下方命令，安装插件的命令行工具。

npm i -g @omni-shield/openclaw-cli

安装完成，执行下方命令启动配置流程。

omni-shield-openclaw

安装过程会自动检测环境并生成一个有时效性的登录 URL，通过浏览器访问 URL 跳转登录火山引擎账号，登录完成后，命令行工具自动检测登录状态，自动执行插件的安装和配置流程。

安装完成后，按 Y重启 OpenClaw 以使配置生效，或执行 openclaw gateway restart 重启正在运行的 OpenClaw 服务，重启后正式生效。

供应链安全：

让Skills安全调用

Skills 作为 OpenClaw 的“手”，通过封装特定能力供 OpenClaw 调用以完成复杂任务。然而，随着 Skills 的权限过大及恶意 Skills 的涌现，导致账户凭证外泄、执行木马病毒等安全事件频发。

针对此痛点，火山引擎智能体安全管理平台的扫描功能全面升级，支持对 MCP/Skills 的深度扫描。用户可以自行上传任意 Skills 文件，平台提供预置的扫描规则可对上传的 Skills 进行深度扫描，并输出详细的风险详情，实现了覆盖事前检测、定期巡检、事中拦截的全生命周期安全防护：

风险检测：依托平台预置扫描规则，对 OpenClaw 本地部署的 Skills 进行深度扫描

定期巡检：基于 OpenClaw 的 Cron 机制，支持定期对更新的 Skills 进行自动扫描

动态拦截：当 OpenClaw 的 Skills 被加载时，平台会判断其是否经过扫描。若未经过扫描，平台将即时发起检测，并根据风险评估情况决定是否继续执行

预置扫描规则

上传Skills文件

Skills风险详情

<<< 向左滑动，查看更多

// 使用教程

目前，火山引擎智能体安全管理平台私有化版本已上线扫描方案，面向所有用户开启限时免费试用。同时，公有云版本将在2月底对外上线，届时欢迎大家体验。

在私有化版本中，对接 OpenClaw 和智能体安全管理平台对 Skills 进行安全扫描，具体操作步骤如下：

下载智能体安全管理平台的 Skills 扫描安装包；<Skills-Security-Scanner>：https://bytedance.larkoffice.com/file/Rbm0bNBViowSNqxB0Ltc9qBAnNe
将上方压缩包解压至 OpenClaw 目录下 ~/.openclaw/workspace/skills/；
通过 OpenClaw 的对话 Agent 查询 Skills 列表，查看上方 Skills 是否已经被加载；
通过 OpenClaw 提示词用 Skills-Security-Scanner 对1password（OpenClaw平台自带的Skills）进行扫描；
通过 OpenClaw 的控制台展现扫描结果，识别潜在威胁。

安全是 AI 真正成为生产力的底线。火山引擎通过三层纵深安全防护方案，助力开发者在享受 AI 效率的同时，无需担心隐私外泄与操作风险。现在，上火山引擎一键安全防护，让你的 AI 助手安全上岗。

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

深度剖析洞察见解！AI应用架构师在AI系统性能监控平台的见解深度分享

当你负责的AI系统突然出现推荐点击率暴跌20%图像识别精度下降15%推理延迟从100ms飙升至500ms时，你需要的不是传统IT监控的"服务器负载报警"，而是一套能穿透AI系统本质的性能监控平台。本文结合AI应用架构师的一线实践，深度剖析AI系统性能监控的特殊性核心指标架构设计要点与实践技巧，帮你构建一套"能听懂AI说话"的监控体系。无论是模型漂移、推理瓶颈还是资源浪费，都能让你快速定位问题，像"

2048 AI社区

企业AI Agent的强化学习在动态资源分配中的应用

在当今竞争激烈的商业环境中，企业面临着复杂多变的资源分配问题。动态资源分配涉及到在不同的时间点和不同的业务需求下，合理地分配有限的资源，如人力、物力、财力等，以实现企业的效益最大化。传统的资源分配方法往往难以适应快速变化的市场环境和业务需求，而强化学习作为一种能够在动态环境中进行自主学习和决策的技术，为企业动态资源分配提供了新的解决方案。