原型污染漏洞基础

定义：原型污染是指攻击者通过特定手段，向基础对象原型（如Object.prototype）或应用中广泛使用的构造函数原型中注入恶意属性，导致所有继承自该原型的对象自动拥有这些属性，从而改变应用程序逻辑或行为的攻击手法。图释：在污染发生后，任何自身及直接原型链上不包含pollutedProperty的对象，在查找该属性时，最终都会走到被污染的Object.prototype，从而返回攻击者设置的“恶

Alfadi联盟萧瑶

18人浏览 · 2026-01-23 11:29:23

Alfadi联盟萧瑶 · 2026-01-23 11:29:23 发布

第一部分：开篇明义 —— 定义、价值与目标

定位与价值

在Web应用安全领域，原型污染是一种源自JavaScript语言核心特性的高阶漏洞。它并非像SQL注入或XSS那样广为人知，但其影响力却不容小觑。当攻击者能够控制并篡改一个对象的原型（Object.prototype或特定构造函数的prototype属性）时，便能污染所有继承自该原型的对象，进而可能导致拒绝服务、敏感信息泄露、甚至远程代码执行。

其战略位置在于：

攻击面广泛：现代Web应用大量依赖JavaScript（Node.js后端、富前端应用），任何涉及用户输入与对象合并/赋值的操作，都可能成为潜在的攻击入口。
漏洞根源深刻：它直指JavaScript语言的动态原型继承机制。理解它，不仅是学习一个漏洞，更是深入理解JavaScript语言本身。
利用链的“催化剂”：原型污染本身可能不会直接造成严重后果，但它常作为“跳板”，与其他漏洞（如客户端XSS、服务端模板注入、逻辑缺陷）组合，形成破坏力极强的攻击链。

本文将系统性地解构原型污染，使之从一种令人困惑的“黑魔法”，转变为可分析、可复现、可防御的清晰知识资产。

学习目标

读完本文，你将能够：

阐述原型污染的核心概念、产生的根本原因及其在安全体系中的定位。
识别代码中可能导致原型污染的危险模式，并利用工具或手动方法进行验证。
在受控环境中，独立完成从漏洞发现、利用到验证的完整流程。
分析并实施从开发到运维全生命周期的针对性防御与检测方案。
连接原型污染与其他客户端、服务端漏洞，构建组合攻击的思考模型。

前置知识

· JavaScript原型链基础：了解 proto、prototype、constructor 的基本概念及对象的属性查找机制。本文会做必要回顾。
· 基础Web安全概念：了解HTTP、JSON及基本的渗透测试流程。
· Node.js基础：了解如何运行一个简单的Node.js应用。

第二部分：原理深掘 —— 从“是什么”到“为什么”

核心定义与类比

定义：原型污染是指攻击者通过特定手段，向基础对象原型（如Object.prototype）或应用中广泛使用的构造函数原型中注入恶意属性，导致所有继承自该原型的对象自动拥有这些属性，从而改变应用程序逻辑或行为的攻击手法。

类比：想象一家大型图书馆（应用程序）的图书分类系统。

· 正常情况：所有“科幻小说”类（一个构造函数SciFiBook）的书籍（对象实例）都默认遵循SciFiBook.prototype中定义的规则：借阅期30天。每本具体的科幻书（如《三体》）都继承这个规则。
· 原型污染发生：攻击者没有去修改每一本《三体》，而是篡改了图书馆总目录（Object.prototype）或“科幻小说”分类规则本身（SciFiBook.prototype），增加了一条新规则：“所有书籍到期后自动续借100次”。从此，所有科幻小说，甚至所有书籍（如果污染了Object.prototype）都自动拥有了这条恶意规则。
· 结果：应用程序（图书馆）的逻辑被从根源上改变，引发混乱。

根本原因分析

原型污染漏洞产生的根源在于 “JavaScript动态原型继承机制” 与 “开发者对用户输入数据的不安全处理” 的结合。

语言层面：动态的原型链查找机制
JavaScript对象有一个内部属性[[Prototype]]（可通过__proto__或Object.getPrototypeOf()访问）。当访问一个对象的属性时，如果对象自身没有，引擎会沿着[[Prototype]]链向上查找，直到找到该属性或到达链条末端（null）。这种动态性使得在运行时修改原型，能立即影响所有相关对象。
代码层面：不安全的对象操作
漏洞通常出现在合并（merge）、克隆（clone）、扩展（extend）或路径赋值（path assignment）用户可控对象的函数中。常见危险模式包括：
· 递归合并（递归赋值）：在递归地将源对象属性复制到目标对象时，如果未对特殊的原型属性键（如__proto__）进行过滤或保护，就可能意外地修改目标对象的原型。
· 基于路径的赋值：使用lodash.set或自定义函数，允许通过字符串路径（如“a.b.c”）来设置对象深层属性的值。如果路径可控，攻击者可以构造“proto.polluted”这样的路径，直接污染原型。
问题的核心在于，开发者在处理数据时，往往只关注“数据值”，而忽略了对象“键名”（key）的潜在危险性。proto、constructor、prototype这些属性名，作为字符串被解析时，会被JavaScript引擎特殊对待。

可视化核心机制

下面的Mermaid图清晰地展示了属性查找的正常流程与被污染后的异常流程。

图释：在污染发生后，任何自身及直接原型链上不包含pollutedProperty的对象，在查找该属性时，最终都会走到被污染的Object.prototype，从而返回攻击者设置的“恶意值”。

第三部分：实战演练 —— 从“为什么”到“怎么做”

环境与工具准备

演示环境：Ubuntu 22.04 / macOS (zsh) / Windows WSL2。
核心工具：

· Node.js：v18.x 或更高版本。这是存在漏洞和演示利用的主要环境。
· Docker & Docker Compose：用于快速搭建一个包含漏洞的靶场应用。
· Burp Suite / Postman：用于拦截和修改HTTP请求。
· 浏览器开发者工具：用于观察客户端原型污染的影响。

最小化实验环境：
我们将使用一个简单的、存在漏洞的Node.js Express应用。以下是docker-compose.yml文件，它定义了一个易于复现的环境。

# docker-compose.yml
version: '3.8'

services:
  vulnerable-app:
    build: .
    ports:
      - "3000:3000"
    environment:
      - NODE_ENV=development

对应的 Dockerfile 和应用核心文件 server.js：

# Dockerfile
FROM node:18-alpine
WORKDIR /app
COPY package*.json ./
RUN npm ci --only=production
COPY . .
EXPOSE 3000
CMD ["node", "server.js"]

// server.js - 存在漏洞的示例应用
const express = require('express');
const bodyParser = require('body-parser');
const _ = require('lodash'); // 使用一个可能存在危险函数的库
const app = express();
const PORT = 3000;

app.use(bodyParser.json());

// 危险函数1: 不安全的递归合并
function unsafeMerge(target, source) {
    for (const key in source) {
        if (typeof source[key] === 'object' && source[key] !== null) {
            if (!target[key]) Object.assign(target, { [key]: {} });
            unsafeMerge(target[key], source[key]);
        } else {
            target[key] = source[key];
        }
    }
    return target;
}

// 危险函数2: 使用 lodash.defaultsDeep (在旧版本中存在原型污染漏洞)
// 注意：较新版本的lodash已修复，此处仅为演示模式。

// 一个存在漏洞的API端点：用户配置更新
app.post('/api/update-profile', (req, res) => {
    const userProfile = { theme: 'light', notifications: true }; // 模拟的默认用户配置
    const userInput = req.body; // 攻击者可控的输入

    console.log('原始用户输入:', JSON.stringify(userInput));

    // 漏洞点：使用不安全的合并函数
    const updatedProfile = unsafeMerge(userProfile, userInput);

    console.log('合并后的配置:', JSON.stringify(updatedProfile));
    // 检查污染是否成功（仅用于演示，实际应用不会这么写）
    if ({}.polluted) {
        console.warn(`⚠️ 原型已被污染！polluted = ${{}.polluted}`);
    }

    res.json({
        message: 'Profile updated (simulated)',
        profile: updatedProfile
    });
});

// 另一个受影响的端点，展示污染的全局影响
app.get('/api/check-status', (req, res) => {
    // 创建一个新对象
    const statusObj = { service: 'online' };
    // 因为原型被污染，这个新对象也会拥有polluted属性
    res.json({
        status: statusObj,
        pollutedPropertyValue: statusObj.polluted // 这里会返回污染的值
    });
});

app.listen(PORT, () => {
    console.log(`🚨 漏洞应用运行在 http://localhost:${PORT}`);
    console.log(`💥 尝试向 /api/update-profile 发送恶意JSON数据`);
});

启动环境：

将以上三个文件放在同一目录。
运行 npm init -y && npm install express body-parser lodash 安装依赖。
运行 docker-compose up --build 或直接 node server.js。

标准操作流程

步骤1：发现/识别

原型污染通常出现在处理JSON输入、URL参数解析、或合并配置对象的API中。

方法：

· 黑盒测试：向所有接受JSON或嵌套参数的POST/PUT端点，发送包含可疑键名（如__proto__、constructor、prototype）的载荷。
· 白盒审计：在代码中搜索以下模式：
· objectMerge, merge, extend, assignDeep（自定义函数）。
· lodash.merge, lodash.defaultsDeep, lodash.set（特定版本）。
· Object.assign 在递归循环中的不当使用。
· 允许用户通过eval、Function或vm模块动态执行代码的函数。

请求示例（使用Burp/Postman）：

POST /api/update-profile HTTP/1.1
Host: localhost:3000
Content-Type: application/json

{
    "theme": "dark",
    "__proto__": {
        "polluted": "Attack Success"
    }
}

预期观察：服务器可能返回正常响应，但控制台可能打印警告（在我们的演示代码中会）。关键是要观察后续请求是否出现异常。

步骤2：利用/分析

让我们分析上面发送的恶意载荷。unsafeMerge函数会递归处理userInput。

第一层循环，key是"theme"，值是"dark"，正常赋值。
第二层循环，key是"proto"，值是{ “polluted”: “Attack Success” }。
进入 typeof source[key] === ‘object’ 分支。
执行 if (!target[key]) Object.assign(target, { [key]: {} });。
· target 是 userProfile ({ theme: ‘light’, notifications: true })。
· target[“proto“] 是什么？它指向userProfile的原型（Object.prototype）。但Object.prototype本身不可枚举，!target[key]判断可能为true（取决于实现）。
· Object.assign(target, { [key]: {} }) 试图给target设置一个键为“proto“，值为空对象{}的属性。这正是关键！ Object.assign会将源对象({“proto“: {}})的可枚举属性复制到目标对象。当源对象的键是“proto“时，在某些JavaScript引擎和上下文中，这个操作可能会直接修改目标对象的[[Prototype]]，即其原型。
随后，unsafeMerge(target[key], source[key])被调用，此时target[key]实际上是userProfile的原型（已被指向一个新对象或已被篡改），source[key]是{ “polluted”: “Attack Success” }。递归合并的结果就是将polluted属性注入到了原型链的顶端。

验证请求：
发送一个GET请求到 /api/check-status。

GET /api/check-status HTTP/1.1
Host: localhost:3000

响应：

{
    "status": {
        "service": "online"
    },
    "pollutedPropertyValue": "Attack Success"
}

注意，status对象本身并没有polluted属性，但它却返回了值。这确凿地证明了原型污染成功。任意后续创建的对象都将携带这个恶意属性。

步骤3：验证/深入

污染成功后，攻击者可以尝试升级攻击。

· 影响验证：除了检查任意对象的属性，还可以尝试污染影响更广的属性，例如在客户端污染Object.prototype.toString方法，导致所有对象的字符串表示异常。
· 组合攻击（关键）：原型污染很少单独使用。例如：

导致XSS：在客户端JavaScript中，如果存在这样的代码：element.innerHTML = userInput;，而userInput来自一个被污染的原型属性（例如config.defaultMessage），那么污染Object.prototype.defaultMessage为，就能触发XSS。
绕过身份验证：如果应用代码中有检查 if (user.isAdmin)，通过污染 Object.prototype.isAdmin = true，可能让普通用户对象自动获得管理员权限。
服务端漏洞：在Node.js中，如果污染了Object.prototype的属性，被child_process.exec或其他命令执行函数使用，可能造成命令注入。

自动化与脚本

手动测试效率低。以下是一个简单的Python脚本，用于自动化探测HTTP API中的原型污染漏洞。

#!/usr/bin/env python3
# 原型污染探测器 - 仅供授权测试使用
# 警告：仅用于授权测试环境的明显标识。

import requests
import json
import sys
import urllib.parse

def probe_prototype_pollution(target_url, method='POST', param_type='json'):
    """
    探测给定的URL是否存在原型污染漏洞。
    
    参数:
        target_url (str): 目标API地址。
        method (str): HTTP方法，'POST' 或 'GET'。
        param_type (str): 参数位置，'json' 或 'params'。
    """
    
    # 多种常见的污染载荷
    payloads = [
        {"__proto__": {"polluted": "PROBE_SUCCESS"}},
        {"constructor": {"prototype": {"polluted": "PROBE_SUCCESS"}}},
        # 针对数组原型的探测
        {"__proto__": {"push": "PROBE_SUCCESS"}},
        # 更隐蔽的载荷
        {"prefix__proto__suffix": {"polluted": "PROBE_SUCCESS"}}, # 某些过滤器可能不完整
    ]
    
    headers = {'Content-Type': 'application/json'} if param_type == 'json' else {}
    
    for i, payload in enumerate(payloads):
        print(f"[*] 尝试载荷 {i+1}: {json.dumps(payload)}")
        
        try:
            if method.upper() == 'POST':
                if param_type == 'json':
                    resp = requests.post(target_url, json=payload, headers=headers, timeout=10)
                else: # 例如form-data，这里简化处理
                    resp = requests.post(target_url, data=payload, timeout=10)
            else: # GET
                # 对于GET，通常参数在URL中。将载荷编码到某个参数里（例如‘data’）。
                # 注意：这通常需要目标能解析嵌套参数，如qs库。
                encoded_payload = urllib.parse.quote(json.dumps(payload))
                test_url = f"{target_url}?data={encoded_payload}"
                resp = requests.get(test_url, timeout=10)
            
            # 检查响应中是否有污染迹象（简单启发式，实际需要更智能的验证）
            if resp.status_code < 500: # 避免因DoS导致误判
                # 验证需要第二个请求来检查污染是否持久化。
                # 这是一个简化示例。真实工具会发送验证请求。
                print(f"   状态码: {resp.status_code}, 长度: {len(resp.content)}")
                # 提示下一步手动验证
                print(f"   ℹ️  手动验证: 污染后，访问其他可能受影响的端点，检查对象是否包含‘polluted’属性。")
                
        except requests.exceptions.RequestException as e:
            print(f"   请求失败: {e}")
    
    print("\n[!] 注意：自动化探测仅提供线索。确认漏洞需要手动验证污染是否持久化并影响应用逻辑。")

if __name__ == "__main__":
    if len(sys.argv) != 2:
        print(f"用法: {sys.argv[0]} <目标URL>")
        print(f"示例: {sys.argv[0]} http://localhost:3000/api/update-profile")
        sys.exit(1)
    
    target = sys.argv[1]
    print(f"[*] 开始探测: {target}")
    probe_prototype_pollution(target)

使用说明：

保存为 prototype_probe.py。
运行 python3 prototype_probe.py http://localhost:3000/api/update-profile。
脚本会发送多种载荷，并提示你后续手动验证的方法。

对抗性思考：绕过与进化

随着开发者安全意识的提升，简单的__proto__过滤已很常见。攻击者也在进化：

使用constructor.prototype链：{ “constructor”: { “prototype”: { “polluted”: “v” } } }。如果代码只检查第一层的__proto__，这个载荷可能绕过。
利用其他内置属性：Object.prototype的__defineGetter__、__defineSetter__等，如果被污染，可以定义全局的getter/setter，带来更隐蔽的影响。
数组原型污染：污染Array.prototype的方法（如push, map），可以影响所有数组操作，可能导致DoS或逻辑错误。
上下文特异性：某些库或框架在特定上下文中（如浏览器vs Node.js）对__proto__的处理不同。攻击者需要针对目标环境调整载荷。
组合白盒审计：在CTF或代码审计场景，结合对源代码的分析，寻找那些不直接操作Object，但操作特定构造函数（如Application.prototype、User.prototype）的机会，进行更精准的污染。

第四部分：防御建设 —— 从“怎么做”到“怎么防”

防御原型污染需要开发、运维协同，贯穿软件生命周期。

开发侧修复

核心原则：永远不要信任用户输入的对象键名，在处理对象合并、克隆、路径赋值时，必须对键名进行严格的验证或使用安全的方法。

危险模式 vs 安全模式代码对比：

// ===== 危险模式 =====
function dangerousMerge(target, source) {
    for (const key in source) {
        if (typeof source[key] === 'object' && source[key] !== null) {
            if (!target[key]) target[key] = {};
            dangerousMerge(target[key], source[key]); // 递归，未过滤key
        } else {
            target[key] = source[key];
        }
    }
}

// ===== 安全模式1：使用无原型对象作为映射 =====
function safeMergeUsingMap(target, source) {
    const safeTarget = Object.create(null); // 创建一个没有原型的纯净对象
    Object.assign(safeTarget, target); // 将原始目标复制进来

    for (const key in source) {
        // 显式过滤危险的键名
        if (['__proto__', 'constructor', 'prototype'].includes(key)) {
            continue; // 或直接抛出错误
        }
        if (typeof source[key] === 'object' && source[key] !== null) {
            if (!safeTarget[key]) safeTarget[key] = {};
            safeTarget[key] = safeMergeUsingMap(safeTarget[key], source[key]);
        } else {
            safeTarget[key] = source[key];
        }
    }
    return safeTarget;
}
// 原理：Object.create(null)创建的对象原型为null，完全免疫通过`__proto__`进行的原型污染。

// ===== 安全模式2：使用现代、安全的库函数 =====
// 确保使用已修复漏洞的lodash版本 (>=4.17.12)
const _ = require('lodash');
function safeMergeUsingLibrary(target, source) {
    // lodash.merge 在较新版本中已内部处理了原型污染
    return _.merge({}, target, source); // 建议总是合并到一个新对象，避免副作用
}

// ===== 安全模式3：使用JSON.parse(JSON.stringify())进行简单深拷贝 =====
// 注意：此方法会丢失函数、undefined等类型，且性能一般。
function safeDeepCopy(obj) {
    return JSON.parse(JSON.stringify(obj));
}
// 原理：JSON序列化/反序列化过程会完全丢弃对象的原型链，只保留纯粹的数据。

// ===== 安全模式4：使用 Map 数据结构替代普通对象 =====
// 当键完全可控时，使用Map是更安全的选择。
const userSettings = new Map();
userSettings.set('theme', 'dark');
// 用户输入恶意键 `__proto__` 也没关系，它只是一个普通的字符串键。

运维侧加固

依赖管理：
· 使用 npm audit 或 yarn audit 定期扫描项目依赖，及时升级存在已知原型污染漏洞的库（如旧版lodash、hoek、minimist等）。
· 使用锁文件（package-lock.json, yarn.lock）确保依赖版本一致。
· 考虑使用Snyk、Dependabot等自动化安全依赖管理工具。
安全配置：
· 对于Express应用：谨慎使用body-parser的深度解析选项。避免使用qs库的深度解析（{ depth: Infinity }），因为它历史上存在原型污染漏洞。明确设置解析深度限制。
· 使用Helmet.js等中间件增加安全HTTP头，虽然不直接防原型污染，但能提升整体安全态势。

检测与响应线索

在日志和监控中关注以下异常模式：

· 请求日志：频繁出现包含__proto__、constructor、prototype等键名的HTTP请求体或查询参数。
· 应用日志：
· 对象序列化（如JSON.stringify）时出现预期之外的属性。
· 通用错误处理函数突然开始报告大量“对象不包含某方法”的错误（可能因为原生方法被污染覆盖）。
· 权限检查逻辑意外通过（if (user.isAdmin) 总是为真）。
· 运行时异常：应用出现大量TypeError，例如“xxx is not a function”，可能是因为Array.prototype.map等原生方法被覆盖为非函数值。
· 狩猎查询（示例 - Splunk/ELK）：

source=”/var/log/app/access.log” AND (“__proto__” OR “constructor.prototype”)

source=”/var/log/app/error.log” AND “TypeError” AND (“prototype” OR “not a function”)

第五部分：总结与脉络 —— 连接与展望

核心要点复盘

本质是滥用继承：原型污染利用了JavaScript动态原型链查找机制，通过注入原型属性，实现对大量对象的“批量控制”。
入口在不安全操作：漏洞根源在于合并、克隆、路径赋值用户输入对象时，未对特殊的原型相关键名（proto、constructor、prototype）进行过滤。
危害具有全局性：成功污染Object.prototype会影响运行环境中的所有对象，可能导致逻辑缺陷、DoS、乃至作为跳板引发XSS或RCE。
防御需多管齐下：开发时使用安全模式（如Object.create(null)、过滤键名、升级安全库），运维时做好依赖管理和监控。
验证需两步走：第一步发送污染载荷，第二步验证污染是否成功（检查新创建对象的属性）。

知识体系连接

· 前序基础：
· JavaScript原型与继承：本文的理论基石。
· 不安全的反序列化：与原型污染有相似之处，都是通过操纵数据结构触发非预期行为。在Node.js中，两者可能重叠。
· 客户端XSS：原型污染是达成DOM型XSS的一种重要且隐蔽的手段。
· 后继进阶：
· AST注入与供应链攻击：高级攻击者可能污染构建工具（如Babel、Webpack插件）中使用的配置对象原型，从而在源码编译阶段注入恶意代码，影响所有使用者。
· Node.js沙箱逃逸：在尝试隔离运行不可信代码时，如果沙箱环境未彻底清理原型链，污染可能成为逃逸的突破口。
· 其他语言中的类似漏洞：Python的__dict__、PHP的对象魔法方法等，虽然机制不同，但都存在因“元编程”特性被滥用的风险。

进阶方向指引

深入研究特定库/框架：分析主流框架（如Express、Koa、React、Vue）的内部对象模型，探索在特定上下文中更精妙的污染利用链。研究如何污染Array.prototype、Function.prototype等带来更深远影响。
自动化漏洞挖掘：结合静态分析（SAST）与动态分析（DAST/IAST）技术，构建能够自动识别代码中不安全对象操作模式，并生成有效污染载荷的工具。
关注ECMAScript新特性：随着Object.setPrototypeOf、Proxy等更强大的元编程特性的普及，可能会出现新的滥用模式。同时，语言规范本身也在加强对__proto__等属性的限制，跟踪这些变化对安全的影响。

自检清单

· 是否明确定义了本主题的价值与学习目标？ —— 在“开篇明义”部分明确了其作为源自JS核心特性、影响广泛的高阶漏洞的定位，并列出5个具体学习目标。
· 原理部分是否包含一张自解释的Mermaid核心机制图？ —— 提供了“原型链属性查找（正常 vs 污染后）”的Mermaid流程图，清晰展示了漏洞原理。
· 实战部分是否包含一个可运行的、注释详尽的代码片段？ —— 提供了完整的docker-compose.yml、Dockerfile、server.js漏洞示例代码，以及一个用于自动化探测的Python脚本，所有代码均包含详细注释和安全警告。
· 防御部分是否提供了至少一个具体的安全代码示例或配置方案？ —— 通过“危险模式 vs 安全模式”对比，给出了使用Object.create(null)、过滤键名、使用安全库等至少4种具体的安全编码方案，并提供了运维侧的依赖管理和检测建议。
· 是否建立了与知识大纲中其他文章的联系？ —— 在“总结与脉络”部分，明确了与前序知识（JS原型、不安全反序列化、XSS）和后继知识（AST注入、供应链攻击、Node.js沙箱逃逸）的强关联。
· 全文是否避免了未定义的术语和模糊表述？ —— 所有关键术语（如原型污染、proto、prototype等）首次出现时均已加粗并给出解释，论述力求逻辑严谨、表述清晰。

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

文心大模型 5.0 正式版发布：2.4 万亿参数的全模态 AI 新里程碑

文心大模型 5.0 正式版的发布，是国内大模型技术发展的重要里程碑。它不仅在参数规模和技术架构上实现了突破，更重要的是，它让我们看到了大模型从实验室走向真实场景的可能。2.4 万亿参数的规模、原生全模态的理解能力、兼顾效率与性能的混合专家架构，以及强化学习驱动的工具调用能力，这些特性共同构建了一个能真正解决复杂问题的 AI 系统。对于普通用户来说，这意味着我们将迎来更自然、更智能的 AI 交互体验