《手撕高并发限流器：令牌桶 + 漏桶算法实战解析》

本文深入解析了高并发系统中的限流技术，对比了漏桶和令牌桶两种核心算法。通过Python代码实战演示了两种限流器的实现方法，并展示了在Flask接口中的应用场景。文章还提供了精度控制、分布式限流等优化建议，探讨了AI结合、服务网格集成等未来发展方向。从原理到实践，全面指导开发者构建高性能限流组件，保障系统稳定性。适合需要处理高并发场景的Python开发者阅读学习。

清水白石008

468人浏览 · 2026-01-12 06:15:27

清水白石008 · 2026-01-12 06:15:27 发布

《手撕高并发限流器：令牌桶 + 漏桶算法实战解析》

在高并发系统中，限流器就像闸门，既要保障系统稳定，又不能阻断正常流量。本文将带你从原理出发，手写实现令牌桶与漏桶限流器，构建高性能、可控的 Python 限流组件。

一、为什么你需要限流器？

在真实系统中，我们常常面临以下挑战：

某接口被恶意刷请求，导致服务崩溃。
后端依赖（如数据库、第三方 API）承压过大，响应变慢。
高峰期突发流量冲垮系统，影响正常用户体验。

这时，限流器就派上用场了。它的目标不是“拒绝服务”，而是“有序接纳”，在保护系统的同时，尽可能多地服务用户。

二、限流算法概览：漏桶 vs 令牌桶

1. 漏桶算法（Leaky Bucket）

原理：请求进入一个“桶”，桶以固定速率“漏水”（处理请求）。如果桶满了，新请求被丢弃。
特点：
- 出水速率恒定，适合平滑流量。
- 无法应对突发流量（突发请求会被直接丢弃）。

2. 令牌桶算法（Token Bucket）

原理：系统以固定速率向桶中放入“令牌”，每个请求需消耗一个令牌。没有令牌的请求被拒绝或等待。
特点：
- 支持突发流量（桶中可积累令牌）。
- 控制平均速率，灵活性更高。

特性	漏桶算法	令牌桶算法
控制速率	固定出水速率	固定发放令牌速率
是否支持突发	否	是
实现复杂度	简单	略高
适用场景	视频流、日志写入等	API 接口、消息队列等

三、手写实现：Python 限流器实战

我们将分别实现两个限流器类，并提供使用示例。

1. 漏桶算法实现

import time
import threading

class LeakyBucket:
    def __init__(self, capacity, leak_rate):
        self.capacity = capacity  # 桶容量
        self.leak_rate = leak_rate  # 每秒漏出请求数
        self.water = 0  # 当前水量
        self.last_check = time.time()
        self.lock = threading.Lock()

    def allow_request(self):
        with self.lock:
            now = time.time()
            elapsed = now - self.last_check
            leaked = elapsed * self.leak_rate
            self.water = max(0, self.water - leaked)
            self.last_check = now

            if self.water < self.capacity:
                self.water += 1
                return True
            else:
                return False

使用示例：

bucket = LeakyBucket(capacity=10, leak_rate=2)  # 每秒处理 2 个请求

for i in range(20):
    if bucket.allow_request():
        print(f"[{i}] 请求通过")
    else:
        print(f"[{i}] 被限流")
    time.sleep(0.2)

输出示意：

[0] 请求通过
[1] 请求通过
[2] 请求通过
...
[10] 被限流
[11] 被限流
...

2. 令牌桶算法实现

class TokenBucket:
    def __init__(self, capacity, refill_rate):
        self.capacity = capacity  # 最大令牌数
        self.tokens = capacity
        self.refill_rate = refill_rate  # 每秒补充令牌数
        self.last_refill = time.time()
        self.lock = threading.Lock()

    def allow_request(self):
        with self.lock:
            now = time.time()
            elapsed = now - self.last_refill
            refill = elapsed * self.refill_rate
            self.tokens = min(self.capacity, self.tokens + refill)
            self.last_refill = now

            if self.tokens >= 1:
                self.tokens -= 1
                return True
            else:
                return False

使用示例：

bucket = TokenBucket(capacity=5, refill_rate=2)  # 每秒补充 2 个令牌

for i in range(15):
    if bucket.allow_request():
        print(f"[{i}] 请求通过")
    else:
        print(f"[{i}] 被限流")
    time.sleep(0.3)

四、实战场景：限流器在 Web 接口中的应用

以 Flask 为例，我们可以将限流器封装为装饰器：

from flask import Flask, jsonify
app = Flask(__name__)

token_bucket = TokenBucket(capacity=10, refill_rate=5)

def rate_limit(func):
    def wrapper(*args, **kwargs):
        if token_bucket.allow_request():
            return func(*args, **kwargs)
        else:
            return jsonify({"error": "Too Many Requests"}), 429
    return wrapper

@app.route("/api/data")
@rate_limit
def get_data():
    return jsonify({"data": "Hello, Python!"})

这样就能轻松为接口加上限流保护，防止恶意刷接口。

五、进阶技巧与优化建议

✅ 精度控制

使用 Decimal 替代 float，避免时间精度误差。
或使用 int 表示毫秒级时间戳。

✅ 分布式限流

使用 Redis 实现跨进程、跨服务的限流器。
利用 Lua 脚本保证原子性。

✅ 弹性策略

对 VIP 用户放宽限流阈值。
对异常请求记录日志，辅助风控系统。

六、未来展望：限流器的演进方向

与 AI 模型结合，动态调整限流策略。
与服务网格（如 Istio）集成，实现统一流控。
引入滑动窗口算法，实现更平滑的限流体验。

七、总结与互动

本文回顾：

讲解了漏桶与令牌桶的原理与区别。
手写实现了两个限流器类，并结合 Flask 实战演示。
分享了限流器的优化建议与未来趋势。

开放性问题：

你在实际项目中是如何做限流的？遇到过哪些挑战？
除了令牌桶与漏桶，你是否尝试过滑动窗口、计数器等其他算法？

欢迎在评论区留言交流，我们一起构建更强大的 Python 技术社区！

🔍 附录与参考资料

Python 官方文档 - time 模块
Flask 官方文档
Redis 限流实现方案
推荐书籍：
- 《Python 高级编程》
- 《流畅的 Python》
- 《系统性能：企业与云计算性能指南》

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

2026必收藏！7大GitHub宝藏仓库助你从零到精通大模型！

2048 AI社区

论文导师不会告诉你的内幕：8款AI工具轻松搞定毕业论文写作

2048 AI社区

GLM-4.7与Gemini 3.0 Pro技术适配性与落地成本深度对比

2025年末，AI大模型技术已进入“场景化落地深耕”阶段，对于开发者与企业而言，模型选型的核心诉求从“参数竞赛”转向“技术适配性”与“工程落地成本”。智谱AI推出的GLM-4.7以轻量化、高可定制性为核心，适配中小团队快速迭代需求；Google DeepMind的Gemini 3.0 Pro则以专业化架构与生态闭环，聚焦企业级高端场景落地。