解析 ‘Introspection’ 在协程中的应用：如何利用协程钩子追踪异步任务的执行热点？

某个await阻塞了太久，例如慢速的数据库查询、外部API调用或文件读写。这在我们的追踪数据中表现为任务的“墙上时间”远大于“活动时间”。某个协程在await之前执行了过多的同步计算，导致事件循环无法及时处理其他任务，造成“事件循环饥饿”。这在我们的追踪数据中表现为某个异常长。虽然单次CPU操作不长，但如果某个代码路径被非常频繁地执行，其累计耗时也可能成为瓶颈。某些情况下，任务创建或事件循环调度本

weixin_41455464

419人浏览 · 2025-12-24 18:36:21

weixin_41455464 · 2025-12-24 18:36:21 发布

各位同仁，下午好！

今天，我们将深入探讨一个在高性能异步编程中至关重要的主题：协程的“内省”（Introspection），以及如何利用协程钩子来追踪异步任务的执行热点。在现代的分布式系统和高并发服务中，Python的 asyncio 框架以其高效的I/O多路复用能力，成为了构建响应式应用的基石。然而，随着异步逻辑的日益复杂，我们常常会面临一个挑战：当系统性能出现瓶颈时，如何迅速而准确地找出是哪个异步任务、哪个 await 点消耗了过多的时间？传统的同步编程分析工具往往在这里显得力不从心。

这就是“协程内省”发挥作用的地方。我们将学习如何像外科医生一样，精确地观测协程的内部运作，揭示其在并发海洋中的每一个细微波动。

一、异步编程的挑战与内省的必要性

在同步编程中，程序的执行路径是线性的。一个函数调用，直到它返回，才会将控制权交还给调用者。这使得使用 cProfile、perf 或 py-spy 等工具进行性能分析相对直观：我们可以清晰地看到哪个函数调用栈耗时最长。

然而，异步编程模型，尤其是基于事件循环的协程，彻底改变了这一范式。在 async/await 风格的代码中，一个任务在遇到 await 表达式时，会将控制权交还给事件循环，允许其他就绪的任务运行。当 await 的操作完成时，事件循环再将控制权交还给原来的任务，使其从 await 点继续执行。

这种非阻塞、协作式多任务的特性带来了巨大的性能提升，但也引入了新的调试和优化挑战：

执行路径碎片化： 一个逻辑上的任务可能在多个时间片内，被多个 await 点打断，分散在事件循环的无数个周期中。
“时间”的概念模糊： 对于一个协程，我们关注的不仅仅是其从开始到结束的“墙上时间”（wall time），更重要的是其“活动时间”（active time）——即CPU实际执行该协程代码的时间，以及它在等待I/O或其它事件上的“暂停时间”。
传统分析工具的盲区： 多数现有性能分析器对协程的上下文切换和 await 语义不敏感，它们可能只记录到事件循环的总体耗时，而无法深入到单个协程的生命周期中。

内省，简单来说，就是“自我审视”。在编程语境中，它指的是程序在运行时检查自身结构和行为的能力。对于协程，内省的目标是：

理解任务生命周期： 任务何时创建、何时开始、何时暂停、何时恢复、何时完成。
追踪执行流： 准确地知道一个任务在哪个 await 点放弃了控制权，又在哪个点恢复。
量化时间消耗： 精确测量每个任务、每个 await 段的实际CPU执行时间。
关联上下文： 将零散的执行片段与更高层的业务逻辑（如请求ID）关联起来。

通过这些内省能力，我们才能拨开异步代码的迷雾，精准定位那些吞噬性能的“热点”。

二、协程钩子：Python `asyncio` 的探针

Python asyncio 提供了多种机制，允许我们“钩入”（hook into）事件循环和任务的内部运作。这些钩子是我们进行协程内省的核心工具。

2.1 `asyncio` 事件循环的钩子

asyncio.AbstractEventLoop 提供了多种方法来修改或观察事件循环的行为：

loop.set_task_factory(factory): 这是最强大的钩子之一。它允许我们替换 asyncio 创建任务时使用的默认 Task 类。通过提供一个自定义的 Task 子类，我们可以在任务的整个生命周期中插入自己的逻辑，例如在任务创建、开始、暂停、恢复和完成时记录信息。
loop.set_exception_handler(handler): 允许我们自定义事件循环处理未捕获异常的方式。虽然不直接用于性能追踪，但对于理解任务失败原因非常有用。
loop.call_soon(callback, *args, context=None): 调度一个回调函数在事件循环的下一次迭代中运行。这本身不是钩子，但可以用来在事件循环的特定点注入我们的追踪逻辑。

重点是 set_task_factory。默认情况下，asyncio.create_task() 和 asyncio.TaskGroup.create_task() 会使用 asyncio.Task 类来封装协程。通过 set_task_factory，我们可以用一个继承自 asyncio.Task 的自定义类来替换它。

import asyncio
import time
import sys
from collections import defaultdict
import contextvars

# 定义一个 ContextVar 来追踪请求ID
request_id_var = contextvars.ContextVar('request_id', default='N/A')

# --- 1. 自定义 Task 类：基础追踪 ---
class TracingTask(asyncio.Task):
    """
    一个简单的TracingTask，用于记录任务的创建和完成时间。
    """
    _task_counter = 0

    def __init__(self, coro, *, loop=None, name=None):
        TracingTask._task_counter += 1
        self._task_id = TracingTask._task_counter
        self._start_time = time.perf_counter()
        self._request_id = request_id_var.get() # 获取当前上下文的request_id
        super().__init__(coro, loop=loop, name=name)
        print(f"[Task {self._task_id}] '{self.get_name()}' created. Request ID: {self._request_id}")

    def __done_callback(self, fut):
        end_time = time.perf_counter()
        duration = (end_time - self._start_time) * 1000 # 转换为毫秒
        print(f"[Task {self._task_id}] '{self.get_name()}' finished in {duration:.2f}ms. Request ID: {self._request_id}")
        if fut.exception():
            print(f"[Task {self._task_id}] '{self.get_name()}' raised exception: {fut.exception()}")

    def _make_cancelled_callback(self):
        # 覆写此方法以在任务完成时（无论成功、失败或取消）调用我们的回调
        # 这是一个内部方法，但在实践中是可靠的切入点
        self.add_done_callback(self.__done_callback)
        return super()._make_cancelled_callback()

# 示例协程
async def worker(name, delay):
    print(f"  Worker {name}: Starting...")
    await asyncio.sleep(delay)
    print(f"  Worker {name}: Finished after {delay}s.")
    if name == "ErrorTask":
        raise ValueError(f"{name} intentionally failed!")

async def main_simple_trace():
    print("n--- Running simple tracing example ---")
    loop = asyncio.get_running_loop()
    loop.set_task_factory(TracingTask)

    async with asyncio.TaskGroup() as tg:
        tg.create_task(worker("TaskA", 0.1))
        tg.create_task(worker("TaskB", 0.2))
        tg.create_task(worker("ErrorTask", 0.05))

    print("--- Simple tracing example finished ---")

# if __name__ == "__main__":
#     asyncio.run(main_simple_trace())

代码解析：

我们定义了一个 TracingTask 类，它继承自 asyncio.Task。
在 __init__ 方法中，我们记录了任务的创建时间 _start_time 和一个唯一的 _task_id。
最关键的是 _make_cancelled_callback。这是 asyncio.Task 内部用于在任务完成（无论正常结束、异常或取消）时执行清理逻辑的方法。我们在这里添加了一个 done_callback，在任务真正完成时计算其总耗时并打印。
request_id_var 是一个 contextvars.ContextVar，用于在任务创建时捕获当前的请求ID，即使任务在 await 之间切换，这个上下文变量也会正确传播。

运行 main_simple_trace，您会看到每个任务的创建和完成日志，包括它们的总耗时。这为我们提供了任务生命周期的基本视图。

2.2 `sys` 模块的低级钩子

Python的 sys 模块提供了更底层的追踪和分析钩子，例如 sys.settrace() 和 sys.setprofile()。

sys.settrace(func): 注册一个全局的追踪函数。每当Python解释器执行到新的代码行、调用/返回函数、抛出异常等事件时，都会调用这个追踪函数。这非常强大，但开销巨大，通常用于调试器或覆盖率工具。
sys.setprofile(func): 注册一个全局的性能分析函数。它只在函数调用和返回时被调用。相比 settrace，开销较小，常用于性能分析器。

挑战： sys.settrace 和 sys.setprofile 是全局的，它们不理解 asyncio 的任务上下文。当一个协程 yield 时，追踪函数会收到一个“返回”事件；当它恢复时，又会收到一个“调用”事件。这使得很难区分一个协程是真正在执行CPU密集型工作，还是仅仅从 await 恢复。它们会把事件循环本身的调度时间也计算进去，使得单个协程的“活动时间”难以准确测量。

因此，对于协程的精细化追踪，asyncio.set_task_factory 通常是更优的选择，因为它直接作用于 asyncio.Task 对象，能够感知任务的生命周期事件。

三、 `contextvars`：异步上下文的救星

在同步代码中，我们可以通过线程局部存储（threading.local）来在函数调用栈中维护上下文信息。但在异步代码中，由于多个协程可能在同一个线程中交替执行，线程局部存储就失效了。

contextvars 模块在 Python 3.7 中引入，专门解决了这个问题。它提供了一种在异步代码中安全地传递和访问上下文数据的方式。每个 asyncio.Task 都有一个独立的 Context 对象，contextvars 会确保在任务切换时，正确的上下文被激活。

例如，在一个Web服务器中，我们希望追踪一个请求从接收到响应的全过程。如果多个请求的协程在事件循环中并发运行，我们如何区分日志和性能数据是属于哪个请求的呢？contextvars 正是为此而生。

import asyncio
import time
import contextvars
from collections import defaultdict

# 1. 定义一个ContextVar来存储当前请求的ID
current_request_id = contextvars.ContextVar('request_id', default='unknown')

# 2. 增强TracerTask，使其能够捕获和报告contextvar
class AdvancedTracingTask(asyncio.Task):
    _task_counter = 0
    _trace_data = defaultdict(list) # 存储所有任务的详细追踪数据

    def __init__(self, coro, *, loop=None, name=None):
        super().__init__(coro, loop=loop, name=name)
        AdvancedTracingTask._task_counter += 1
        self._task_id = AdvancedTracingTask._task_counter
        self._coro_name = coro.__qualname__ # 协程函数名
        self._request_id = current_request_id.get() # 捕获创建时的请求ID
        self._start_time = time.perf_counter()
        self._last_resume_time = self._start_time # 记录上次恢复执行的时间
        self._active_duration = 0.0 # 累计该任务实际CPU执行时间

        self._trace_segments = [] # 记录任务内部每个await段的执行信息

        print(f"[Task {self._task_id} ({self._coro_name})] created (Req ID: {self._request_id})")

        # 钩子：在任务完成时调用
        self.add_done_callback(self._done_callback)

    def _step(self, exc=None):
        """
        覆写内部的_step方法来测量任务的活动时间。
        这个方法在任务每次从事件循环恢复执行时被调用。
        注意：直接覆写内部方法有一定风险，因为它可能在未来的Python版本中改变。
        但在没有官方稳定钩子的情况下，这是最有效的切入点。
        """
        # 记录本次恢复执行的时间
        self._last_resume_time = time.perf_counter()

        try:
            # 调用原始的_step方法执行协程的下一步
            return super()._step(exc)
        finally:
            # 记录本次执行结束（即将yield或任务完成）的时间
            current_time = time.perf_counter()
            segment_duration = current_time - self._last_resume_time
            self._active_duration += segment_duration

            # 记录详细的执行段
            # 这里的self._coro.cr_frame.f_lineno 和 f_code.co_name 可以提供更细粒度的位置信息
            # 但为了简洁，我们只记录当前协程函数名
            self._trace_segments.append({
                'coro': self._coro_name,
                'duration_ms': segment_duration * 1000,
                'request_id': self._request_id,
                'yield_point': self._get_yield_point_info() # 尝试获取yield点信息
            })
            # print(f"  [Task {self._task_id} ({self._coro_name})] segment: {segment_duration*1000:.2f}ms")

    def _get_yield_point_info(self):
        """尝试获取协程即将yield时的代码位置信息"""
        # 警告: 访问内部的_coro属性和其帧对象是高级且有风险的操作
        # 仅用于演示，不推荐在生产环境中直接依赖
        try:
            if self._coro and hasattr(self._coro, 'cr_frame') and self._coro.cr_frame:
                frame = self._coro.cr_frame
                return f"{frame.f_code.co_filename}:{frame.f_lineno}"
        except Exception:
            pass # 无法获取时静默失败
        return "unknown"

    def _done_callback(self, fut):
        end_time = time.perf_counter()
        total_wall_time = (end_time - self._start_time) * 1000
        active_time = self._active_duration * 1000

        status = "completed"
        if fut.cancelled():
            status = "cancelled"
        elif fut.exception():
            status = f"failed ({type(fut.exception()).__name__})"

        print(f"[Task {self._task_id} ({self._coro_name})] {status}."
              f" Wall time: {total_wall_time:.2f}ms, Active time: {active_time:.2f}ms. (Req ID: {self._request_id})")

        # 存储完整的追踪数据
        AdvancedTracingTask._trace_data[self._request_id].append({
            'task_id': self._task_id,
            'coro_name': self._coro_name,
            'status': status,
            'wall_time_ms': total_wall_time,
            'active_time_ms': active_time,
            'request_id': self._request_id,
            'segments': self._trace_segments
        })

# 示例协程
async def db_query(user_id):
    await asyncio.sleep(0.03) # 模拟数据库I/O
    return f"Data for user {user_id}"

async def api_call(endpoint):
    await asyncio.sleep(0.05) # 模拟外部API调用
    return f"Response from {endpoint}"

async def process_user_data(user_id):
    print(f"    [Req {current_request_id.get()}] Processing user {user_id}...")
    user_data = await db_query(user_id)
    print(f"    [Req {current_request_id.get()}] Received {user_data}.")
    api_result = await api_call(f"/users/{user_id}")
    await asyncio.sleep(0.02) # 模拟一些CPU计算
    print(f"    [Req {current_request_id.get()}] API result: {api_result}. Done processing user {user_id}.")
    return f"Processed user {user_id} successfully."

async def main_advanced_trace():
    print("n--- Running advanced tracing example with contextvars and active time ---")
    loop = asyncio.get_running_loop()
    loop.set_task_factory(AdvancedTracingTask)

    async def simulate_request(req_id, user_ids):
        token = current_request_id.set(req_id) # 设置请求ID
        print(f"--- Starting Request {req_id} ---")
        tasks = []
        async with asyncio.TaskGroup() as tg:
            for user_id in user_ids:
                tasks.append(tg.create_task(process_user_data(user_id)))
        current_request_id.reset(token) # 恢复之前的请求ID
        print(f"--- Request {req_id} finished ---")
        return [t.result() for t in tasks]

    # 模拟两个并发的请求
    await asyncio.gather(
        simulate_request("REQ-001", [101, 102]),
        simulate_request("REQ-002", [201, 202, 203])
    )

    print("n--- Aggregated Trace Data ---")
    for req_id, tasks_data in AdvancedTracingTask._trace_data.items():
        print(f"nRequest ID: {req_id}")
        for task_info in tasks_data:
            print(f"  Task {task_info['task_id']} ({task_info['coro_name']}):")
            print(f"    Status: {task_info['status']}")
            print(f"    Wall Time: {task_info['wall_time_ms']:.2f}ms")
            print(f"    Active Time: {task_info['active_time_ms']:.2f}ms")
            # print("    Segments:")
            # for i, segment in enumerate(task_info['segments']):
            #     print(f"      [{i+1}] @ {segment['yield_point']} -> {segment['duration_ms']:.2f}ms")

    print("n--- Hotspot Analysis ---")
    # 聚合所有任务的段数据，找出最耗时的协程函数和await点
    segment_stats = defaultdict(lambda: {'total_duration_ms': 0.0, 'count': 0, 'max_duration_ms': 0.0})
    for req_id, tasks_data in AdvancedTracingTask._trace_data.items():
        for task_info in tasks_data:
            for segment in task_info['segments']:
                key = f"{segment['coro']} @ {segment['yield_point']}"
                segment_stats[key]['total_duration_ms'] += segment['duration_ms']
                segment_stats[key]['count'] += 1
                segment_stats[key]['max_duration_ms'] = max(segment_stats[key]['max_duration_ms'], segment['duration_ms'])

    sorted_hotspots = sorted(segment_stats.items(), key=lambda item: item[1]['total_duration_ms'], reverse=True)

    print("nTop 5 Hottest Execution Segments:")
    print("-" * 50)
    print(f"{'Segment':<40} | {'Total (ms)':>12} | {'Avg (ms)':>10} | {'Max (ms)':>10} | {'Count':>7}")
    print("-" * 50)
    for i, (segment_key, stats) in enumerate(sorted_hotspots[:5]):
        avg_duration = stats['total_duration_ms'] / stats['count']
        print(f"{segment_key:<40} | {stats['total_duration_ms']:>12.2f} | {avg_duration:>10.2f} | {stats['max_duration_ms']:>10.2f} | {stats['count']:>7}")
    print("-" * 50)

# if __name__ == "__main__":
#     asyncio.run(main_advanced_trace())

代码解析（AdvancedTracingTask 和 main_advanced_trace）：

current_request_id = contextvars.ContextVar('request_id', default='unknown'): 定义一个 ContextVar 来存储当前请求的唯一标识符。
simulate_request 协程： 这是一个模拟Web请求的函数。在进入请求处理逻辑前，它通过 current_request_id.set(req_id) 设置请求ID，并在请求结束后通过 current_request_id.reset(token) 恢复之前的上下文。这确保了在 process_user_data 及其调用的 db_query、api_call 中，都能正确获取到当前的请求ID，即使它们是并发执行的。
AdvancedTracingTask 增强：
- 在 __init__ 中，除了记录任务ID和创建时间，还捕获了 current_request_id.get() 来关联请求上下文。
- 关键点 _step(self, exc=None)： 这是 asyncio.Task 的一个内部方法，负责驱动协程向前执行一步。每次协程从 await 点恢复执行时，事件循环都会调用此方法。
  - 我们在此方法被调用时记录 _last_resume_time。
  - 然后调用 super()._step(exc) 执行协程的实际代码。
  - 在 finally 块中，我们再次记录时间，计算 segment_duration（即该协程在本次调度中实际执行CPU代码的时间）。这个时间累加到 _active_duration 中。
  - 我们还记录了每个执行段的详细信息，包括 yield_point，这可以通过访问协程内部的帧对象 self._coro.cr_frame 来获取文件名和行号。注意：这是一种高级且有风险的内省，因为它直接触及了Python解释器的内部实现，可能在不同版本间不稳定。
- _done_callback：在任务完成时，我们不仅报告总的“墙上时间”，还报告了累计的“活动时间”，并将所有追踪数据存储到 _trace_data 字典中，按 request_id 分组。
main_advanced_trace：
- 设置 AdvancedTracingTask 作为任务工厂。
- 使用 asyncio.gather 模拟多个并发请求，每个请求都有其独立的 request_id 上下文。
- 最后，遍历 AdvancedTracingTask._trace_data，打印每个请求下的任务追踪信息，并进行简单的热点分析。热点分析聚合了所有任务的执行段，找出总耗时最长的段（coro 和 yield_point 组合），以此识别性能瓶颈。

运行 main_advanced_trace，您会看到每个任务的详细执行日志，包括与请求ID的关联、墙上时间、活动时间，以及每个执行段的耗时。最终的“热点分析”表格将清晰地展示哪个协程函数在哪个 await 点（或在 yield 前的CPU计算）上消耗了最多的累计时间。

四、深入追踪：热点识别与数据聚合

通过 AdvancedTracingTask，我们已经能够收集到相当详细的协程执行数据：每个任务的创建/完成时间、总墙上时间、总活动时间，以及每个 await 之间的执行段耗时。现在，我们需要将这些原始数据转化为可操作的洞察力，以识别真正的热点。

4.1 什么是“热点”？

在异步编程中，热点可能表现为：

长时间的I/O等待： 某个 await 阻塞了太久，例如慢速的数据库查询、外部API调用或文件读写。这在我们的追踪数据中表现为任务的“墙上时间”远大于“活动时间”。
CPU密集型操作： 某个协程在 await 之前执行了过多的同步计算，导致事件循环无法及时处理其他任务，造成“事件循环饥饿”。这在我们的追踪数据中表现为某个 segment_duration 异常长。
频繁的短时CPU操作： 虽然单次CPU操作不长，但如果某个代码路径被非常频繁地执行，其累计耗时也可能成为瓶颈。
任务启动/调度开销： 某些情况下，任务创建或事件循环调度本身的开销也可能值得优化（尽管通常这不是主要瓶颈）。

4.2 数据收集与结构化

我们的 AdvancedTracingTask._trace_data 已经将数据按 request_id 和 task_id 进行了组织。每个任务包含一个 segments 列表，记录了其在每次从 await 恢复到下一次 await（或任务完成）之间的CPU执行信息。

表格示例：追踪数据结构

字段	类型	描述
`request_id`	`str`	关联的请求ID (来自 `contextvars`)
`task_id`	`int`	任务的内部唯一标识符
`coro_name`	`str`	协程函数的限定名
`status`	`str`	`completed`, `cancelled`, `failed`
`wall_time_ms`	`float`	任务从创建到完成的总时间 (毫秒)
`active_time_ms`	`float`	任务实际CPU执行时间累计 (毫秒)
`segments`	`list[dict]`	任务内部执行段的列表
`segments[i].coro`	`str`	当前段所属的协程函数名
`segments[i].duration_ms`	`float`	该执行段的CPU耗时 (毫秒)
`segments[i].yield_point`	`str`	该段结束时即将 `await` 的代码位置 (`filename:line`)

4.3 聚合与分析技术

为了从这些数据中找出热点，我们需要进行聚合。在 main_advanced_trace 的最后部分，我们展示了一个简单的聚合方法：

按执行段聚合： 遍历所有任务的所有 segments。使用 f"{segment['coro']} @ {segment['yield_point']}" 作为键来唯一标识一个特定的代码执行段。
统计指标： 对于每个唯一的执行段，我们累计其 total_duration_ms（总耗时）、count（执行次数）和 max_duration_ms（单次最大耗时）。
排序与报告： 根据 total_duration_ms 降序排列这些聚合后的段，并打印出Top N的段。

这种聚合方式能够直接回答“哪个 await 点前的代码块最耗时？”和“哪个协程函数在哪个文件行上最频繁地导致了事件循环的暂停？”。

更复杂的分析可能包括：

火焰图（Flame Graph）概念： 虽然纯文本很难生成真正的火焰图，但我们可以想象将这些分段数据堆叠起来，按调用栈和耗时进行可视化，以更直观地展示热点。
请求级SLA分析： 结合 request_id，我们可以分析特定请求类型的性能，找出哪些请求的响应时间超出了预期。
I/O等待时间估算： 粗略地，一个任务的 wall_time_ms - active_time_ms 可以作为其总I/O等待时间的近似值。如果这个差值很大，则表明任务大部分时间都在等待外部资源。

五、高级考量与最佳实践

5.1 性能开销

任何内省和追踪都会引入性能开销。

sys.settrace / sys.setprofile： 开销巨大，通常不适合生产环境。
set_task_factory + _step 覆写： 相对较小，但每次协程执行一步都会进行时间戳记录和数据存储。对于高吞吐量的系统，这仍然可能导致显著的性能下降。
contextvars： 引入的开销很小，可以放心使用。

建议：

在开发和测试环境中使用详细的追踪。
在生产环境中，只启用关键路径或异常情况下的轻量级追踪。
考虑使用采样（sampling）而非全量追踪，例如每N个任务或每隔一段时间进行一次详细追踪。
将追踪数据异步发送到日志或监控系统，避免阻塞事件循环。

5.2 结构化日志与可观测性

将这些追踪数据导出到标准的观测工具中是构建健壮系统的关键。

OpenTelemetry (OTel): 一个开放标准，用于收集和导出遥测数据（Metrics, Logs, Traces）。我们可以将每个任务的执行段映射为 OpenTelemetry 的 Span，并使用 request_id 作为 Trace ID 来关联整个请求的多个 Span。
Prometheus / Grafana: 将聚合后的指标（如“db_query 总耗时”、“api_call 最大耗时”）导出为 Prometheus 指标，并在 Grafana 中可视化。
Elasticsearch / Kibana: 将结构化的追踪日志存储在Elasticsearch中，并通过Kibana进行搜索和分析。

5.3 追踪I/O操作

我们当前的 _step 钩子主要测量CPU活动时间。要精确追踪I/O等待时间，通常需要更深层次的集成：

库级集成： 许多异步库（如 aiohttp, asyncpg, aioredis）提供自己的中间件或钩子来记录I/O操作。这是最推荐的方式。
猴子补丁（Monkey Patching）： 直接修改 socket 模块的 send, recv, connect 等方法，或者 selectors 模块。这种方法侵入性强，风险高，但可以提供非常细粒度的I/O追踪。
asyncio.AbstractEventLoop.call_soon / call_later 等： 理论上，我们可以通过检测事件循环调度了哪些回调（这些回调通常是I/O完成通知），来间接推断I/O的完成。但这很难与具体的 await 点关联。

通常，将 active_time 与 wall_time 进行比较，就能很好地指示任务是否大部分时间都在等待I/O。如果 wall_time 远大于 active_time，那么瓶颈很可能在I/O。

5.4 调试死锁与任务卡顿

协程内省不仅用于性能，也能帮助调试逻辑问题：

长时间未完成的任务： 通过追踪，我们可以看到哪些任务启动了但长时间没有 _done_callback。结合 _step 钩子，甚至可以知道它卡在了哪个 await 点之前或之后。
事件循环饥饿： 如果某个 segment_duration 异常长，说明有CPU密集型同步代码阻塞了事件循环。
未处理的异常： set_exception_handler 和 TracingTask 中的异常捕获可以帮助我们快速发现任务中的未处理异常。

六、总结与展望

协程内省是异步系统性能优化和故障诊断的利器。通过利用 asyncio 的 set_task_factory 钩子和 contextvars，我们可以构建出强大的追踪工具，深入了解协程的生命周期、执行热点以及它们如何与更高层次的业务上下文关联。

虽然直接修改内部方法（如 _step）存在一定的风险，但在缺乏官方稳定API的情况下，它们为我们提供了无与伦比的洞察力。随着 asyncio 社区的发展，我们期待未来能有更稳定、更低开销的官方内省API出现，使异步编程的调试和优化变得更加简单高效。掌握这些技术，将使您在构建和维护高性能异步服务时如虎添翼。

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

有关LangChain

通过本文，你已经掌握了使用LangChain接入从云端API到本地部署模型的全套方法。无论是简单的对话任务还是复杂的AI应用开发，LangChain都提供了统一而强大的接口。记住，选择云端API还是本地部署取决于你的具体需求：云端API简单快捷，适合大多数应用场景；本地部署则更适合对数据隐私和成本控制有严格要求的场景。在接下来的学习中，我们将深入探讨LangChain的核心组件，包括提示词管理、记

2048 AI社区

红队 / 蓝队：用 AI 自动生成攻击场景并评估防御效果——从“安全演练”到“可计算的网络对抗系统”

在可编程网络与 IaC（基础设施即代码）深度普及的今天，网络架构的复杂程度早已超越了人力静态审计的极限。然而，我们对网络安全的验证，却仍旧依赖于每年一两次、高度依赖专家经验的“红蓝对抗演练”。未来的网络，将不再是一个等待被攻击的静态靶场，而是一个在 AI 持续对抗中自我修补、自我增强的动态生命体。当我们把红蓝对抗拆解为可计算的攻击路径、可量化的检测指标以及自动化的配置闭环时，我们实际上完成了一场。