线程同步机制详解：C++ 互斥量

jiuri

736人浏览 · 2025-12-09 21:28:02

jiuri · 2025-12-09 21:28:02 发布

文章目录

在多核 CPU 普及的今天，并发编程已成为提升程序性能的核心手段。从 Web 服务器的高并发处理，到游戏引擎的多线程渲染，再到数据库的并行查询，并发无处不在。然而，并发带来效率的同时，也引入了 数据竞争（Data Race）、** 死锁（Deadlock）** 等棘手问题。互斥量（Mutex，Mutual Exclusion 的缩写）作为最基础的线程同步原语，通过独占访问机制，确保同一时间只有一个线程能访问共享资源，从而有效解决数据一致性问题。

本文将深入剖析 C++ 标准库中的各类互斥量，结合可运行的详细示例。

一、并发编程的 “隐形杀手”：数据竞争

在探讨互斥量之前，我们先通过一个经典案例，理解为什么需要线程同步。

1.1 数据竞争的产生与危害

考虑以下代码：两个线程同时对全局变量count执行 10000 次自增操作，预期结果应为 20000。

#include <iostream>
#include <thread>

int count = 0;

void increment() {
    for (int i = 0; i < 10000; ++i) {
        count++; // 非原子操作
    }
}

int main() {
    std::thread t1(increment);
    std::thread t2(increment);
    t1.join();
    t2.join();
    std::cout << "Final count: " << count << std::endl;
    return 0;
}

运行结果：多次执行后，结果往往小于 20000（如 15678、18902 等）。

问题根源：count++并非原子操作，而是由三步组成：

读取：从内存读取count的值到 CPU 寄存器（如reg = count）。
修改：寄存器中的值加 1（如reg++）。
写入：将寄存器的值写回内存（如count = reg）。

若两个线程的执行时序重叠，可能出现以下情况：

线程 A 读取count=0 → 线程 B 读取count=0 → 线程 A 写回count=1 → 线程 B 写回count=1。
最终count只自增了 1 次，而非预期的 2 次。

这种多个线程同时访问共享资源且至少一个线程执行写操作的情况，称为数据竞争。数据竞争会导致程序行为不可预测，是并发 Bug 的主要来源之一。

1.2 互斥量的核心作用

互斥量通过独占访问机制解决数据竞争：

同一时间只允许一个线程持有锁。
其他线程尝试加锁时会阻塞，直到锁被释放。
持有锁的线程可安全访问共享资源（临界区）。

互斥量确保了临界区内的代码原子执行，从而保证数据一致性。

二、C++ 互斥量家族详解

C++11 及后续标准引入了多种互斥量类型，适用于不同场景。以下是详细讲解：

2.1 基础互斥量：`std::mutex`（独占锁）

std::mutex是最基础的互斥量，提供独占所有权：同一时间只能有一个线程持有锁。

2.1.1 核心接口

方法	功能描述
`lock()`	阻塞加锁，若锁被占用则等待
`unlock()`	手动解锁，必须由持有锁的线程调用
`try_lock()`	非阻塞加锁，成功返回`true`，失败返回`false`

2.1.2 示例：修复数据竞争

#include <iostream>
#include <thread>
#include <mutex>

int count = 0;
std::mutex mtx; // 全局互斥量

void increment() {
    for (int i = 0; i < 10000; ++i) {
        mtx.lock();   // 加锁：进入临界区
        count++;       // 临界区：安全访问共享资源
        mtx.unlock(); // 解锁：退出临界区
    }
}

int main() {
    std::thread t1(increment);
    std::thread t2(increment);
    t1.join();
    t2.join();
    std::cout << "Final count: " << count << std::endl; // 稳定输出20000
    return 0;
}

运行结果：无论执行多少次，结果始终为 20000。

原理：mtx.lock()确保同一时间只有一个线程能进入count++所在的临界区，从而避免了数据竞争。

2.1.3 注意事项

必须成对调用：若lock()后未unlock()（如临界区抛出异常），会导致锁永远无法释放，引发死锁。
避免锁外调用unlock()：未持有锁时调用unlock()，行为未定义（可能崩溃）。
不要在持有锁时调用外部函数：外部函数可能隐藏锁操作，导致死锁（如外部函数也尝试获取同一把锁）。

2.2 RAII 锁管理：自动加锁 / 解锁

为解决手动加解锁的风险，C++ 标准库提供了 RAII（资源获取即初始化） 风格的锁管理类，确保锁在作用域结束时自动释放。

2.2.1 `std::lock_guard`：简单高效的独占锁

std::lock_guard是最常用的锁管理类，构造时自动加锁，析构时自动解锁，适用于锁的生命周期与作用域完全一致的场景。

示例：简化版计数器保护

#include <iostream>
#include <thread>
#include <mutex>

int count = 0;
std::mutex mtx;

void increment() {
    for (int i = 0; i < 10000; ++i) {
        std::lock_guard<std::mutex> lock(mtx); // 构造时加锁
        count++;                               // 临界区：安全操作
        // 析构时自动解锁（离开作用域）
    }
}

int main() {
    std::thread t1(increment);
    std::thread t2(increment);
    t1.join();
    t2.join();
    std::cout << "Final count: " << count << std::endl;
    return 0;
}

优势：

自动管理锁生命周期：无需手动调用unlock()，即使临界区抛出异常，析构函数也会自动解锁。
不可复制、不可移动：确保锁的唯一性，避免意外转移锁所有权。
性能开销极小：仅在构造 / 析构时调用lock()/unlock()，适合短临界区。

2.2.2 `std::unique_lock`：灵活的独占锁

std::unique_lock提供了更灵活的锁管理，支持：

延迟加锁（构造时不立即加锁）。
手动加锁 / 解锁（lock()/unlock()）。
条件变量配合（必须使用unique_lock）。
锁所有权转移（可移动，不可复制）。

示例 1：延迟加锁（非临界区操作优先）

#include <iostream>
#include <thread>
#include <mutex>
#include <chrono>

std::mutex mtx;
int shared_data = 0;

void task() {
    // 1. 执行非临界区操作（无需加锁）
    std::this_thread::sleep_for(std::chrono::milliseconds(100)); // 模拟耗时操作
    int local_data = 42;

    // 2. 延迟加锁：仅在需要时加锁
    std::unique_lock<std::mutex> lock(mtx, std::defer_lock); // 构造时不锁
    lock.lock(); // 手动加锁
    shared_data += local_data; // 临界区
    lock.unlock(); // 提前解锁（释放锁，允许其他线程访问）

    // 3. 继续执行非临界区操作
    std::this_thread::sleep_for(std::chrono::milliseconds(100));
}

int main() {
    std::thread t1(task);
    std::thread t2(task);
    t1.join();
    t2.join();
    std::cout << "Shared data: " << shared_data << std::endl; // 输出84
    return 0;
}

说明：std::defer_lock是一个标记，告诉unique_lock构造时不要立即加锁，而是稍后手动调用lock()。这样可以先执行非临界区操作，减少锁的持有时间，提高并发度。

示例 2：条件变量配合（生产者 - 消费者模型）

条件变量用于线程间通信，需结合unique_lock使用（因为wait()方法会临时释放锁，允许其他线程访问共享资源）。

#include <iostream>
#include <thread>
#include <mutex>
#include <condition_variable>
#include <queue>

const int MAX_QUEUE_SIZE = 5; // 队列最大容量
std::queue<int> task_queue;   // 任务队列
std::mutex mtx;               // 保护队列的互斥量
std::condition_variable cv_producer; // 生产者等待条件
std::condition_variable cv_consumer; // 消费者等待条件

// 生产者：生成任务，放入队列
void producer(int id, int num_tasks) {
    for (int i = 0; i < num_tasks; ++i) {
        std::unique_lock<std::mutex> lock(mtx);
        // 等待队列不满（防止溢出）
        cv_producer.wait(lock, [] { return task_queue.size() < MAX_QUEUE_SIZE; });
        
        // 生成任务
        int task_id = id * 100 + i;
        task_queue.push(task_id);
        std::cout << "Producer " << id << " produced task " << task_id 
                  << " (queue size: " << task_queue.size() << ")" << std::endl;
        
        lock.unlock(); // 可选：提前解锁，减少消费者等待时间
        cv_consumer.notify_one(); // 通知消费者：队列非空
    }
}

// 消费者：从队列取出任务并处理
void consumer(int id, int num_tasks) {
    for (int i = 0; i < num_tasks; ++i) {
        std::unique_lock<std::mutex> lock(mtx);
        // 等待队列非空（防止空取）
        cv_consumer.wait(lock, [] { return !task_queue.empty(); });
        
        // 取出任务
        int task_id = task_queue.front();
        task_queue.pop();
        std::cout << "Consumer " << id << " consumed task " << task_id 
                  << " (queue size: " << task_queue.size() << ")" << std::endl;
        
        lock.unlock(); // 可选：提前解锁
        cv_producer.notify_one(); // 通知生产者：队列不满
        
        // 模拟任务处理（非临界区）
        std::this_thread::sleep_for(std::chrono::milliseconds(100));
    }
}

int main() {
    // 2个生产者，每个生成5个任务；2个消费者，每个消费5个任务
    std::thread p1(producer, 1, 5);
    std::thread p2(producer, 2, 5);
    std::thread c1(consumer, 1, 5);
    std::thread c2(consumer, 2, 5);
    
    p1.join(); p2.join();
    c1.join(); c2.join();
    return 0;
}

运行结果示例：

Producer 1 produced task 100 (queue size: 1)
Producer 2 produced task 200 (queue size: 2)
Consumer 1 consumed task 100 (queue size: 1)
Consumer 2 consumed task 200 (queue size: 0)
Producer 1 produced task 101 (queue size: 1)
...

原理：

生产者调用cv_producer.wait()时，会释放锁并进入等待状态，直到队列不满。
消费者调用cv_consumer.notify_one()时，会唤醒一个等待的生产者。
同样，消费者等待队列非空，生产者唤醒消费者。

这种机制确保了队列的安全访问和线程间的高效通信，是生产者 - 消费者模型的经典实现。

2.3 递归互斥量：`std::recursive_mutex`

std::recursive_mutex允许同一线程多次加锁（递归加锁），解锁次数需与加锁次数匹配。适用于递归函数或同一线程需多次进入临界区的场景。

2.3.1 示例：递归函数访问共享资源

#include <iostream>
#include <thread>
#include <mutex>

std::recursive_mutex rmtx;
int depth = 0;

// 递归函数：同一线程多次进入临界区
void recursive_task(int max_depth) {
    rmtx.lock(); // 第1次加锁
    depth++;
    std::cout << "Thread " << std::this_thread::get_id() 
              << " entered depth: " << depth << std::endl;
    
    if (depth < max_depth) {
        recursive_task(max_depth); // 递归调用：同一线程再次加锁（合法）
    }
    
    depth--;
    std::cout << "Thread " << std::this_thread::get_id() 
              << " exited depth: " << depth << std::endl;
    rmtx.unlock(); // 第1次解锁
}

int main() {
    std::thread t1(recursive_task, 3);
    std::thread t2(recursive_task, 2);
    t1.join();
    t2.join();
    return 0;
}

运行结果示例：

Thread 140123456789000 entered depth: 1
Thread 140123456789000 entered depth: 2
Thread 140123456789000 entered depth: 3
Thread 140123456789000 exited depth: 2
Thread 140123456789000 exited depth: 1
Thread 140123456789000 exited depth: 0
Thread 140123456789001 entered depth: 1
Thread 140123456789001 entered depth: 2
Thread 140123456789001 exited depth: 1
Thread 140123456789001 exited depth: 0

说明：线程 t1 递归调用 3 次，每次调用都会加锁，最终解锁 3 次；线程 t2 同理。

2.3.2 注意事项

避免滥用：递归互斥量会增加性能开销（需维护加锁次数），且可能掩盖设计问题（如可通过重构避免递归加锁）。
解锁次数必须匹配：若加锁 N 次，需解锁 N 次，否则锁无法完全释放。
不支持跨线程递归：只有同一线程才能递归加锁，其他线程尝试加锁时会阻塞。

2.4 共享互斥量（C++17）：`std::shared_mutex`（读写锁）

std::shared_mutex实现了读写锁机制，核心思想是：

读操作：可多个线程同时持有共享锁（读锁），提高并发度。
写操作：只能一个线程持有独占锁（写锁），且写锁与读锁互斥。

适用于读多写少的场景（如缓存、配置文件读取）。

2.4.1 核心接口

方法	功能描述
`lock()`	独占锁：阻塞加锁，用于写操作
`unlock()`	释放独占锁
`lock_shared()`	共享锁：阻塞加锁，用于读操作
`unlock_shared()`	释放共享锁
`try_lock()`	非阻塞尝试获取独占锁
`try_lock_shared()`	非阻塞尝试获取共享锁

2.4.2 示例：读写锁优化缓存访问

#include <iostream>
#include <thread>
#include <mutex>
#include <shared_mutex>
#include <map>
#include <chrono>
#include <vector>

// 全局缓存：key→value映射
std::map<int, std::string> cache;
std::shared_mutex smtx;

// 读操作：获取缓存（共享锁，支持并发）
std::string get_cache(int key) {
    std::shared_lock<std::shared_mutex> lock(smtx); // 共享锁
    auto it = cache.find(key);
    if (it != cache.end()) {
        return it->second;
    }
    return "Not Found";
}

// 写操作：更新缓存（独占锁，独占访问）
void update_cache(int key, const std::string& value) {
    std::unique_lock<std::shared_mutex> lock(smtx); // 独占锁
    cache[key] = value;
    std::cout << "Updated cache: " << key << " → " << value << std::endl;
}

int main() {
    // 初始化缓存
    update_cache(1, "Value1");
    update_cache(2, "Value2");
    update_cache(3, "Value3");

    // 10个读线程：并发读取缓存（共享锁，无阻塞）
    auto read_task = [](int thread_id) {
        for (int i = 0; i < 5; ++i) {
            int key = (i % 3) + 1; // 循环读取key=1,2,3
            std::string val = get_cache(key);
            std::cout << "Reader " << thread_id << " got cache[" << key << "] = " << val << std::endl;
            std::this_thread::sleep_for(std::chrono::milliseconds(100)); // 模拟读延迟
        }
    };

    // 2个写线程：更新缓存（独占锁，阻塞其他写线程和所有读线程）
    auto write_task = [](int thread_id) {
        for (int i = 0; i < 2; ++i) {
            int key = (thread_id * 2 + i) % 3 + 1; // 分散写key
            std::string new_val = "NewValue_" + std::to_string(thread_id) + "_" + std::to_string(i);
            update_cache(key, new_val);
            std::this_thread::sleep_for(std::chrono::milliseconds(500)); // 模拟写延迟
        }
    };

    // 创建线程
    std::vector<std::thread> readers;
    for (int i = 0; i < 10; ++i) {
        readers.emplace_back(read_task, i);
    }

    std::vector<std::thread> writers;
    for (int i = 0; i < 2; ++i) {
        writers.emplace_back(write_task, i);
    }

    // 等待所有线程完成
    for (auto& t : readers) t.join();
    for (auto& t : writers) t.join();

    return 0;
}

运行结果示例：

Updated cache: 1 → Value1
Updated cache: 2 → Value2
Updated cache: 3 → Value3
Reader 0 got cache[1] = Value1
Reader 1 got cache[1] = Value1
Reader 2 got cache[1] = Value1
...（10个读线程并发读取，无阻塞）
Updated cache: 1 → NewValue_0_0（写线程获取独占锁，阻塞所有读线程）
Reader 0 got cache[1] = NewValue_0_0（写操作完成后，读线程继续并发读取）
...

性能优势：

读多写少场景下，std::shared_mutex的性能远优于std::mutex（读线程无需互相阻塞）。
例如，100 个读线程和 1 个写线程的场景中，std::shared_mutex的吞吐量可能是std::mutex的数十倍。

三、锁的粒度与性能权衡

锁的粒度（Lock Granularity）指互斥量保护的临界区大小，直接影响并发性能。以下是两种典型策略的对比：

3.1 粗粒度锁（Coarse-Grained Lock）

定义：用一个锁保护大量共享资源或长临界区。

示例：粗粒度锁保护整个链表

#include <list>
#include <mutex>
#include <iostream>
#include <thread>
#include <chrono>

class CoarseList {
private:
    std::list<int> data;
    std::mutex mtx; // 一个锁保护整个链表

public:
    void add(int val) {
        std::lock_guard<std::mutex> lock(mtx);
        data.push_back(val);
        // 模拟耗时操作：遍历链表（扩大临界区）
        std::cout << "Add " << val << ", list size: " << data.size() << std::endl;
        std::this_thread::sleep_for(std::chrono::milliseconds(50)); // 模拟耗时
    }

    bool contains(int val) {
        std::lock_guard<std::mutex> lock(mtx);
        return std::find(data.begin(), data.end(), val) != data.end();
    }
};

int main() {
    CoarseList list;
    // 两个线程同时添加元素
    std::thread t1([&]() {
        for (int i = 0; i < 5; ++i) {
            list.add(i);
        }
    });
    std::thread t2([&]() {
        for (int i = 10; i < 15; ++i) {
            list.add(i);
        }
    });
    t1.join();
    t2.join();
    return 0;
}

运行结果：

Add 0, list size: 1
Add 10, list size: 2
Add 1, list size: 3
Add 11, list size: 4
...（线程交替执行，每次只有一个线程能操作链表）

优缺点

优点
- 实现简单，不易出错（锁数量少，死锁风险低）。
- 适合资源访问频率低或临界区短的场景。
缺点
- 并发度低，线程阻塞时间长（一个线程操作链表时，其他线程需等待）。
- 临界区越大，锁持有时间越长，性能越差。

3.2 细粒度锁（Fine-Grained Lock）

定义：用多个锁保护不同的共享资源或短临界区。

示例：细粒度锁保护链表节点

#include <memory>
#include <mutex>
#include <iostream>
#include <thread>
#include <chrono>

struct Node {
    int val;
    std::unique_ptr<Node> next;
    std::mutex mtx; // 每个节点一个锁

    Node(int v) : val(v) {}
};

class FineList {
private:
    std::unique_ptr<Node> head;
    std::mutex head_mtx; // 头节点锁

public:
    void add(int val) {
        auto new_node = std::make_unique<Node>(val);
        std::lock_guard<std::mutex> head_lock(head_mtx);
        new_node->next = std::move(head);
        head = std::move(new_node);
        std::cout << "Add " << val << " (thread: " << std::this_thread::get_id() << ")" << std::endl;
        // 模拟耗时操作：无需持有锁
        std::this_thread::sleep_for(std::chrono::milliseconds(50));
    }

    bool contains(int val) {
        Node* current = head.get();
        std::unique_lock<std::mutex> current_lock(head_mtx);
        while (current) {
            if (current->val == val) {
                return true;
            }
            Node* next = current->next.get();
            if (next) {
                std::unique_lock<std::mutex> next_lock(next->mtx);
                current_lock.unlock(); // 释放当前节点锁，避免死锁
                current = next;
                current_lock = std::move(next_lock); // 转移锁所有权
            } else {
                break;
            }
        }
        return false;
    }
};

int main() {
    FineList list;
    // 两个线程同时添加元素
    std::thread t1([&]() {
        for (int i = 0; i < 5; ++i) {
            list.add(i);
        }
    });
    std::thread t2([&]() {
        for (int i = 10; i < 15; ++i) {
            list.add(i);
        }
    });
    t1.join();
    t2.join();
    return 0;
}

运行结果：

Add 0 (thread: 140123456789000)
Add 10 (thread: 140123456789001)
Add 1 (thread: 140123456789000)
Add 11 (thread: 140123456789001)
...（线程并行执行，几乎无阻塞）

优缺点

优点
- 并发度高，线程阻塞时间短（不同节点可并行访问）。
- 适合资源访问频率高或临界区长的场景。
缺点
- 实现复杂，死锁风险高（需严格控制锁的获取顺序）。
- 锁数量增加，锁开销（如内存占用、上下文切换）增大。
- 调试困难，难以排查并发 Bug。

3.3 权衡原则

优先选择粗粒度锁：若性能满足需求，简单性更重要（避免过度设计）。
必要时细化锁粒度：当粗粒度锁成为性能瓶颈（如 CPU 利用率低、线程阻塞时间长），可考虑细粒度锁或读写锁。
避免过度细化：锁本身有开销，过度细化可能导致性能下降（如每个变量一个锁）。
最小化临界区：临界区应只包含必要的共享资源访问，避免在持有锁时执行 I/O、睡眠等耗时操作。
考虑锁的持有时间：若临界区执行时间长，即使锁粒度细，也可能导致其他线程长时间等待。
使用读写锁优化读多写少场景：std::shared_mutex是读多写少场景的 “性能利器”。

四、互斥量的常见陷阱与最佳实践

4.1 陷阱 1：死锁

死锁条件：

互斥条件：资源不可共享。
请求与保持条件：线程持有资源的同时请求新资源。
不剥夺条件：资源只能由持有者主动释放。
循环等待条件：线程间形成资源请求循环。

避免策略：

固定锁的获取顺序：所有线程按相同顺序获取锁（如按地址或 ID 从小到大）。
使用std::lock()一次性获取多个锁：std::lock(mtx1, mtx2)确保要么同时获取所有锁，要么都不获取，避免部分锁持有。
避免嵌套锁：若必须嵌套，确保顺序一致。
设置锁超时：使用std::timed_mutex或std::recursive_timed_mutex，超时后放弃锁并返回错误。
使用std::scoped_lock（C++17）：自动管理多个锁的获取顺序，避免死锁。

4.2 陷阱 2：锁竞争导致性能下降

表现：多线程程序的性能随线程数增加而下降（CPU 时间花在锁等待上）。

优化策略：

减少锁持有时间：临界区最小化，只包含必要的共享资源访问。
使用读写锁：读多写少场景下，std::shared_mutex可显著提高并发度。
考虑无锁数据结构：对于简单场景（如计数器），使用std::atomic替代互斥量，性能更高。
采用分区锁：将资源划分为多个分区，每个分区一个锁（如哈希表的分段锁）。
避免不必要的锁：若资源只在单线程中访问，无需加锁。

4.3 最佳实践

优先使用 RAII 锁管理：std::lock_guard或std::unique_lock，避免手动加解锁错误。
选择合适的互斥量类型

：
- 简单场景：std::mutex + std::lock_guard。
- 复杂场景：std::unique_lock + 条件变量。
- 读多写少：std::shared_mutex。
- 递归场景：谨慎使用std::recursive_mutex。
避免在持有锁时调用外部函数：外部函数可能隐藏锁操作，导致死锁。
使用std::atomic替代简单计数器：对于原子操作（如count++），std::atomic的性能优于互斥量。
测试并发性能：使用工具（如perf、Valgrind、Intel VTune）分析锁竞争情况，针对性优化。
文档化锁的使用：明确注释锁保护的资源范围和获取顺序，方便后续维护。

五、总结

互斥量是并发编程的基础工具，选择合适的互斥量类型和锁管理方式，是编写高效、安全并发程序的关键。以下是各类互斥量的适用场景总结：

互斥量类型	核心特点	适用场景
`std::mutex`	基础独占锁	简单临界区保护
`std::lock_guard`	RAII 自动管理，简单高效	锁生命周期与作用域一致
`std::unique_lock`	灵活锁管理	条件变量、延迟加锁、手动控制锁生命周期
`std::recursive_mutex`	支持递归加锁	递归函数或同一线程多次进入临界区
`std::shared_mutex`	读写分离，高并发读	读多写少场景（如缓存、配置文件）

核心原则：

安全优先：避免数据竞争和死锁，这是并发编程的底线。
性能优化：合理设计锁粒度，减少锁竞争，提高并发度。
简单易用：优先选择简单的同步工具，避免过度设计，降低维护成本。

掌握互斥量的使用，是进入并发编程世界的第一步。后续我们将探讨更多同步原语（如原子操作、信号量、栅栏），敬请期待！

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

一文读懂企业AI四阶段演进：从存文档到懂业务，理清智能化路线

从单纯存放文件的文档时代，到能够自主决策的认知智能时代，企业 AI 的四次演进，本质是 AI 与业务融合不断加深的过程。判断企业当前所处阶段，找准进阶方向，是每一位业务人员推进数智化转型的必备认知。当下，AIGC 内容生成已经成为行业基础能力，以向量空间 JBoltAI 为代表的 AIGS 技术范式，正在推动企业 AI 从 "工具应用" 走向 "体系重塑"。无论是尚在搭建文档与知识库的传统企业，还

2048 AI社区

万字长文之—学会写提示词

我们一般在使用大模型产品的时候，我们都是向大模型“提问”，大模型给出“答案”，如果阅读过OpenAI官方使用文档，你就会发现，在官方文档里，你是看不到question和answer这两个词的，我们能看到的是prompt和completion，翻译过来就是提示和补全，也就是说，我们向大模型提出的问题，其实是给大模型一个提示，让它进行补全，补全的内容就是大模型给我们输出的答案。为什么是提示和补全，而不