大模型的自信度，里程碑式的改进

本文介绍了大模型概念自信度，自信度在哪些领域可以得到应用，自行度和熵的区别，和自信度对算力的优势。

juhanishen

687人浏览 · 2025-08-30 13:22:37

juhanishen · 2025-08-30 13:22:37 发布

本文都是独立创作的，本文的前半部分是参加了网红博客的解释，后半部分为独立研究。

1. 自信度简介

改进点：

最近Meta的工程师，提出了大模型的自信度这篇文章，它大大消除了大模型的一些弱点，比如：

有时，第一次提问目前的大模型回答A，第二次相同的提问，大模型回答B，所以，这个想象在改进后将消除。
这个改进也将消除大模型的幻想，也就是大模型不按照事实来回答。

概念：

大模型的自信度就是大模型对回答的正确度打分，分数越高，大模型继续生成答案，分数低，就是大模型对自己的回答没有信心，大模型就可能中断回答的产生。

应用：

自信度在很多场合能有非常大的应用，本文列举三种改进场合：

1. 医疗领域，当回答的自信度不够时，大模型会告诉医生选择其他方式或工具。

2. 自动驾驶领域：当大模型提出的动作自信度不高时，它提醒人为介入。

3. 教师自动教案编写，当大模型的自信度不高时，它提议老师请您用其他参考文献。

2. 熵和自信度的区别

熵的概念

熵就是模糊度，熵值越低，说明确定率越高，模糊度越低，确定越强。熵值越高，说明模糊度很大，不确定性高。

问题：

既然大模型产生下一个词也有熵值，为什么还要自信度，两者有什么区别？

熵和自信度的区别

在大模型中，在产生下一个词中，会有熵值产生，来说明产生的下一个词的把握度，只是针对下一个词的。不是针对回答本身。所以，熵值和自信度有很大区别。

3. 自信度对算力的优势

通常，大模型对一个提问有时需要产生很多种回答，然后选择其中一种。因为有自信度，一些回答的链路因为自信度低，直接被淘汰了，也就不消耗算力了。这大大节省了算力。所以，引进自信度使大模型效率提升了。

4. 参考：

Deep think with confidence：Yichao Fu , Xuewei Wang, Yuandong Tian, Jiawei Zhao

可以通过链接下载。https://arxiv.org/pdf/2508.15260

5. 后续：

怎样产生自信度的方法，请读者自行查阅相关文献。这也是笔者的后续工作。

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

基于ssm+vue的hi运动健身网站

2048 AI社区

OpenClaw最新版本差异对比与安装指南

OpenClaw 2026.3.12版本实现重大突破，原生支持MiniMax、Moonshot AI等四大国产大模型，无需配置Endpoint即可直接使用。新版移除了vLLM推理引擎，简化50%配置流程，提升35%调用效率。安装需Node.js≥22.0.0，推荐通过国内镜像源加速。新增中文支持包和基础技能套件，支持一键安装与升级。常见问题解决方案包括Node.js版本升级、模型选择配置等。该版本