新书速览|大模型应用开发

西安电子科技大学教授，博导，计算机学会高级会员。，内容包括大模型基础、大模型架构、多模态大模型、提示词工程、大模型微调、检索增强生成、AI智能体、大模型应用、大模型应用架构、大模型开发框架、法律咨询智能助手、代码修复智能助手。系统整合大模型与应用开发技术体系，从大模型基础，到大模型应用开发技术，到大模型应用开发方法，再到大模型应用开发工程案例，全面构建的大模型应用开发技术的完整知识图谱。，西安交通

全栈开发圈

918人浏览 · 2025-09-16 15:58:09

全栈开发圈 · 2025-09-16 15:58:09 发布

西电博导鲍亮与西交博导李倩诚意之作，详解大模型应用开发构建方法、过程、工具和案例

本书内容

《大模型应用开发》系统梳理大模型应用开发的全链条知识，详解大模型应用开发过程中涉及到的理论、技术、方法、过程、工具和分析案例，为开发者搭建从理论到实践的桥梁，助力解决技术落地中的实际问题，推动大模型在工业、科研、服务等领域的规模化应用，配套示例源码、PPT课件、配图PDF文件、读者微信交流群。

《大模型应用开发》共分12章，内容包括大模型基础、大模型架构、多模态大模型、提示词工程、大模型微调、检索增强生成、AI智能体、大模型应用、大模型应用架构、大模型开发框架、法律咨询智能助手、代码修复智能助手。

本书作者

鲍亮，西安电子科技大学教授，博导，计算机学会高级会员。研究方向为大数据分析和大模型应用技术。主持各类科研项目50余项，科研成果转化直接经济效益2亿元，发表高水平论文30余篇，出版相关专著4本。

李倩，西安交通大学教授，博导。研究方向为金融大数据、金融科技、公司金融。主持国家及省部级课题10余项，发表高水平论文40余篇。

本书读者

l 大模型应用初学者

l 大模型应用开发人员

l 大模型应用研究人员

l 行业AI解决方案提供商

l 高等院校或高职高专院校人工智能大模型课程的学生

本书目录

向上滑动阅览

第1章大模型基础1

1.1 语言模型基础1

1.1.1 基于统计方法的语言模型2

1.1.2 基于循环神经网络的语言模型5

1.1.3 基于Transformer架构的语言模型10

1.2 大模型发展历史14

1.2.1 统计语言模型奠基期14

1.2.2 神经网络语言模型探索期15

1.2.3 Transformer架构革命期15

1.2.4 大模型爆发增长期15

1.3 大模型的特点18

1.3.1 大模型的快思慢考18

1.3.2 大模型的优势与不足20

1.4 大模型行业应用场景中的优势与挑战21

1.4.1 教育领域：智能教育的革新与困境21

1.4.2 医疗领域：精准医疗的希望与隐忧22

1.4.3 金融领域：智能金融的变革与挑战22

1.4.4 电商领域：智能营销的机遇与难题23

1.5 本章小结23

1.6 参考文献24

第2章大模型架构28

2.1 Encoder-Only架构28

2.1.1 BERT模型29

2.1.2 RoBERTa模型33

2.1.3 ALBERT模型34

2.1.4 ELECTRA语言模型34

2.2 Decoder-Only架构35

2.2.1 GPT系列语言模型36

2.2.2 LLaMA模型38

2.2.3 PaLM模型39

2.3 Encoder-Decoder架构40

2.3.1 T5模型41

2.3.2 BART语言模型43

2.3.3 GLM模型45

2.3.4 Switch Transformer46

2.4 编码器、解码器、编解码器架构对比47

2.5 本章小结49

2.6 参考文献49

第3章多模态大模型53

3.1 多模态大模型基础53

3.1.1 多模态大模型的定义与特征54

3.1.2 多模态学习与单模态学习的区别55

3.1.3 多模态大模型的基本架构57

3.1.4 多模态对齐与融合技术简述61

3.2 多模态大模型的发展历程63

3.2.1 特征拼接与浅层交互模型阶段63

3.2.2 融合与对齐阶段64

3.2.3 大规模预训练阶段64

3.2.4 通用多模态大模型阶段65

3.3 多模态大模型介绍66

3.3.1 CLIP66

3.3.2 ALIGN67

3.3.3 Flamingo68

3.3.4 PaLI69

3.3.5 BLIP270

3.3.6 LLaVA71

3.3.7 VisCPM72

3.3.8 ChatGPT-4V和GPT-4o73

3.3.9 Qwen-VL和Qwen-VL-Max74

3.3.10 Gemini+2.575

3.4 多模态大模型的应用场景76

3.4.1 智能问答与对话系统76

3.4.2 智能推荐与搜索76

3.4.3 医疗影像与辅助诊断77

3.4.4 内容生成与编辑77

3.5 本章小结77

3.6 参考文献77

第4章提示词工程81

4.1 技术介绍81

4.1.1 提示词工程的概念和作用81

4.1.2 提示词应用示例83

4.2 研究进展85

4.2.1 零样本提示86

4.2.2 少样本提示——以例示教的智慧89

4.2.3 思维链提示91

4.2.4 思维树——多路径探索的高级推理93

4.2.5 检索增强生成——知识外挂的智能问答95

4.2.6 ReAct框架——推理与行动的协同范式98

4.3 框架对比101

4.3.1 开源框架101

4.3.2 商用框架105

4.3.3 框架对比全景表106

4.3.4 小结与展望106

4.4 本章小结107

4.5 参考文献107

第5章大模型微调109

5.1 大模型微调基础109

5.1.1 微调定义109

5.1.2 微调分类110

5.1.3 微调技术历史沿革111

5.2 微调流程113

5.2.1 数据集准备114

5.2.2 模型初始化114

5.2.3 训练环境配置114

5.2.4 模型微调115

5.2.5 评估验证115

5.2.6 部署上线116

5.2.7 监控维护116

5.3 微调的主流平台和框架116

5.3.1 Hugging Face Transformers116

5.3.2 LLaMA-Factory117

5.3.3 Unsloth118

5.3.4 MS-SWIFT119

5.3.5 百度千帆平台120

5.3.6 阿里云PAI121

5.3.7 讯飞星辰122

5.3.8 对比分析123

5.4 本章小结126

5.5 参考文献126

第6章检索增强生成129

6.1 概念与内涵剖析129

6.1.1 RAG定义130

6.1.2 关键组件与工作原理130

6.1.3 与传统生成模型的区别与优势132

6.1.4 应用领域与实际案例133

6.2 技术演进与研究进展134

6.3 相关商用与开源框架对比140

6.3.1 LangFlow141

6.3.2 LlamaIndex142

6.3.3 Haystack144

6.3.4 LangChain145

6.3.5 Amazon Kendra146

6.3.6 Google Cloud Search148

6.3.7 框架优缺点对比149

6.3.8 RAG框架总结150

6.4 本章小结150

6.5 参考文献152

第7章 AI智能体155

7.1 AI智能体的概念与内涵156

7.1.1 AI智能体时代的开启156

7.1.2 AI智能体的核心概念与特征158

7.2 AI智能体核心技术与发展161

7.2.1 智能体的构建：核心模块与基本架构162

7.2.2 单智能体系统研究进展167

7.2.3 多智能体系统研究进展170

7.2.4 智能体的演进：自主优化与自我学习175

7.3 智能体构建与实践180

7.3.1 智能体构建框架的必要性与分类180

7.3.2 LangGraph：基于图结构的Agent编排框架181

7.3.3 AutoGen：多智能体协作的利器183

7.3.4 CrewAI：通过协作提升团队效率184

7.3.5 Dify：LLM应用一站式开发平台185

7.3.6 n8n：强大的工作流自动化与集成工具186

7.3.7 扣子：一站式AI Agent/Bot开发平台188

7.3.8 框架对比189

7.4 本章小结192

7.5 参考文献192

第8章大模型应用195

8.1 大模型应用概念解析195

8.1.1 大模型应用的定义195

8.1.2 与传统应用系统的比较分析198

8.1.3 大模型应用内涵：基本结构与关键组件201

8.1.4 大模型应用外延与分类视角204

8.2 大模型应用范式208

8.2.1 嵌入式209

8.2.2 协同式210

8.2.3 自主式211

8.3 大模型应用开发流程213

8.3.1 需求理解与问题建模213

8.3.2 系统架构与模型接口设计216

8.3.3 智能模块设计与行为调控218

8.3.4 测试与质量评估221

8.3.5 部署上线与模型服务策略224

8.3.6 监控与运维反馈227

8.4 大模型应用典型产品232

8.4.1 智能检索工具232

8.4.2 编程辅助与代码生成235

8.4.3 文档处理与写作辅助238

8.4.4 多模态内容生成241

8.5 大模型应用面临的关键挑战244

8.5.1 模型能力的不确定性与幻觉问题244

8.5.2 交互控制与响应可解释性246

8.5.3 安全性、合规性与伦理问题247

8.5.4 应用部署的资源与算力瓶颈249

8.6 本章小结251

8.7 参考文献252

第9章大模型应用架构255

9.1 大模型应用架构概述255

9.2 大模型应用架构层次256

9.3 基础设施层和运行环境层258

9.3.1 基础设施层259

9.3.2 运行环境层259

9.4 数据层260

9.4.1 核心组件260

9.4.2 管理和支撑机制261

9.5 模型层261

9.5.1 大模型262

9.5.2 向量模型263

9.5.3 重排序模型265

9.5.4 图像识别模型267

9.5.5 语言-语言模型268

9.5.6 模型微调272

9.6 推理部署层273

9.7 能力层275

9.7.1 流程控制275

9.7.2 核心功能276

9.8 安全层278

9.9 应用层279

9.9.1 智能问答280

9.9.2 智能运维280

9.9.3 智能客服280

9.9.4 数字员工281

9.10 本章小结281

9.11 参考文献282

第10章大模型开发框架284

10.1 开发框架整体结构284

10.2 数据层286

10.2.1 向量数据库287

10.2.2 文档解析引擎298

10.2.3 数据处理工具303

10.3 模型层304

10.3.1 开源模型305

10.3.2 微调技术栈307

10.4 推理层313

10.4.1 推理引擎314

10.4.2 本地化部署319

10.5 工具链层323

10.5.1 开发框架325

10.5.2 增强组件329

10.6 接口层331

10.6.1 API网关332

10.6.2 通信协议333

10.7 应用层336

10.7.1 低代码开发平台337

10.7.2 具体开发平台338

10.8 本章小结342

10.9 参考文献342

第11章法律咨询智能助手345

11.1 需求分析345

11.2 系统架构346

11.2.1 系统功能模块346

11.2.2 系统架构设计347

11.3 关键技术348

11.3.1 法规文档预处理348

11.3.2 自动构建法律法规知识图谱349

11.3.3 案例特征要素提取351

11.3.4 实体对齐352

11.3.5 法条检索352

11.3.6 法条检查353

11.3.7 历史案例库构建算法354

11.3.8 案件审理结构化报告生成356

11.4 系统实现357

11.4.1 法规文档预处理的实现357

11.4.2 自动构建法律法规知识图谱的实现358

11.4.3 案例特征要素提取的实现364

11.4.4 实体对齐的实现365

11.4.5 法条检索的实现367

11.4.6 法条检查的实现369

11.4.7 历史案例库构建算法的实现372

11.4.8 案件审理结构化报告生成373

11.5 本章小结374

11.6 参考文献374

第12章代码修复智能助手376

12.1 需求分析376

12.2 系统架构378

12.2.1 业务架构378

12.2.2 技术架构381

12.3 关键技术383

12.3.1 代码问题精确定位技术384

12.3.2 深度代码语义理解技术385

12.3.3 多模态信息智能融合技术386

12.3.4 增量学习与知识迁移技术387

12.3.5 基于强化学习的修复策略优化技术388

12.3.6 智能代码生成技术389

12.3.7 基于程序分析的漏洞检测技术389

12.4 系统实现390

12.4.1 Issue智能解析模块390

12.4.2 代码依赖关系分析模块392

12.4.3 智能修复策略生成模块395

12.4.4 自动化测试验证模块396

12.4.5 持续学习与优化模块397

12.5 本章小结399

12.6 参考文献400

编辑推荐

（1）作者很专业。鲍亮是西安电子科技大学教授，博士生导师，中国计算机学会高级会员。李倩是西安交通大学博士，西安交通大学教授，博士生导师。

（2）内容很实用。面向大模型应用开发的实践者和研究者，针对大模型应用开发构建方法、过程、工具和案例进行介绍。

（3）案例可借鉴。围绕法律咨询智能助手和代码修复智能助手两个开发案例，介绍具体项目的需求分析、系统架构、关键技术与实现方法，帮助读者系统掌握大模型应用开发方法。

（4）讲解很全面。系统整合大模型与应用开发技术体系，从大模型基础，到大模型应用开发技术，到大模型应用开发方法，再到大模型应用开发工程案例，全面构建的大模型应用开发技术的完整知识图谱。

（5）资源也不错。配套示例源码、PPT课件、配图PDF文件、读者微信交流群。

本书特色

本文摘自《大模型应用开发》，获出版社和作者授权发布。

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

AI赋能自动驾驶：多传感器数据融合新突破

传感器数据融合面临的主要挑战包括数据异构性、时间同步、空间校准以及噪声处理。多传感器数据融合是自动驾驶系统的核心技术之一，随着人工智能算法的进步和计算硬件的提升，融合效果将不断提高，推动自动驾驶技术向更高水平发展。多传感器数据融合通常分为三个层次：数据级融合、特征级融合和决策级融合。特征级融合提取各传感器的特征后进行融合；这些传感器产生的数据具有不同的模态、精度和更新频率，需要通过人工智能技术进行

2048 AI社区

后端 Kubernetes 部署：容器编排与服务发现实战

await async2() // 这一句会同步执行，返回 Promise ，其中的 `console.log('async2')` 也会同步执行。Promise.resolve().then(() => { // 返回 rejected 状态的 promise。Promise.resolve().then(() => { // 返回 rejected 状态的 promise。console.lo