2025三掌柜赠书活动第四十四期 零基础自学AI应用开发
当前,人工智能(AI)技术正以前所未有的速度渗透至千行百业——从大模型研发到科学智能突破,从“AI+制造”的产业融合到具身智能的创新探索,持续推动社会生产力的变革与发展。7月26日至29日,2025世界人工智能大会(WAIC)在上海举办。
目录
前言
当前,人工智能(AI)技术正以前所未有的速度渗透至千行百业——从大模型研发到科学智能突破,从“AI+制造”的产业融合到具身智能的创新探索,持续推动社会生产力的变革与发展。7月26日至29日,2025世界人工智能大会(WAIC)在上海举办。本届大会以“智能时代 同球共济”为主题,汇聚全球人工智能领域的顶尖智慧,集中展示前沿技术成果,并深入探讨行业治理路径。大会期间,气象领域的“AI超级装备”成为关注焦点。其中,上海推出的“雨师”与“扶摇”两款AI气象预报模型,通过技术创新显著提升了灾害性天气的预警能力。
实际应用
据上海市气象局局长冯磊介绍,针对强对流天气突发性强、局地性强、破坏力大的特点,“雨师”模型可精准刻画雷暴单体的立体结构,将预警时效提前15至45分钟,为城市防灾减灾争取关键时间窗口;“扶摇”模型则聚焦中小尺度灾害性天气,尤其是短时强降水和雷雨大风,通过将气象预报更新频次从小时级提升至10分钟级,并实现街镇级预警精细度,进一步强化了基层防灾能力。中国气象局数据显示,部分AI模型的成效已在实际应用中得到验证。自2024年6月发布“风雷”“风清”“风顺”等“风”系列人工智能气象预报模型以来,短、中、长期预报的精准度显著提升,可在3分钟内生成覆盖未来15天、分辨率达25公里的全球气象预报产品,为全球气象服务提供了高效、精准的技术支撑。

学习AI应用开发的好处
显然,AI应用已不再局限于单一的技术竞赛,而是进入了从模型能力到平台构建再到场景落地的综合比拼期。这意味着,AI开发者不仅需要掌握先进的技术,还需要具备将技术应用于实际场景的能力。AI技术不断成熟,其应用领域也在不断拓宽。QuestMobile数据显示,2025年第三季度,我国移动端AI应用月活跃用户规模突破7亿,其中应用插件(In-App AI)用户量达7.06亿,同比增长9.3%,这反映出用户对“随手可得”AI能力的强烈需求。随着垂直领域精调能力提升与单位算力成本下降,AI正从“工具”进化为“共生伙伴”,在提升生产效率、优化资源配置、推动科学突破等方面展现了不可替代的作用。在此背景下,学习AI应用开发既能助力个人在数字化时代保持职业竞争力,也能让个人通过开发实用AI工具解决实际问题,推动技术普惠与社会进步。无论是从个人发展还是社会价值的角度,投身AI应用开发领域都具有重要的前瞻性和现实意义。

关于《零基础自学AI应用开发》
接下来给大家推荐一本关于AI应用开发的书籍,这是一本关于如何用Python快速落地AI项目的干货图书,一经上市就登上了当当“计算机与互联网”图书排行榜前列。本书从AI基础原理剖析讲起到实战技巧,助企业在日常智能化升级实战工作中轻松落地!另外,关注本文博主,点赞+收藏本文,且在本文评论区评论“入手AI”,将选取三名幸运读者送出纸质版《零基础自学AI应用开发》一本,截止时间:2025.12.19。入手《零基础自学AI应用开发》传送门:https://item.jd.com/14586209.html 或者 https://product.dangdang.com/29974454.html ,个人觉得这本书非常的不错,是一本不可多得的好书,值得拥有去学习。

编辑推荐
这是一本面向开发者的AI应用开发实战指南:
- 扎根入门技术人群:无须读者提前拥有大模型应用的开发经验,甚至无须读者事先掌握Python和JavaScript语言,就可以从零开始学习并掌握满足市场需求的大模型应用开发技能。
- 满足常见业务需求:涵盖RAG应用开发、工作流制作等常见业务场景,注重端到端交付,力求帮助开发者体验真实开发环境中的约束和挑战。
- 注重开发实战:参考行业趋势与社区共识进行技术选型,试图弥补从开发环境到生产环境的鸿沟,不仅关注功能实现,而且会展示如何将其部署上线,对其进行运维。
- 拥有技术广度:采用不同技术框架来开发不同类型的大模型应用,力求展现大模型应用开发领域的全貌及各类实践,为读者提供全面的实践视角,避免局限于单一技术栈。
内容简介
本书旨在用传统前后端开发过程中开发者熟悉的词汇与术语对AI应用开发的专业知识进行深入浅出的讲解,使开发者能够从0到1入门AI应用开发。本书不拘泥于讲解单一编程语言、单一模型和单一框架,而是尽可能完整地展现不同技术方案的优劣、技术选型时的考量和技术生态的全貌。书中涵盖当下多种热门类型AI应用的开发,从OpenAI API调用到RAG开发,从MCP服务器创建到智能体开发。本书的内容编排循序渐进,前半部分聚焦“入门”,通过控制代码复杂度及详细的基础知识讲解,帮助读者快速熟悉AI应用开发中的概念与常见模式;后半部分聚焦“进阶”,将向量数据库、第三方云服务等技术组件引入示例,并尝试通过构建完整的端到端应用将知识点串起来。此外,本书不仅包含业务代码,还涉及AI应用的调试、监控、部署乃至最佳实践,力求带给读者可工作的上线代码。
本书非常适合想用AI提升产品竞争力的前后端开发者、需要进行快速概念验证的技术经理与创业者,以及希望将大模型接入现有系统的架构师与运维工程师阅读。读者无须拥有与AI应用开发相关的经验,无须掌握Python或者Node.js编程语言,只要具有编程基础知识即可畅读本书。
作者简介
李光毅
曾就职于爱奇艺、百度、知乎等大型互联网公司,目前就职于Thoughtworks,任高级咨询师。从事软件开发工作超过10年,具备丰富的大型系统架构设计和团队管理经验。著有《高性能响应式Web开发实战》,译有《编程原则》。现为播客“程序员新声”主播,其个人公众号为“技术圆桌”。
图书目录
目 录
第 1章 理解模型 1
1.1 如何学习“魔法” 1
1.2 Teachable Machine 2
1.2.1 打造自己的模型 3
1.2.2 部署代码 6
1.3 线性模型 9
1.3.1 机器学习是如何工作的 9
1.3.2 代码实现 12
1.4 神经网络雏形 13
1.4.1 使用代码实现 14
1.4.2 为什么需要神经“网络” 17
第 2章 环境配置与基础语法 18
2.1 配置Python环境 18
2.1.1 安装Python 18
2.1.2 配置虚拟环境 21
2.1.3 类库管理 24
2.2 Python快速入门 25
2.2.1 运行Python脚本 25
2.2.2 数据类型 25
2.2.3 缩进 27
2.2.4 函数的定义和使用 27
2.2.5 模块的使用 27
2.2.6 推导式 28
2.2.7 类型注解 28
2.3 配置Node.js环境 29
2.3.1 在macOS系统和Windows系统中安装Node.js 29
2.3.2 在Ubuntu系统中安装Node.js 30
2.4 Node.js快速入门 31
2.4.1 运行Node.js脚本 31
2.4.2 动态类型语言 31
2.4.3 package.json文件 32
2.4.4 Node.js模块系统 32
2.4.5 类库管理 33
2.4.6 异步编程 34
2.5 其他应知内容 36
2.5.1 cURL 36
2.5.2 YAML 37
第3章 制作一款音频转录工具 40
3.1 区分OpenAI、ChatGPT与大模型 40
3.2 集成OpenAI SDK 41
3.2.1 创建API密钥 41
3.2.2 使用API密钥 43
3.2.3 使用API密钥的注意事项 45
3.3 初试OpenAI SDK 45
3.3.1 发送请求 45
3.3.2 返回结果解析 46
3.3.3 计算token数量 49
3.4 通过REST风格的API调用OpenAI API 50
3.5 使用OpenAI SDK转录音频 52
3.5.1 读取音频文件 52
3.5.2 标记转录文字的时间戳 54
3.6 安装自己的Whisper模型 58
3.6.1 在本地安装Whisper模型 58
3.6.2 以命令行的方式运行Whisper 58
3.6.3 在代码中使用Whisper模型 60
第4章 AI助手开发 61
4.1 AI助手 61
4.1.1 创建AI助手 61
4.1.2 函数是如何工作的 64
4.1.3 调用AI助手 65
4.1.4 通过第三方获取城市气温 69
4.2 打造播客摘要生成助手 71
4.2.1 什么是播客摘要生成助手 71
4.2.2 创建播客摘要生成助手 71
4.2.3 响应OpenAI的流式返回 73
4.2.4 使用助手 75
4.3 创建HTTP服务器 76
4.3.1 引入Express.js 76
4.3.2 实现文件上传 78
4.3.3 完善路由 81
4.3.4 提升代码的健壮性 84
4.4 使用代码管理AI助手 85
4.4.1 引入GitHub Actions 86
4.4.2 编写工作流 87
4.4.3 编写部署脚本 91
4.4.4 看懂工作流 93
4.5 部署上线 94
4.5.1 创建守护进程 95
4.5.2 准备服务器 97
4.5.3 通过GitHub Actions部署上线 101
4.5.4 验证服务 103
第5章 使用Haystack开发AI应用 108
5.1 重新认识框架 108
5.1.1 为什么需要框架 108
5.1.2 何谓好的框架 109
5.1.3 也许你不需要框架 110
5.2 为什么选择Haystack 112
5.2.1 为什么不推荐LangChain 112
5.2.2 其他框架 115
5.2.3 迎接Haystack 117
5.3 初试Haystack 119
5.3.1 基本概念 119
5.3.2 初试组件与流水线 119
5.3.3 自定义组件 122
5.4 使用Haystack重构播客助手 124
5.4.1 使用Haystack进行重构 125
5.4.2 使用Gemini替代GPT模型 128
5.5 启用Haystack日志 132
5.6 启用Haystack追踪 136
5.6.1 启用追踪 136
5.6.2 与OpenTelemetry集成 138
5.6.3 与Langfuse集成 142
第6章 RAG应用开发 148
6.1 初试RAG技术 148
6.1.1 使用Chroma实现语义化搜索 149
6.1.2 元数据过滤 151
6.1.3 与OpenAI配合 153
6.2 向量数据库原理 154
6.2.1 余弦相似度 154
6.2.2 文本嵌入 156
6.2.3 对Chroma进行嵌入配置 157
6.3 长文本处理 159
6.3.1 分割数据 160
6.3.2 固定大小的分块策略 160
6.3.3 基于文档结构的分块策略 162
6.3.4 递归式分块策略 166
6.4 使用Haystack实现流水线 168
6.4.1 索引流水线 168
6.4.2 查询流水线 170
6.4.3 简化流水线 172
6.5 拓展流水线 173
6.5.1 索引数据 173
6.5.2 优化数据检索 179
第7章 接入第三方AI服务 184
7.1 Hugging Face 184
7.1.1 注册Hugging Face 184
7.1.2 调用Hugging Face推理服务 187
7.1.3 与Haystack集成 189
7.1.4 Hugging Face的服务类型 189
7.2 Together AI 190
7.2.1 注册Together AI服务 191
7.2.2 访问推理服务 193
7.2.3 函数调用 194
7.3 Pinecone 198
7.3.1 注册Pinecone 199
7.3.2 使用Pinecone 200
7.4 Cohere 207
7.4.1 注册Cohere 208
7.4.2 调用Cohere推理服务 209
7.4.3 在Haystack中使用Cohere模型 212
7.5 Railway 214
7.5.1 需要解决的问题 214
7.5.2 使用Railway部署我们的服务 215
7.6 博客存储流水线 220
7.6.1 下载文章 220
7.6.2 组装流水线 223
7.6.3 部署服务 225
第8章 微调模型 228
8.1 在OpenAI中进行微调 228
8.1.1 准备训练数据 228
8.1.2 通过界面进行微调 229
8.2 使用Google AI进行微调 234
8.2.1 使用Vertex AI Studio进行微调 234
8.2.2 通过API进行微调 240
第9章 智能体开发入门 244
9.1 OpenAI智能体 244
9.1.1 第 一个简单的智能体 244
9.1.2 任务转移 245
9.1.3 调用工具 246
9.1.4 借用智能体对播客摘要生成助手进行重构 249
9.2 自定义智能体处理流程 251
9.3 利用Cohere的Command模型开发智能体 255
9.3.1 准备工作 255
9.3.2 编写智能体 258
9.4 护栏 262
9.4.1 输入护栏 262
9.4.2 输出护栏 264
9.4.3 第三方护栏 265
9.5 模型上下文协议 268
9.5.1 MCP架构 268
9.5.2 MCP工具 269
9.5.3 使用已有的MCP服务器 272
第 10章 使用LangGraph构建智能体 276
10.1 一个简单的LangGraph应用 276
10.1.1 创建图对象 277
10.1.2 添加节点 278
10.1.3 stream_mode 279
10.2 在LangGraph中使用工具 280
10.2.1 简单的工具调用 280
10.2.2 复杂的工具调用 283
10.3 子图机制 285
10.3.1 简单子图 285
10.3.2 参数不兼容的情况 288
10.3.3 使用LangSmith对数据流进行 追踪 289
10.4 任务转移 291
10.4.1 智能体间的任务转移 291
10.4.2 监督者模式 294
10.5 一个复杂的图 296
10.5.1 在向量数据库中搜索 298
10.5.2 在网络上搜索 300
10.5.3 连接图 303
10.6 添加前端界面 305
10.6.1 LangGraph服务 305
10.6.2 前端 308
10.7 实现人机交互 312
10.7.1 简单的人机交互 312
10.7.2 借助CopilotKit实现人机 交互 314
精彩书评
软件开发的范式正经历深刻变革,我们也正从钻研单一技术的“工匠”加速转变为善用工具、整合服务的“架构师”。这本书正是对这场变革的忠实记录与深刻洞见。我见证了本书作者从云开发到AI时代软件开发的探索与沉淀,他将自己走过的弯路与宝贵经验,通过精准且带有温度的文字真诚地呈现给每位处于角色转变中的开发者。这是一本帮助开发者理解当下、拥抱未来的指南。
——张凯峰,微软大中华区市场部数字营销与内容专家
这本书巧妙地将AI应用开发与传统前后端开发概念相融合,极大地降低了学习门槛。它涵盖了OpenAI API调用、RAG开发、MCP服务器创建,以及智能体开发等当下热门类型AI应用的开发,尤其注重开发实战。书中提供了丰富的代码,深入探讨了应用的调试、监控、部署及健壮性等工程实践,还通过Python和Node.js示例对比不同技术方案的优劣,帮助读者全面理解AI生态。对追求高效能的团队来说,这是一本从0到1开发生产级AI应用的宝贵指南。
——姚琪琳,Thoughtworks资深咨询师、敏捷技术教练、《整理优先》等书译者
在技术探索的旅程中,深入理解往往比单纯掌握更令人心潮澎湃。身处AI技术发展的洪流之中,与其忧虑被AI取代,不如将其作为一种技术来学习、理解并运用。如果你是一位开发者,面对浩如烟海的资料踌躇不前,不妨从本书开始动手实践。它不仅能让你鸟瞰AI世界,更能引导你从最熟悉的应用开发入手,体会AI如何成为自己的得力助手。相信通过阅读和实践,你不仅能重拾初涉技术领域时的那份悸动与热忱,更能在AI时代站稳脚跟,放眼未来。
——刘夏,C#技术专家、《C# 10核心技术指南》译者
传统应用开发者如何在这个AI崛起的时代自处?我们常常会迷失在实现细节、技术框架或眼花缭乱的推荐示例中。这本书以“拆解魔法”为核心理念,汇集数个完整的实战案例,从Whisper模型部署到智能体开发,带领读者“不只写示例,更写产品”,让AI对于传统开发者不再是“魔法”,而是成为日常工具。这不仅是一部技术手册,更是打通AI落地最后一公里的工程技术指南,让AI零基础开发者也能端到端交付产品级AI应用。
——王瑞鹏,《C++高性能编程》《Effective TypeScript》译者
《零基础自学AI应用开发》全书速览

结束语
未来,AI应用必将成为推动社会各领域变革的核心力量,从优化生产流程、提升公共服务效率,到创新科研模式、重塑生活方式,其渗透力和影响力将持续扩大。《零基础自学AI应用开发》带你“零门槛入门”AI应用开发,助你“全流程覆盖”技能树。如果你是想用AI提升产品竞争力的前后端开发者,已经具备一定的编程基础和技术栈知识。通过学习本书,你可以用已经熟悉的语言和工具,将先进的AI能力转化为可上线、可扩展、可盈利的产品。如果你是需要进行快速概念验证的技术经理与创业者,需要在短时间内验证技术概念的可行性。通过书中的实战案例和快速上手指南,你可以迅速理解AI应用开发的流程和要点,为产品落地提供技术支持。如果你是希望将大模型接入现有系统的架构师与运维工程师,已经具备一定的系统架构和运维经验。通过学习本书,你可以了解如何将大模型接入现有系统、提升系统的智能化水平,并解决实际运维中遇到的问题。
更多推荐


所有评论(0)