有哪些关于AI大模型的书籍可供推荐?

大语言模型是近年来比较流行的一个方向,市场中急需有丰富开发经验的AI人员,如何入门AGI?大语言模型就业前景怎么样?接下来,我收集资料,推荐几本入门书籍。

一、编程语言

Python

《Python编程:从入门到实践》[美] Eric Matthes Python作为人工智能领域的首选语言,这本书将带你从零开始学习Python编程,为后续的大模型学习打下坚实的基础。

在这里插入图片描述

《Python深度学习》【美】Keras之父、现任Google人工智能研究员的Franc.ois Chollet执笔,详尽展示了用Python、Keras、TensorFlow进行深度学习的探索实践,涉及计算机视觉、自然语言处理、生成式模型等应用。

《Python深度学习:基于PyTorch》核心作者在大数据和人工智能领域有着超过20年的工作经验,实战经验丰富。

《Python深度学习 基于TensorFlow》本书从Python和数学基础,到机器学习和TensorFlow理论,再到深度学习的应用和扩展,为深度学习提供全栈式内容解决方案。

编程语言C

《C语言程序设计》【美】Brian W.Kernighan;Dennis M.Ritchie·

《C Primer Plus》【美】Stephen Prata,入门书籍·

C++

《C++ Primer Plus》【美】Stephen Prata,入门书籍

《C++ Primer》【美】Stanley B.Lippman;Josée Lajoie;Barbara E.Moo,进阶书籍

数据结构与算法

《数据结构与算法分析——C语言描述》【美】Mark Allen Weiss·

《算法导论》【美】Thomas H.Cormen;Chales E.Leiserson;Ronald l.Rivest·

《我的第一本算法书》【日】宫崎修一;石田保辉,入门书籍,无代码进行图解·

《算法图解:像小说一样有趣的算法入门书》【美】Aditya Bhargava

计算机组成原理方面

《计算机程序的构造和解释》【美】Harold Abelson、 Gerald Jay Sussman、Julie Sussman ,译者是裘宗燕。

二、数学类

《深度学习数学基础》

作者:[日] 斋藤康毅
简介:深度学习背后的数学原理对于理解大模型至关重要。本书以浅显易懂的方式介绍了线性代数、概率论和微积分等基础知识。

在这里插入图片描述
👉这几本书籍(PDF版)获取方式:
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

在这里插入图片描述

三、机器学习

1)机器学习入门:《机器学习实战》

作者:Peter Harrington
简介:通过实际案例引导读者学习机器学习的核心概念和算法,为进一步深入大模型的学习提供必要的知识储备。

在这里插入图片描述

2)深度学习理论与实践:《深度学习》

作者: Ian Goodfellow、Yoshua Bengio 和 Aaron Courville
简介: 被誉为深度学习领域的"圣经",系统地介绍了深度学习的理论和实践,是深入理解大模型不可或缺的一本书籍。

在这里插入图片描述

3)《机器学习公式详解》

在这里插入图片描述

两年前,Datawhale开源项目南瓜书发布,受到全网转发,两年后,南瓜书完整版正式撒花完结,重磅出版。从基础公式解析到难点探讨,无论你数学功底如何,都可以在南瓜书里找到你想要的。

“南瓜书”系 Datawhale成员自学笔记,对“西瓜书”中250个重难点公式做了详细解析和推导(重难点公式覆盖率达99%)),旨在解决机器学习中的数学难题。

4)Neural Networks and Deep Learning(NNDL)

图片

Michael Nielsen 的 Neural Network and Deep Learning[3]至今仍然是我推荐入门学习深度学习的第一选择,本书高屋建瓴,有着对深度学习的真正理解。

You need to understand the durable, lasting insights underlying how neural networks work. Technologies come and technologies go, but insight is forever. —— Michael Nielsen

本书先是从理论上把基于梯度下降的优化过程讲清楚,之后写代码从零开始构建神经网络。条理清晰,层次分明,没有回避任何问题。

5)Neural Networks from Scratch in Python(NNFS)

图片

如果说 Michael Nielsen 的 NNDL 是高屋建瓴,站在足够的高度为读者展示整个 NN 的蓝图,那么这本 NNFS[4] 就是踩在坚实的大地上,为读者提供蓝图中的每一处事物并带领你亲身去体验。其实 NNDL 本身也已经包含了很多 NNFS 提供的内容,但是后者更加具体一些。

优点: From Scratch 是透彻理解一个事物的最直接有效的办法,前提是真的 From Scratch; NN 的 Forward 部分讲的比较详细,逻辑清晰,代码简洁; 对 Nonlinear(Activation function) 的讲解细致,其中部分应该是参考了 Michael Nielsen, Neural Networks and Deep Learning 中Chap4 A visual proof that neural nets can compute any function 的内容。两者可以互为参考; Chap9 Backpropagation 写的极为细致清晰,应该是我目前看到的最为清晰的 BP 讲解与实现,层层递进,引人入胜;Chap10 Optimizers 算是差强人意,对各个优化器 motivation 的讲解较为清晰,代码写的也比较好。比较可惜的是没有放任何公式…这些公式又不难,贴上来对着代码讲一下会好很多;Chap18 Model Object,Chap21 Saving and Loading Models and Their Parameters 都写的不错,条理清晰,代码也是一步步地讲解

缺点: Chap6,7,8 中对 Calculus(Derivative, Gradient 等) 的讲解有些繁琐,且稍显粗浅;Chap11, 12, 13 分三章讲 Testing Data/Validation Data/Training Data, 每章几页草草了事,大可不必…不过能提到 data leakage 也算是弥补回来一点。

6)Dive into Deep Learning(D2L)

图片

这本书我看的版本比较早,大概 2021 年前后读完此书,当时还是 0.7.1 版本,代码全是 MXNet 实现的。当时给这本书的评价是“非常全面的一本书,深入浅出,通俗易懂,值得多翻。”最近版本好像已经添加了 PyTorch 和 TensorFlow 的代码实现。不过也没有仔细对比内容就不做评价了。需要注意一点就是,本书是有中文版的,但是质量是真的差,建议还是看英文版。

7)Grokking Deep Learning

图片

如果你的数学和我一样都不太好,而且上面的书看起来还是比较吃力,那么从这本书入手可能比较好。先说重点,建议只看前六章。本书前 6 章写的极其友好,很适合没有任何 DL 基础的人从零开始学起。印象比较深刻的就是把 NN 比作一个机器,NN 中各个参数比作一个个的旋钮,我们的任务其实就是不断调节各个旋钮的值使得机器按照我们预期的方式工作。这是一个非常恰当的例子,也几乎贯穿整本书的介绍。

本书的第 7, 8 章写的还算可以,中规中矩。但是从第 9 章开始这书开始错误频出,而且概念也描述得不清楚,不建议继续往下看。不论怎样,前 6 章值得一读。

四、大模型入门&提升

4.1大模型基础

大模型入门不可错过的一本书,就是这本大模型界的经典畅销书 《大规模语言模型》!系统性强,内容适合初学者,如果你想知道如何构建一个大模型应用,系统了解大模型的构建,选它准没错!

大规模语言模型:从理论到实践》

张奇,桂韬,郑锐,黄萱菁 著

  • 解码大语言模型奥秘,引领机器智能新时代

  • 详细介绍构建LLM的四个主要阶段:预训练、有监督微调、奖励建模和强化学习

  • 解读ChatGPT背后的核心技术

  • 配全书PPT课件

为了使更多的自然语言处理研究人员和对大语言模型感兴趣的读者能够快速了解大模型的理论基础,并开展大模型实践,复旦大学张奇教授团队结合他们在自然语言处理领域的研究经验,以及分布式系统和并行计算的教学经验,在大模型实践和理论研究的过程中,历时8个月完成本书的撰写。希望这本书能够帮助读者快速入门大模型的研究和应用,并解决相关技术问题。

本书详细介绍了构建大语言模型的四个主要阶段:预训练、有监督微调、奖励建模和强化学习。每个阶段都有算法、代码、数据、难点及实践经验的详细讨论。

本书以大语言模型的基础理论开篇,探讨了大语言模型预训练数据的构建方法,以及大语言模型如何理解并服从人类指令,介绍了大语言模型的应用和评估方法,为读者提供了更全面的视野。

本书旨在为对大语言模型感兴趣的读者提供入门指南,也可作为高年级本科生和研究生自然语言处理相关课程的补充教材!

《从零开始大模型开发与微调:基于PyTorch与chatGLM》

在这里插入图片描述

大模型是深度学习自然语言处理皇冠上的一颗明珠,也是当前AI和NLP研究与产业中最重要的方向之一。本书使用PyTorch 2.0作为学习大模型的基本框架,以ChatGLM为例详细讲解大模型的基本理论、算法、程序实现、应用实战以及微调技术,为读者揭示大模型开发技术。

《大模型应用解决方案基于GPT-3、ChatGPT、GPT-4等Transformer架构的自然语言处》

这是内行都在学的大模型黑书,外网的爆火的LLM手册,需要一定基础才能看懂,适合技术进阶进行学习。

主要内容: 了解用于解决复杂语言问题的新技术。将GPT-3与T5、GPT-2和基于BERT的Transformer的结果进行对比使用TensorFlow、PyTorch和GPT-3执行情感分析、文本摘要、非正式语言分析、机器翻译等任务了解ViT和CLIP如何标注图像(包括模糊化),并使用DALL-E从文本生成图像学习ChatGPT和GPT-4的高级提示工程机制”。

《大模型应用开发极简入门:基于GPT-4和ChatGPT》

作者: 奥利维耶·卡埃朗(Olivier Caelen)和玛丽-艾丽斯·布莱特(Marie-Alice Blete)
简介: 是一本适合初学者学习和快速入门大模型应用开发的实用手册,它不仅提供了理论知识,还包含了丰富的实践指导和技术细节。

在这里插入图片描述

《大语言模型:基础与前沿》

在这里插入图片描述

《大语言模型:基础与前沿》这本书相比市场上同类型书籍,在内容上更具有稀缺性,因为它不仅讲解了当前 LLM 技术的原理与应用,还展望了未来的发展方向,更对其争议也进行了思辨,帮助读者找到技术与现实应用的最佳结合点。本书最大的特点就是全面性,通过对 LLM 的基础知识、前沿进展和社会影响的解读,为读者提供了系统的认识。同时,本书对 LLM 技术前瞻性的预测,也促使读者思考未来要做出的选择。

《大语言模型》,作者来自一线的产业界,书中有工程实践,代码配套齐全,如果你想了解更多产业实践方面的内容,就选它!

大语言模型:原理与工程实践》

杨青 编著

  • 揭开LLM的神秘面纱,解读其机理和工程实践,手把手教你训练7B LLM

本书用10 章对大语言模型进行全面且深入的介绍。首先对大语言模型的基本概念进行介绍。其次,从大语言模型的基础技术、预训练数据构建、预训练技术等方面展开讨论,帮助读者深入了解大语言模型的构建和训练过程。然后,详细介绍有监督微调和强化对齐等技术,以及如何评估大语言模型的性能。外,介绍提示工程和工程实践等方面的内容,帮助读者了解大语言模型的应用和实际操作过程。最后,介绍如何从零开始微调大语言模型,辅以代码示例,帮助读者更好地应用这些技术。

通过阅读本书,读者可以获得全面且深入的大语言模型的知识框架。无论您是研究人员、工程师,还是产品经理,都能从中获得有价值的知识。

《解构大语言模型》,从模型发展史的角度,带你在技术层面上了解大模型是如何从最简单的线性回归模型发展为如今的大语言模型的,精细解读了模型架构与代码实现,有助于打好基本功,对大模型有更深的理解和认识!

解构大语言模型:从线性回归到通用人工智能(全彩)

唐亘 著

  • 从模型结构和数据基础两大角度解构大语言模型

  • 详解经典模型的核心结构及实现过程,夯实基础

  • 模型开发与调优,重构ChatGPT,GitHub配套代码

  • 融合统计分析/机器学习/经济学等知识,全彩印刷

本书从模型的结构和数据基础两个方面解构大语言模型,以便帮助读者理解和搭建类似ChatGPT的系统。在模型的结构方面,大语言模型属于深度神经网络,其设计核心是注意力机制,因此,本书涵盖了多层感知器、卷积神经网络和循环神经网络等经典模型。在模型的数据基础方面,本书既涉及模型训练的工程基础,如反向传播,又涉及数据的使用方式,如迁移学习、强化学习,以及传统的监督学习和无监督学习。此外,本书还阐述了如何从计量经济学和经典机器学习模型中汲取灵感,以提高模型的稳定性和可解释性。

本书既适用于希望深入了解大语言模型、通过人工智能技术解决实际问题的读者,也适合作为高等院校计算机及相关专业的师生参考用书。

《大语言模型应用指南》,这本书更侧重于对大模型的使用,从如何使用ChatGPT到如何基于大模型进行二次开发、创建GPTs、Agent系统分析等,由浅入深,带你了解大模型应用的一切!小白读者也可以读懂~~

大语言模型应用指南:以ChatGPT为起点,从入门到精通的AI实践教程(全彩)》

万俊 著

  • 大语言模型的应用与二次开发

  • 探索智能前沿,驾驭模型力量,对人工智能或编程技术小白读者友好

  • 技术点包含提示工程、长短期记忆、GPTs、Agent系统、微调与安全技术、GPT-4V与Gemini、尺度定律与压缩即智能等

本书是一本对人工智能小白读者非常友好的大语言模型应用指南,有两大特点:一是以通俗易懂的方式解释复杂概念,通过实例和案例讲解大语言模型的工作原理和工作流程、基本使用方法,包括大语言模型常用的三种交互格式、提示工程、工作记忆与长短期记忆,以及外部工具等,使读者能够全面了解和掌握这一先进技术的应用和二次开发;二是紧跟当前大语言模型技术的更新动态,介绍GPTs的创建,以GPT-4V和Gemini为例讲述多模态模型的应用,还包括无梯度优化、自主Agent系统、大语言模型微调、RAG框架微调、大语言模型安全技术等。

无论是学术研究者、工程师,还是对大语言模型感兴趣的普通读者,都可以通过本书获得大语言模型的前沿研究成果、技术进展和应用案例,从而更好地应用大语言模型解决实际问题。

《动手做Al Agent》

在这里插入图片描述

人工智能时代一种全新的技术Agent正在崛起。这是一种能够理解自然语言并生成对应回复以及执行具体行动的人工智能体。它不仅是内容生成工具,而且是连接复杂任务的关键纽带。
本书将探索Agent的奥秘,内容包括从技术框架到开发工具,从实操项目到前沿进展,通过带着读者动手做7个功能强大的Agent,全方位解析Agent的设计与实现。本书最后展望了Agent的发展前景和未来趋势。

4.2 多模态大模型

了解了以上大模型的基础内容,再来看看如今已经实现了文本-图像-语音-视频“大统一”的多模态大模型!

两本《多模态大模型》,该怎么选呢?

想要系统全面地了解多模态大模型的技术理论知识及应用,就选这本**《多模态大模型:新一代人工智能技术范式》**。

多模态大模型:新一代人工智能技术范式(全彩)

刘阳 林倞 著

  • 多模态大模型基础、核心、模型详细剖析

  • AIGC、具身智能、视觉问答等典型应用案例,

  • 因果推理、世界模型、Sora、AGI Agent等前沿技术探究

本书以深入浅出的方式介绍多模态大模型的技术方法、开源平台和应用场景,并详细阐述因果推理、世界模型及多智能体与具身智能等前沿技术领域,有助于读者全面了解多模态大模型的特点及发展方向,对新一代人工智能技术范式和通用人工智能的发展起到重要推动作用。

本书内容共5章,第1章引领读者深入探索最具代表性的大模型结构,包括BERT、Chat-GPT 和ChatGLM等,为建立对多模态大模型的全面认知打下基础。第2章深度剖析多模态大模型的核心技术,如提示学习、上下文学习、思维链和人类反馈强化学习等,揭示多模态大模型的独特之处和引人入胜的技术内涵。第3章介绍多个具有代表性的多模态基础模型,如CLIP、LLaMA、SAM和PaLM-E等,为读者呈现多样和广泛的技术解决方案。第4章深入分析视觉问答、AIGC和具身智能这三个典型应用,展示多模态大模型在实际场景中的强大能力。第5章探讨实现AGI的可行思路,包括因果推理、世界模型、超级智能体与具身智能等前沿技术方向。

本书不仅适合高校相关专业高年级本科生和研究生作为教材使用,更是各类IT从业者的必备参考之作。

想要从模型的发展脉络及实践的角度了解的话,就选这本**《多模态大模型:技术原理与实战》**。

多模态大模型:技术原理与实战》

彭勇,彭旋,郑志军,茹炳晟 著

  • 读懂ChatGPT的核心技术、GPT的进化史和创新点

  • 详述多模态大模型的核心技术和应用场景

  • 让中小公司可以从0到1部署多模态大模型,打开通往通用人工智能的大门

本书详细介绍了大语言模型和多模态大模型的发展历史、技术原理和亮点、主要的开源框架、配套工具、部署细则和实战案例。为了让读者更好地进行大模型的应用实战,本书还详细介绍了使用大模型为商业赋能的3个应用案例。期望本书能够帮助读者打开通往大模型尤其是多模态大模型的学习、实战和商业成功之路。

4.3 扩散模型

想要了解各种AI生成背后的秘密,就看看这本**《扩散模型》**吧~~

扩散模型:生成式AI模型的理论、应用与代码实践

杨灵,张至隆,张文涛,崔斌 著

  • 本书作者团队来自著名学府,且与国际知名研究机构、院校有众多交流,其提供的内容具有权威性,并获得众多专家、学者认可

  • 本书从理论和实践两个方面进行了细致介绍。阅读本书的读者,即可获得学术收益,又可进行实践应用

  • 为方便进行理论实践,本书提供了可配套运行的代码文件,读者可以进行下载

本书深入浅出地介绍了扩散模型的知识,案例丰富,讲解细致。第1章介绍AIGC与相关技术,第2章从三个视角介绍扩散模型的基本理论、算法,此外介绍了扩散模型的神经网络架构和代码实现。第3章、第4章、第5章分别从高效采样、似然优化、数据结构三个方面系统介绍了扩散模型的特点,以及后续的改进工作。第6章讨论了扩散模型与其他生成模型的关联,包括变分自编码器、生成对抗网络、归一化流、自回归模型和基于能量的模型。第7章介绍了扩散模型的应用,包括计算机视觉、自然语言处理、时间数据建模、多模态学习、鲁棒学习和跨学科应用。第8章讨论了扩散模型的未来,以及与GPT和大模型的关联。

本书适合高等院校计算机科学、人工智能和医学、生物学等交叉学科专业的师生,以及相关人工智能应用程序的开发人员阅读。

4.4 大模型压缩

而如果你意识到,随着大模型规模的增长,模型的算力与可用资源之间的矛盾也在日益加剧,那就一定要读一读这本**《高效深度学习:模型压缩与设计》**,看看如何降低大模型应用成本!

高效深度学习:模型压缩与设计(全彩)》

汪玉 宁雪妃 著

  • 高效模型压缩与设计,释放大模型潜能,赋能千行百业

  • 清华大学电子工程系汪玉 宁雪妃 作品

  • 权威:出自芯片领域著名专家之手

  • 系统:系统梳理模型压缩与设计关键技术

  • 经验:提供实践中总结的分析思路和经验

本书系统地介绍了高效模型压缩和模型设计的方法,在编写上兼顾理论和实践。本书主体部分详细介绍了模型压缩的方法论,包括高效模块设计、模型剪枝、模型量化、模型二值化、神经网络架构搜索、知识蒸馏几大部分。另外,简要介绍了定制化硬件加速器的设计及大语言模型的加速和压缩。

4.5 开源大模型

想要从大模型中挑一个具体研究?Llama是个不错的选择!可以看看这本**《Llama大模型实践指南》**。

Llama大模型实践指南

张俊祺,曲东奇,张正,占冰强 等 著

  • 全面介绍Llama的入门指南;实用案例和示例代码助你快速上手;本书配套AI助手答疑解惑

本书共包括7章,涵盖了从基础理论到实际应用的全方位内容。第1章深入探讨了大模型的基础理论。第2章和第3章专注于Llama 2大模型的部署和微调,提供了一系列实用的代码示例、案例分析和最佳实践。第4章介绍了多轮对话难题,这是许多大模型开发者和研究人员面临的一大挑战。第5章探讨了如何基于Llama 2定制行业大模型,以满足特定业务需求。第6章介绍了如何利用Llama 2和LangChain构建高效的文档问答模型。第7章展示了多语言大模型的技术细节和应用场景。本书既适合刚入门的学生和研究人员阅读,也适合有多年研究经验的专家和工程师阅读。

通过阅读本书,读者不仅能掌握Llama 2大模型的核心概念和技术,还能学会如何将这些知识应用于实际问题,从而在这一快速发展的领域中取得优势。

4.6 LangChain

当你想要基于大模型进行应用程序开发时,怎么能少得了LangChain这个强大的开发框架呢?

全面系统地学习LangChain,这本由LangChain中文网联合创始人编著的**《LangChian入门指南》**一定是不二之选!

LangChain入门指南:构建高可复用、可扩展的LLM应用程序》

李特丽 康轶文 著

  • 全面介绍LangChain技术

  • 逐步构建自己的LLM应用程序

  • 内容注重高可复用性和可扩展性

  • 实用案例和示例代码助你快速上手

  • 与社区互动,共享经验与解决难题

本书由LangChain中文网联合创始人李特丽与创始人康轶文共同编著!

本书专门为那些对自然语言处理技术感兴趣的读者提供了系统的LLM应用开发指南。全书分为11章,从LLM基础知识开始,通过LangChain这个开源框架为读者解读整个LLM应用开发流程。第1~2章概述LLM技术的发展背景和LangChain框架的设计理念。从第3章开始,分章深入介绍LangChain的6大模块,包括模型I/O、数据增强、链、记忆等,通过大量代码示例让读者了解其原理和用法。第9章通过构建PDF问答程序,帮助读者将之前学习的知识应用于实践。第10章则介绍集成,可拓宽LangChain的用途。第11章为初学者简要解析LLM的基础理论,如Transformer模型等。

本书以LangChain这个让人熟悉的框架为主线,引导读者一步一步掌握LLM应用开发流程,适合对大语言模型感兴趣的开发者、AI应用程序开发者阅读。

如果想要快速地对LangChain有个了解,那就可以看一下这本书如其名的**《LangChain简明讲义》**,主打简明和快!

LangChain简明讲义:从0到1构建LLM应用程序》

刘伟舟 张婉平 著

  • 揭秘大语言模型和 LangChain,由浅入深讲解基础概念和实践案例

本书的结构由浅入深,第1章和第2章介绍大语言模型和LangChain的基础知识,使读者能够对本书内容有整体的认识,并完成运行环境的安装配置,为后续实践奠定基础。第3章至第8章详细介绍LangChain的重要模块,包括模型调用、链、智能体等,深入浅出地介绍了各模块的原理和使用方式。第9章至第11章涉及实践项目,包括对话机器人、代码理解、检索增强生成,通过这些项目,读者能更好地理解如何基于LangChain构建自己的大语言模型应用系统。

本书适合AI应用程序开发者、对大语言模型感兴趣的开发者,以及对大语言模型感兴趣的高等院校学生阅读。

想要更多从实战角度学习LangChain,**《LangChain实战》《LangChain技术解密》**两本书都配套了可拿来即用的源代码,有丰富的案例供大家实践~~

《LangChain实战》基于稳定版本,还免费提供了讲解视频,可以说非常贴心了!

LangChain实战:从原型到生产,动手打造 LLM 应用

张海立 曹士圯 郭祖龙 著

  • 基于Langchain0.1长期维护版本

  • 全方位展现从原型到生产LLM应用开发全流程

  • 8位产学研界专家赞誉力荐

本书是专为初学者和对LangChain应用及大语言模型(LLM)应用感兴趣的开发者而编写的。本书以LangChain团队于2024年1月发布的长期维护版本0.1为基础,重点介绍了多个核心应用场景,并且深入探讨了LCEL的应用方式。同时,本书围绕LangChain生态系统的概念,详细探讨LangChain、LangServe和LangSmith,帮助读者全面了解LangChain团队在生成式人工智能领域的布局。此外,本书还介绍了开源模型运行工具,为读者引入本地免费的实验环境,让读者能够亲自动手进行实际操作。

通过本书,读者可以真正体验到LangChain在从原型到生产的LLM应用开发和上线闭环体验方面的优势,全面了解LangChain的概念、原理和应用,并且获得实际开发LangChain应用的经验。本书示例丰富,内容通俗易懂,既可作入门教程,也可供相关技术人员参考。

LangChain技术解密:构建大模型应用的全景指南

王浩帆 编著

  • 内容全面:包含Langchain的新版本、新动态及全新表达式语言

  • 系统深入:书中融入了LangGraph、Langsmith等核心组件,讲解细致入微

  • 结构流畅:章节设计自然衔接,有助于读者掌握Langchain的运行逻辑

  • 深度拓展:深入讲解了Langchain的隐私与安全、数据评估等高级主题

  • 实战性强:提供了丰富的代码实例和结果截图,读者可快速上手实践

  • 源码开放:在作者的GitHub中提供了各章节源码,读者可独立运行学习

本书共10章,分别介绍了LangChain的开发环境搭建、模型、提示、数据连接、链、记忆、代理、回调及周边生态等内容,并用三个案例,即基于Streamlit实现聊天机器人、基于Chainlit实现PDF问答机器人、零代码AI应用构建平台Flowise,将前面大语言模型的内容学以致用。通过本书,读者既能提升自身的技术素养,又能拓展自己解决实际难题的能力。

本书适合刚入门或想加入AI行业的技术从业者、需要结合大语言模型相关技术为业务赋能的产品经理、计算机相关专业的学生,以及AI爱好者和自学者。

4.6 AI产品经理

《AI赋能:AI重新定义产品经理》

在这里插入图片描述

随着AI在越来越多的行业被应用,AI赋能的价值逐步体现出来。本书从AI的本质出发,介绍AI技术过往的发展历程和最新的理论成果,然后讲解如何站在移动互联网和大数据的基础上,系统地学习、应用AI技术。本书希望向读者提供学习AI技术的资料、路径,以及打磨AI产品的观点、思路。此外,本书通过介绍笔者接触、打磨AI产品的实际经历,给大家指出AI赋能过程中需要避免的“坑”,期待我们在AI时代共同发展自己、发展生活,在未来遇到更好的AI产品、更好的自己。

4.7 大模型和程序员的关系

(1)目前ChatGPT对程序员到底有哪些实质性的帮助?

第一点:Code Review ChatGPT能够理解代码,并针对代码给出针对性的建议和优化方案;

第二点:写测试用例、单元测试、集成测试等,这些ChatGPT都很擅长!

第三点:对线上问题的定位和分析 线上问题的各种疑难杂症,ChatGPT都能胜任!

第四点:SQL的翻译 实现两种数据库的SQL语言转换,比如将Oracle的SQL脚本转换成MySQL的SQL脚本。

(2)有了AI编程,还需要程序员吗?

第一,在冯诺依曼架构体系下,程序需要的是确定性计算;

第二,由于大模型本身的概率性,目前大模型生成的代码还具备一定的随意性和不确定性;

第三,目前大模型更擅长的是一些抽象层次比较低的工作,比如一段代码或一个算法的实现,写一个单元测试等等。而一些抽象层次比较高的工作,比如需求分析、架构设计、领域设计、架构选型等,这些工作反而是大模型不擅长的,而这些工作是比较具备有竞争力的,这恰恰是一些高级程序员以及系统架构师的价值所在。

(3)应用实践AIGC有几层境界?

第一层境界:简单对话; 通过ctrl-c/v出结果,人人都会。

第二层境界:系统掌握Prompt Engineering; 通过系统掌握好提示词工程,真正赋能工作提效。

第三层境界:将AIGC融入业务流程,指挥AIGC完成复杂的任务; 通过掌握AIGC的技能,并完成业务领域知识的深入结合。

第四层境界:拥有自己的大模型; 熟悉大模型的架构原理,通过开源大模型微调,最好能够拥有一定的行业数据壁垒。

第五层境界:参与设计训练大模型; 比如从事ChatGPT等研发工作。 目前,Edison还处于第二层即提示词工程,我们整理了很多针对SDLC(软件开发生命周期)过程中的经典场景的提示词模板来做提效。 那么,你处于哪一层呢?

(4)如何掌握AI大模型开发技能?

第一步:掌握开发AGI时代新应用程序的技能; 比如:大模型应用内核、LangChain开发框架、向量数据库等;

第二步:搞定开发企业级AI Agent的应用技能; 比如:AI Agent、大模型缓存、算力等;

第三步:驾驭开发企业级专有大模型的技能; 比如:RAG、微调等;

第四步:深入应用大模型技术成为开发大师; 比如:大模型预训练、LLMOps等;

👉这几本书籍(PDF版)获取方式:
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

在这里插入图片描述

五、AI大模型学习和面试资源

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述

第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;

第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;

第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;

第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;

第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;

第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;

第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

在这里插入图片描述

👉学会后的收获:👈

• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;

• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;

• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。

在这里插入图片描述

1.AI大模型学习路线图
2.100套AI大模型商业化落地方案
3.100集大模型视频教程
4.200本大模型PDF书籍
5.LLM面试题合集
6.AI产品经理资源合集

👉获取方式:
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

在这里插入图片描述

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐