【langchain】大模型函数调用技术详解：让AI系统更智能的实践指南

文章详解大模型函数调用的原理与应用，包括函数调用的本质架构、LangChain工具与工具包使用、自定义工具创建的三种技巧，以及高德天气和谷歌搜索插件的实现，帮助开发者通过函数调用扩展大模型能力，实现更智能的AI应用。

AI-椰子不椰

115人浏览 · 2025-11-26 13:58:24

AI-椰子不椰 · 2025-11-26 13:58:24 发布

一、大模型函数调用

1.1 函数调用的本质与组成

在概率架构下，大语言模型的回复是非结构化且不一致的，所以将大语言模型集成到其他系统中，是存在一定风险的，例如下游系统中想要 JSON 数据，但是大语言模型返回了一串文本，会让整个流程崩溃。但是如果能更好控制响应格式，就可以轻松地将响应下游集成到其他系统中（虽然通过 prompt 也可以实现，但是不稳定）。
其次，我们都知道大语言模型的训练需要大量的计算资源和时间，因此它们的知识库通常是在某个知识点之前的数据集上训练的，例如，GPT-3.5 和 GPT-4 的知识截至 2023 年 10 月，这意味着它们无法提供此后的新消息或事件，为保持时效性，需定期重训模型，单成本高昂且费时。而函数调用(Function Calling) 的使用就是为了克服大语言模型的上述缺点，LLM 中的函数调用架构其实也非常简单，本质上是对输入 prompt 的自动拆解，利用拆解出来的参数和自动识别出的函数名称，调用外部资源，然后将返回的外部资源添加到 prompt 之中，再次调用 LLMs，从而得到返回结果，运行流程与架构如下：

在这里插入图片描述

简单来说，函数回调的作用就是可以更可靠地从大语言模型中获取结构化的数据。
并且目前绝大部分大参数的模型都支持函数调用，而且除了系统消息、人类消息、AI消息之外，部分大模型还可以添加函数/工具消息，即将函数的生成结果单独作为消息传递给大模型，让大模型基于工具消息生成对应的内容，例如 GPT 模型。

OpenAI 大语言模型聊天接口文档：https://platform.openai.com/docs/api-reference/chat/create
百度文心一言函数调用接口文档：https://cloud.baidu.com/doc/WENXINWORKSHOP/s/5ltxyqupn
对于原生支持函数调用大语言模型而言，一般来说会提供多一个除了 prompt 之外的参数，这个参数用于描述函数调用的相关参数（并且目前绝大部分 LLM 的函数参数描述格式都保持一致，参考 GPT）。
参数涵盖了函数名字、函数描述、函数参数、函数调用模型等，这样大语言模型才能知道可以调用那些函数。
例如 GPT模型执行函数调用示例

from openai import OpenAIclient = OpenAI()tools = [  {    "type": "function",    "function": {      "name": "get_current_weather",      "description": "Get the current weather in a given location",      "parameters": {        "type": "object",        "properties": {          "location": {            "type": "string",            "description": "The city and state, e.g. San Francisco, CA",          },          "unit": {"type": "string", "enum": ["celsius", "fahrenheit"]},        },        "required": ["location"],      },    }  }]messages = [{"role": "user", "content": "What's the weather like in Boston today?"}]completion = client.chat.completions.create(  model="gpt-3.5-turbo-16k",  messages=messages,  tools=tools,  tool_choice="auto")print(completion)

例如上方的代码描述了一个函数名为 get_current_weather，该函数的作用是查询指定城市的天气信息，函数拥有两个参数 location 和 unit 分别代表城市和单位，其中城市参数是必填的。
当我们提问 What’s the weather like in Boston today?(今天波士顿的天气怎么样？) 时，大语言模型会根据传递的 auto 自动检测需要调用函数，于是从 prompt 中提取出对应的函数参数信息，返回的数据如下（多了一个 tool_calls 参数）

{  "id": "chatcmpl-abc123","object": "chat.completion","created": 1699896916,"model": "gpt-4o-mini","choices": [    {      "index": 0,      "message": {        "role": "assistant",        "content": null,        "tool_calls": [          {            "id": "call_abc123",            "type": "function",            "function": {              "name": "get_current_weather",              "arguments": "{\n\"location\": \"Boston, MA\"\n}"            }          }        ]      },      "logprobs": null,      "finish_reason": "tool_calls"    }  ],"usage": {    "prompt_tokens": 82,    "completion_tokens": 17,    "total_tokens": 99  }}

接下来就可以根据大模型生成的 tool_calls 参数调用对应的函数，从而完成本地特定的函数调用，对于部分大模型来说，还可以将函数结果、前面的历史对话消息传递给大模型，让大模型基于这些信息生成对应的内容。
important
需要特别注意的是，大语言模型本身的函数调用并不会调用我们预定义的参数，而是仅仅生成我们需要调用的函数的调用参数而已，具体调用函数的动作，需要我们在应用代码中实现。
从上面的示例中，很容易看出，函数调用 = 大语言模型(支持函数调用) + 预定Prompt + 函数/工具参数列表 + 本地调用代码。

1.2 函数调用的想象空间

在函数调用的加持下，让大语言模型作为大脑，接入到上下游系统中，就可以实现以往很多实现不了的功能，**实现万物智能化！**例如：

用户对着微信说：给我每个女性好友发送一条情真切意的拜年消息，还要带一点小幽默。
用户对着富途牛牛：人工智能相关股票，市盈率最低的是哪一个？最近交易量如何？都有哪些机构持有？
用户对着京东说：我想买一台 65 寸的电视，不要日货，价格在 5000 元左右。
上述的几个需求，都只需要预设好特定的函数/工具，并将函数/工具的参数描述传递给大语言模型，大语言模型就会从传递的 prompt 中抽取相关的函数参数，接下来直接执行本地函数的调用即可。
又例如 Self-RAG 优化策略，在该策略的运行流程中，需要让 LLM 自行判断是否需要检索对应的内容，如果需要的话则生成检索内容，否则直接输出内容，同样也可以利用到函数调用，设置 tool_choice 为 auto，让 LLM 自行做决策即可

在这里插入图片描述

除了单次执行，还可以让 LLM 将需求拆分，拆分成多个任务/函数，让不同的 LLM 执行不同的子任务，并分工合作调用不同的工具/函数，并循环检测输出的内容是否实现了整个任务，最后再将结果输出。

一直在更新，更多的大模型学习和面试资料已经上传带到CSDN的官方了，有需要的朋友可以扫描下方二维码免费领取【保证100%免费】👇👇

二、 langchain中的工具与工具包

2.1 LangChain 内置工具

函数调用是可靠地从大语言模型中获取结构化数据的一个功能，要想使用函数调用就必须定义好特定的函数或工具，并将工具的相关信息传递给大语言模型，在 LangChain 中封装了大量的预设工具，开箱即用，涵盖了：搜索、图像生成、百科、视频信息提取、代码执行、数据分析等。
• LangChain 内置工具列表：https://imooc-langchain.shortvar.com/docs/integrations/tools/
并且在 LangChain 中，所有工具都是 BaseTool 的子类，并且工具也是 Runnable可运行组件，支持通过 invoke、batch 和 stream 等方法进行调用，使用起来也非常简单，实例化工具后直接调用 invoke 函数即可，除此之外，可以通过 name、description、args、return_direct 属性来获取到工具的相关信息。
例如以 DuckDuckGo搜索为例，首先安装特定的依赖库

pip install -U duckduckgo-search

示例代码如下

from langchain_community.tools import DuckDuckGoSearchRunsearch = DuckDuckGoSearchRun()print("工具名字: ", search.name)print("工具描述: ", search.description)print("工具参数:", search.args)print("是否直接返回: ", search.return_direct)print(search.run("LangChain目前最新版本是什么?"))

输出内容

工具名字:  duckduckgo_search工具描述:  A wrapper around DuckDuckGo Search. Useful for when you need to answer questions about current events. Input should be a search query.工具参数: {'query': {'title': 'Query', 'description': 'search query to look up', 'type': 'string'}}是否直接返回:  False

LangChain 基准是一个 python 包和相关数据集，用于促进不同认知架构的实验和基准测试。. 每个基准任务都针对常见 LLM 应用程序中的关键功能，例如基于检索的问答、提取、代理工具使用等。. 对于我们的第一个基准，我们发布了一个关于 LangChain python 文档的问答 … 它建立在 LCEL 的基础之上，添加了两个重要的组件：轻松定义循环的能力（这对代理很重要，但对链来说不需要）和内置内存。. 在 langchain v0.2 中，我们保留了旧的 AgentExecutor——但 LangGraph 正在成为构建代理的推荐方式。. 我们添加了一个预构建的 LangGraph 对象 … 奋战一年，LangChain首个稳定版本终于发布，LangGraph把智能体构建为图. 著名的大模型智能体工具，现在有大版本更新了。. 不知不觉，LangChain 已经问世一年了。. 作为一个开源框架，LangChain 提供了构建基于大模型的 AI 应用所需的模块和工具，大大降低了 AI 应用 … LangChain 承诺「让开发人员一个下午就能从一个想法变成可运行的代码」，但随着我们的需求变得越来越复杂，问题也开始浮出水面。. LangChain 变成了阻力的根源，而不是生产力的根源。. 随着 LangChain 的不灵活性开始显现，我们开始深入研究 LangChain 的内部结构 … LangChain 随时间推移的变化. 我们文档中新增的"LangChain 随时间推移的变化"部分可帮助您及时了解变化。其中提供了有关 LangChain 如何变化、如何升级以及如何将旧版本中的先前概念映射到新版本中的指南。这是社区强烈要求的功能，我们也认为它非常必要!
如果需要将工具转换成 openai 工具形式参数，可以使用 convert_to_openai_tool() 辅助函数，示例如下：

from langchain_community.tools import DuckDuckGoSearchRunfrom langchain_core.utils.function_calling import convert_to_openai_toolsearch = DuckDuckGoSearchRun()print(convert_to_openai_tool(search))

输出内容：

{'type': 'function', 'function': {'name': 'duckduckgo_search', 'description': 'A wrapper around DuckDuckGo Search. Useful for when you need to answer questions about current events. Input should be a search query.', 'parameters': {'type': 'object', 'properties': {'query': {'description': 'search query to look up', 'type': 'string'}}, 'required': ['query']}}}

2.2 LangChain 内置工具包

在 LangChain 中，工具包是一组设计用于一起执行特定任务的工具集，它们具有便捷加载的方法——get_tools()，并且所有工具包都公开了一个 get_tools() 方法，该方法返回一个工具列表，这样就无需一个一个加载特定的工具了。
• LangChain 内置工具包列表：https://imooc-langchain.shortvar.com/docs/integrations/toolkits/
工具包一般是同一个服务提供商提供的一系列工具，例如在 LangChain 中封装了 Azure AI 的对应工具包，该工具包提供了 5 个工具：

AzureAiServicesImageAnalysisTool：用于从图像中提取标题、对象、标签和文本。
AzureAiServicesDocumentIntelligenceTool：用于从文档中提取文本、表格和键值对。
AzureAiServicesSpeechToTextTool：用于将语音转录为文本。
AzureAiServicesTextToSpeechTool：用于将文本合成语音。
AzureAiServicesTextAnalyticsForHealthTool：用于提取医疗实体。
使用起来也非常简单，首先安装特定的依赖包

pip install -U azure-ai-formrecognizer azure-cognitiveservices-speech azure-ai-textanalytics azure-ai-vision-imageanalysis

然后配置 Azure 的相关环境变量

import osos.environ["OPENAI_API_KEY"] = "sk-"os.environ["AZURE_AI_SERVICES_KEY"] = ""os.environ["AZURE_AI_SERVICES_ENDPOINT"] = ""os.environ["AZURE_AI_SERVICES_REGION"] = ""

接下来就可以创建工具包，示例如下：

from langchain_community.agent_toolkits import AzureAiServicesToolkittoolkit = AzureAiServicesToolkit()print([tool.name for tool in toolkit.get_tools()])

输出内容如下：

['azure_ai_services_document_intelligence', 'azure_ai_services_image_analysis', 'azure_ai_services_speech_to_text', 'azure_ai_services_text_to_speech', 'azure_ai_services_text_analytics_for_health']

不过由于工具包包含了多组工具，一般很少单独拆分出来使用，通常用在 Agent 或者函数调用中，这样无需一次性实例化多个工具，在实际开发中，往往更多的是手动实例化工具进行组装。

三、自定义工具以及使用场景

创建自定义工具的3种技巧与使用场景
在使用函数调用或者创建智能体时，我们需要提供工具列表，以便大语言模型可以使用这些工具，虽然 LangChain 内部集成了大量的工具和工具包，但并不一定适合我们的业务场景，更多场合下我们会使用自定义工具，在 LangChain 中提供了 3 种构建自定义工具的技巧：@tool 装饰器、StructuredTool.from_function()类方法、BaseTool子类，不同的方式有不同的优缺点与应用场景。

3.1 @tool 装饰器

@tool装饰器是定义自定义工具的最简单方式，可以快速将当前的函数改造成大语言模型工具，该装饰器默认使用函数名称作为工具名称，但可以通过传递字符串作为第一个参数来覆盖，此外，该装饰器将使用函数的文档字符串作为工具的描述，所以被装饰的函数必须要提供文档字符串。
使用示例如下：

from langchain_core.tools import tool@tooldefmultiply(a: int, b: int) -> int:    """将传递的两个数字相乘"""    return a * b# 打印下该工具的相关信息print("名称: ", multiply.name)print("描述: ", multiply.description)print("参数: ", multiply.args)print("直接返回: ", multiply.return_direct)# 调用工具print(multiply.invoke({"a": 2, "b": 8}))输出内容：名称:  multiply描述:  将传递的两个数字相乘参数:  {'a': {'title': 'A', 'type': 'integer'}, 'b': {'title': 'B', 'type': 'integer'}}直接返回:  False16除了使用默认的配置外，@tool 装饰器还可以传递多个参数来执行相应的配置，例如传递 工具名字、参数描述、是否直接返回 等from langchain_core.pydantic_v1 import BaseModel, Fieldfrom langchain_core.tools import toolclassCalculatorInput(BaseModel):    a: int = Field(description="第一个数字")    b: int = Field(description="第二个数字")@tool("multiply_tool", args_schema=CalculatorInput, return_direct=True)defmultiply(a: int, b: int) -> int:    """将传递的两个数字相乘"""    return a * b# 打印下该工具的相关信息print("名称: ", multiply.name)print("描述: ", multiply.description)print("参数: ", multiply.args)print("直接返回: ", multiply.return_direct)# 调用工具print(multiply.invoke({"a": 2, "b": 8}))

输出内容：

名称:  multiply_tool描述:  将传递的两个数字相乘参数:  {'a': {'title': 'A', 'description': '第一个数字', 'type': 'integer'}, 'b': {'title': 'B', 'description': '第二个数字', 'type': 'integer'}}直接返回:  True

当使用 Google-style文档字符串风格进行函数注释时，还可以设置 parse_docstring 为 True，这样 @tool 装饰器还可以获取到每个参数的相关解释，例如

@tool(parse_docstring=True)def foo(bar: str, baz: int) -> str:    """The foo.    Args:        bar: The bar.        baz: The baz.    """    return barprint(foo.args)

输出内容：

{'bar': {'title': 'Bar', 'description': 'The bar.', 'type': 'string'}, 'baz': {'title': 'Baz', 'description': 'The baz.', 'type': 'integer'}}

对于一个原有的函数，并且该函数的参数相对来说比较简单，我们可以考虑使用 @tool装饰器来转换该函数，可以极大减少重复性的工作，但是 @tool 装饰器装饰的工具并不能同时拥有同步和异步方法，只可以单独装饰，例如:

from langchain_core.tools import tool@toolasync def amultiply(a: int, b: int) -> int:    """Multiply two numbers."""return a * b

所以对于一些需要同时考虑同步和异步的工具来说，@tool 装饰器就没法使用了。

3.2 StructuredTool 类方法

第 2 种快速创建工具的技巧是使用 StructuredTool.from_function()类方法，该方法提供了比 @tool 装饰器更多的配置项，例如同时支持同步和异步等，修改的示例如下:

from langchain_core.pydantic_v1 import BaseModel, Fieldfrom langchain_core.tools import StructuredToolclassCalculatorInput(BaseModel):    a: int = Field(description="第一个数字")    b: int = Field(description="第二个数字")defmultiply(a: int, b: int) -> int:    """将传递的两个数字相乘"""    return a * basyncdefamultiply(a: int, b: int) -> int:    """将传递的两个数字相乘"""    return a * bcalculator = StructuredTool.from_function(    func=multiply,    coroutine=amultiply,    name="multiply_tool",    description="用于将传递的两个整型相乘",    return_direct=True,    args_schema=CalculatorInput,)# 打印下该工具的相关信息print("名称: ", calculator.name)print("描述: ", calculator.description)print("参数: ", calculator.args)print("直接返回: ", calculator.return_direct)# 调用工具print(calculator.invoke({"a": 2, "b": 8}))

输出内容：

名称:  multiply_tool描述:  用于将传递的两个整型相乘参数:  {'a': {'title': 'A', 'description': '第一个数字', 'type': 'integer'}, 'b': {'title': 'B', 'description': '第二个数字', 'type': 'integer'}}直接返回:  True

对于已有的函数，并且想同时支持同步和异步，可以考虑使用 StructuredTool.from_function() 类方法来实现，该方法的配置项很灵活，而且无需太多额外代码。

3.3 BaseTool 子类

在 LangChain 中，所有的工具都是 BaseTool 子类，并且使用 @tool 或者 StructuredTool.from_function() 创建的工具，底层都是包装成了 StructuredTool，本质上也是 BaseTool 的子类。
所以如果对一个自定义工具来说，如果目前并没有任何一段已经实现的代码，则可以考虑继承 BaseTool 基类，并实现 _run() 方法来实现自定义工具（和使用 StructuredTool.from_function() 代码量差异并不是特别大）。
代码示例：

from typing importAny, Typefrom langchain_core.pydantic_v1 import BaseModel, Fieldfrom langchain_core.tools import BaseToolclassCalculatorInput(BaseModel):    a: int = Field(description="第一个数字")    b: int = Field(description="第二个数字")classMultiplyTool(BaseTool):    """乘法计算工具"""    name = "multiply_tool"    description = "将传递的两个数字相乘"    args_schema: Type[BaseModel] = CalculatorInput    def_run(self, a: int, b: int) -> Any:        return a * bcalculator = MultiplyTool()# 打印下该工具的相关信息print("名称: ", calculator.name)print("描述: ", calculator.description)print("参数: ", calculator.args)print("直接返回: ", calculator.return_direct)# 调用工具print(calculator.invoke({"a": 2, "b": 8}))

输出示例：

名称:  multiply_tool描述:  将传递的两个数字相乘参数:  {'a': {'title': 'A', 'description': '第一个数字', 'type': 'integer'}, 'b': {'title': 'B', 'description': '第二个数字', 'type': 'integer'}}直接返回:  False

四、相关查询插件的集成与编写

4.1 高德天气预报查询插件的集成与编写

高德 Web 服务 API 向开发者提供了大量的 HTTP 接口，涵盖了：地理/逆地理编码、路径规划、行政区域查询、IP定位、天气查询、坐标转换、轨迹纠偏等接口，并且向开发者提供了足量的调用额度，用于开发/调试各类地图类型的应用（商用需付费）。
• 高德 Web 服务 API 链接：https://lbs.amap.com/api/webservice/summary
• 高德开放平台控制台：https://console.amap.com/dev/index
在 LLMOps 项目中，我们会集成一个根据城市查询天气预报的自定义工具，所以可以考虑使用高德提供的服务，在使用之前，必须实名认证高德开放平台，并且创建应用，获取好对应的秘钥，并将其配置到环境变量中，例如

# 高德工具GAODE_API_KEY=00b0****e6e7
```在高德提供的服务中，天气预报 查询接口必须传递 城市编码 才可以获取对应城市的信息（天气预报），接口如下  
`https://restapi.amap.com/v3/weather/weatherInfo?city=<城市编码>&key=<用户key>`  
例如 110101 代表北京，所以需要一个额外的接口来根据传入的 城市名 获取到相应的 城市编码（行政区域查询），接口如下  
`https://restapi.amap.com/v3/config/district?keywords=<城市名>&subdistrict=0&key=<用户的key>`  
所以要完成一个输入 城市名 查询天气预报的函数/工具，必须先调用 行政区域查询 将城市转换为城市编码，然后在利用城市编码调用 天气预报 接口，从而完成整个流程，如下  
![](http://cdn.zhipoai.cn/fd79082c.jpg)

在这里插入图片描述

由于该接口并没有已经实现好的任何代码，所以可以考虑使用 BaseTool子类 的形式来实现，即工具接收一个参数 city 表示需要查询天气预报的城市名，然后调用 行政区域查询 接口获取该城市对应的 行政编码，接下来将 行政编码 传递给 天气预报 接口，获取最终天气信息。  
示例代码如下:

```plaintext
import jsonimport osfrom typing importType, Anyimport dotenvimport requestsfrom langchain_core.pydantic_v1 import Field, BaseModelfrom langchain_core.tools import BaseTooldotenv.load_dotenv()classGaodeWeatherArgsSchema(BaseModel):    city: str = Field(description="需要查询天气预报的目标城市，例如：广州")classGaodeWeatherTool(BaseTool):    """根据传入的城市名查询天气"""    name = "gaode_weather"    description = "当你想询问天气或与天气相关的问题时的工具。"    args_schema: Type[BaseModel] = GaodeWeatherArgsSchema    def_run(self, *args: Any, **kwargs: Any) -> str:        """运行工具获取对应城市的天气预报"""        try:            # 1.获取高德API秘钥，如果没有则抛出错误            gaode_api_key = os.getenv("GAODE_API_KEY")            ifnot gaode_api_key:                returnf"高德开放平台API秘钥未配置"            # 2.提取传递的城市名字并查询行政编码            city = kwargs.get("city", "")            session = requests.session()            api_domain = "https://restapi.amap.com/v3"            city_response = session.request(                method="GET",                url=f"{api_domain}/config/district?keywords={city}&subdistrict=0&extensions=all&key={gaode_api_key}",                headers={"Content-Type": "application/json; charset=utf-8"},            )            city_response.raise_for_status()            city_data = city_response.json()            # 3.提取行政编码调用天气预报查询接口            if city_data.get("info") == "OK":                iflen(city_data.get("districts")) > 0:                    ad_code = city_data["districts"][0]["adcode"]                    weather_response = session.request(                        method="GET",                        url=f"{api_domain}/weather/weatherInfo?city={ad_code}&extensions=all&key={gaode_api_key}&output=json",                        headers={"Content-Type": "application/json; charset=utf-8"},                    )                    weather_response.raise_for_status()                    weather_data = weather_response.json()                    if weather_data.get("info") == "OK":                        return json.dumps(weather_data)            session.close()            returnf"获取{kwargs.get('city')}天气预报信息失败"            # 4.整合天气预报信息并返回        except Exception as e:            returnf"获取{kwargs.get('city')}天气预报信息失败"gaode_weather = GaodeWeatherTool()print(gaode_weather.invoke({"city": "广州"}))

输出内容：

{"status": "1", "count": "1", "info": "OK", "infocode": "10000", "forecasts": [{"city": "广州市", "adcode": "440100", "province": "广东", "reporttime": "2024-08-12 15:30:27", "casts": [{"date": "2024-08-12", "week": "1", "dayweather": "中雨", "nightweather": "中雨", "daytemp": "34", "nighttemp": "25", "daywind": "北", "nightwind": "北", "daypower": "1-3", "nightpower": "1-3", "daytemp_float": "34.0", "nighttemp_float": "25.0"}, {"date": "2024-08-13", "week": "2", "dayweather": "中雨", "nightweather": "中雨", "daytemp": "33", "nighttemp": "25", "daywind": "北", "nightwind": "北", "daypower": "1-3", "nightpower": "1-3", "daytemp_float": "33.0", "nighttemp_float": "25.0"}, {"date": "2024-08-14", "week": "3", "dayweather": "中雨", "nightweather": "中雨-大雨", "daytemp": "33", "nighttemp": "25", "daywind": "北", "nightwind": "北", "daypower": "1-3", "nightpower": "1-3", "daytemp_float": "33.0", "nighttemp_float": "25.0"}, {"date": "2024-08-15", "week": "4", "dayweather": "中雨-大雨", "nightweather": "中雨-大雨", "daytemp": "33", "nighttemp": "25", "daywind": "北", "nightwind": "北", "daypower": "1-3", "nightpower": "1-3", "daytemp_float": "33.0", "nighttemp_float": "25.0"}]}]}

4.2 谷歌信息查询插件

4.2.1 Serper谷歌搜索

谷歌官方虽然提供了 API 搜索功能，但是体验感并不好，而且访问速度非常慢，所以在这里我们考虑使用第三方的谷歌搜索提供商——Serper，Serper 提供的谷歌搜索会在后台浏览器模拟真实的页面运行，完全模仿人类的操作，可以确保获得用户真正看到的内容（目前体验测试来看，Serper 比谷歌官方提供的检索服务内容更全面，响应速度更快）。
参考资料：
• LangChain Serper 谷歌搜索集成：https://imooc-langchain.shortvar.com/docs/integrations/tools/google_serper/
• Serper 官网：https://serper.dev/
可以使用任意的邮箱/Github/Google账号注册登录 SerperAPI 官网，并管理和创建 API 秘钥，将其配置到环境变量中，如下

# 谷歌Serper搜索SERPER_API_KEY=9b5bd82f638b1e51a9bf14802a0a2799286b194e

在 LangChain 中，已经为 Serper 搜索接口进行了工具的封装，目前有两个内置工具：GoogleSerperRun、GoogleSerperResults，其中 GoogleSerperRun 会单纯返回搜索文本的内容，而 GoogleSerperResults 还会包含检索网页链接等元数据。
不过 LangChain 封装的 GoogleSerperRun 工具内部并没有添加工具参数说明，并且工具描述也是英文的，对于一些参数量比较小，需要将其相应的描述等改成中文情景。
另外 Serper谷歌搜索还有一个很接近的工具——SerpAPI，这两个产品在名字和功能上非常接近，而且也特别容易弄混，该工具在 LangChain 中也进行封装，参考资料：
• LangChain SerpAPI 谷歌搜索集成：https://imooc-langchain.shortvar.com/docs/integrations/tools/serpapi/
• SerpAPI 官网：https://serpapi.com/

4.2.2 谷歌实时信息搜索工具实现

在 LangChain 中，实现对 GoogleSerperRun 工具的二次封装其实非常简单，甚至不需要重新定义一个工具类，只需要在实例化的时候，传递对应的参数即可，示例如下

import dotenvfrom langchain_community.tools import GoogleSerperRunfrom langchain_community.utilities import GoogleSerperAPIWrapperfrom langchain_core.pydantic_v1 import BaseModel, FieldclassGoogleSerperArgsSchema(BaseModel):    query: str = Field(description="执行谷歌搜索的查询语句")dotenv.load_dotenv()google_serper = GoogleSerperRun(    name="google_serper",    description=(        "一个低成本的谷歌搜索API。"        "当你需要回答有关时事的问题时，可以调用该工具。"        "该工具的输入是搜索查询语句。"    ),    args_schema=GoogleSerperArgsSchema,    api_wrapper=GoogleSerperAPIWrapper(),)print(google_serper.invoke("马拉松的世界记录是多少?"))

输出示例：

2004年1月1日，国际田联宣布，马拉松开始拥有世界纪录。 2023年10月8日晚（北京时间），在芝加哥马拉松比赛中，肯尼亚人基普图姆在芝加哥马拉松比赛中以2小时00分35秒的成绩打破基普乔格保持的世界纪录。

五、如何系统的学习大模型 AI ？

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

一直在更新，更多的大模型学习和面试资料已经上传带到CSDN的官方了，有需要的朋友可以扫描下方二维码免费领取【保证100%免费】👇👇

在这里插入图片描述

01.大模型风口已至：月薪30K+的AI岗正在批量诞生

在这里插入图片描述

2025年大模型应用呈现爆发式增长，根据工信部最新数据：

国内大模型相关岗位缺口达47万

初级工程师平均薪资28K（数据来源：BOSS直聘报告）

70%企业存在"能用模型不会调优"的痛点

真实案例：某二本机械专业学员，通过4个月系统学习，成功拿到某AI医疗公司大模型优化岗offer，薪资直接翻3倍！

02.大模型 AI 学习和面试资料

1️⃣ 提示词工程：把ChatGPT从玩具变成生产工具
2️⃣ RAG系统：让大模型精准输出行业知识
3️⃣ 智能体开发：用AutoGPT打造24小时数字员工

📦熬了三个大夜整理的《AI进化工具包》送你：
✔️ 大厂内部LLM落地手册（含58个真实案例）
✔️ 提示词设计模板库（覆盖12大应用场景）
✔️ 私藏学习路径图（0基础到项目实战仅需90天）

在这里插入图片描述

第一阶段（10天）：初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识，对大模型 AI 的理解超过 95% 的人，可以在相关讨论时发表高级、不跟风、又接地气的见解，别人只会和 AI 聊天，而你能调教 AI，并能用代码将大模型和业务衔接。

大模型 AI 能干什么？
大模型是怎样获得「智能」的？
用好 AI 的核心心法
大模型应用业务架构
大模型应用技术架构
代码示例：向 GPT-3.5 灌入新知识
提示工程的意义和核心思想
Prompt 典型构成
指令调优方法论
思维链和思维树
Prompt 攻击和防范
…

第二阶段（30天）：高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习，学会构造私有知识库，扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架，抓住最新的技术进展，适合 Python 和 JavaScript 程序员。

为什么要做 RAG
搭建一个简单的 ChatPDF
检索的基础概念
什么是向量表示（Embeddings）
向量数据库与向量检索
基于向量检索的 RAG
搭建 RAG 系统的扩展知识
混合检索与 RAG-Fusion 简介
向量模型本地部署
…

第三阶段（30天）：模型训练

恭喜你，如果学到这里，你基本可以找到一份大模型 AI相关的工作，自己也能训练 GPT 了！通过微调，训练自己的垂直大模型，能独立训练开源多模态大模型，掌握更多技术方案。

到此为止，大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗？

为什么要做 RAG
什么是模型
什么是模型训练
求解器 & 损失函数简介
小实验2：手写一个简单的神经网络并训练它
什么是训练/预训练/微调/轻量化微调
Transformer结构简介
轻量化微调
实验数据集的构建
…

第四阶段（20天）：商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知，可以在云端和本地等多种环境下部署大模型，找到适合自己的项目/创业方向，做一名被 AI 武装的产品经理。

硬件选型
带你了解全球大模型
使用国产大模型服务
搭建 OpenAI 代理
热身：基于阿里云 PAI 部署 Stable Diffusion
在本地计算机运行大模型
大模型的私有化部署
基于 vLLM 部署大模型
案例：如何优雅地在阿里云私有部署开源大模型
部署一套开源 LLM 项目
内容安全
互联网信息服务算法备案
…

学习是一个过程，只要学习就会有挑战。天道酬勤，你越努力，就会成为越优秀的自己。

如果你能在15天内完成所有的任务，那你堪称天才。然而，如果你能完成 60-70% 的内容，你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【`保证100%免费`】

在这里插入图片描述

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

CANN算子：面向算子开发的体系化实践指南

2048 AI社区

2025年AI Agent开发指南：五大热门框架详解，建议收藏学习

2048 AI社区

使用LLaVA构建多模态RAG系统：让大模型看懂你的图库

本文介绍了一种突破性的多模态RAG（检索增强生成）系统，能够同时处理图文信息。该系统通过视觉-文本双空间索引、跨模态对齐重排序和LLaVA微调等技术，在电商、教育、医疗等场景中实现"以图搜图+图文问答"功能，准确率提升40%以上。文章详细阐述了系统架构、核心技术实现（包括视觉编码器优化、混合检索器设计）、LLaVA微调技巧和生产级部署方案，并提供了性能实测数据（优化后响应时间提