金融交易要变天?一文读懂大语言模型Agent如何重塑行业!
本文综述了LLM在股票量化交易中的应用研究,主要分为两种技术框架:LLM作为直接交易决策者和阿尔法因子挖掘器。交易决策框架包括新闻驱动、反思驱动、辩论驱动和强化学习驱动四种类型,利用文本、数值、视觉等多模态数据生成交易信号。阿尔法因子挖掘则通过内循环-外循环架构优化因子生成。研究表明,LLM交易策略在回测中实现15%-30%的年化收益,表现优于传统方法。文章还概述了学习大模型AI的路径,分为初阶应
论文背景
在量化投资领域,股票量化交易是一项极具竞争性的任务,需要策略、知识和心理韧性的结合。在本综述中,我们全面回顾了当前关于将 LLMs 用作金融交易Agent的研究。我们总结了Agent中使用的常见架构、数据输入,以及 LLM 交易Agent在回测中的性能,还有这些研究中存在的挑战。
技术框架
架构大致可分为两类:LLM 作为交易者和 阿尔法因子挖掘器。如下图示,LLM交易者Agent利用 LLMs 直接生成交易决策(即买入、持有、卖出)。另一方面,阿尔法因子挖掘器Agent利用 LLM 作为高效工具来生成高质量的阿尔法因子,随后将这些因子整合到下游交易系统中。
1)LLM作为交易者
✅新闻驱动型
指的是个股新闻和宏观经济更新被整合到Prompt上下文中。然后指示 LLMs 预测下一个交易周期的股票价格走势。例如:渐进式每日新闻总结、基本面和宏观经济总结以及股票价格动量总结。这些总结由记忆模块管理,并被称为 “记忆”。在交易阶段,相关的 “记忆” 被检索作为 “推荐” 上下文,以生成最终的交易决策。
✅反思驱动型
建立在利用 LLM 总结提取的记忆之上。它是从原始记忆和观察中逐步聚合的高级知识和见解。这种反思用于做出交易决策。
FinMem引入了一种具有分层记忆和特征的交易Agent。原始输入,如每日新闻和财务报告,被总结为记忆。当新的观察结果出现时,检索相关记忆并将其与这些观察结果整合以产生反思。记忆和反思都存储在分层记忆桶中。在交易阶段,这些记忆和反思被检索并由决策模块用于生成最终的交易决策。检索方法考虑信息的新近度、相关性和重要性。
FinAgent提出了第一个多模态Agent,具有类似的分层记忆和分层反思设计,额外增加了一个多模态模块,用于接收数值、文本和图像数据。此外,决策模块整合了诸如移动平均收敛散度(MACD)和相对强弱指数(RSI)等技术指标以及分析师指导,以有效捕捉市场动态。与包括 FinMem 在内的其他Agent相比,该框架在回测中表现出更优异的性能。
✅辩论驱动型
LLMs 之间的辩论是提高推理和事实有效性的有效方法。这种方法在 LLM 金融Agent中也被广泛采用。例如异构辩论框架:具有不同角色(即情绪Agent、修辞Agent、依赖Agent等)的 LLM Agent相互辩论,这提高了新闻情感分类性能。
✅强化学习驱动型
强化学习方法,如 RLHF和 RLAIF,已被证明能有效地使 LLM 输出与预期行为对齐。然而,一个挑战是高效且系统地获得高质量反馈。在金融交易中,回测提供了一种经济高效的方法来生成关于交易决策的高质量反馈,并且直观地可以作为强化学习中的奖励来源。
2)LLM 作为阿尔法因子挖掘器
LLM 生成阿尔法因子而不是直接做出交易决策。例如QuantAgent展示了这种方法,它利用 LLM 通过内循环 - 外循环架构生成阿尔法因子。在内循环中: writer Agent接收来自人类交易者的一般想法,并生成作为其实现的脚本。 judge Agent提供反馈以完善脚本。在外循环中:已提交的代码在现实世界市场中进行测试,交易结果用于增强 judge Agent。事实证明,这种方法使Agent能够以合理的效率逐步接近最佳行为。
3)Agent LLM选择
为了研究不同 LLM 模型的使用情况,我们包含了一个 LLM 模型的直方图以提供一个概述。值得注意的是,OpenAI 的模型,由于其出色的整体性能,在研究中使用最为广泛。开源模型的选择也呈现出长尾分布,以满足更灵活和专门化开发的需求。
数据集
基于 LLM 的交易Agent严重依赖各种数据源来生成交易信号。在我们的综述中,我们确定了各种Agent使用的广泛数据类型,我们将其分为四大类:
✅数值数据:数字或统计数据,如股票价格和交易量。
在传统的量化交易模型中,数值数据发挥了关键作用。然而,LLMs 本质上是为处理文本数据而设计的。为了适应数值数据,必须将其转换为文本字符串,以确保与 LLM 架构的兼容性。例如:股票价格特征、开盘价和收盘价、最高价和最低价等,LLM 对这些特征进行描述和总结,以形成短期、中期和长期信号。这些信号有助于 LLM Agent的低级反思过程。
✅文本数据:基于文本的信息,如股票新闻、财务报告。
基本面数据:财务报告和分析师报告。
财务报告:10-Q 表格和 10-K 表格文件,对于理解公司业绩至关重要。
分析师报告:行业专业人士的分析师报告和投资研究提供了宝贵的数据。这些来源提供了超出公开财务报告和新闻文章所含信息的高质量见解、观点和预测。
替代数据:用于评估公司和市场的非传统信息。补充了财务报告等传统来源。
新闻数据:LLMs 擅长从新闻数据中提取情感信息,这可能是交易决策的关键信号。
✅视觉数据:包括与金融市场相关的图表和图像。
K 线图、成交量图、交易图表等。
✅模拟数据:包括来自模拟股票市场和新闻事件的数据。
模拟数据和环境是为了复制现实世界场景而创建的。
策略逻辑及评估
1)策略逻辑
✅LLM 通过分析市场新闻或财务报表等文本数据生成简单的交易信号,如 “买入”、“持有”、“卖出”。比如在 FinLlama中,标准普尔 500 指数中的所有股票都由 LLM 排名,前 35% 被分配到多头头寸,而后 35% 被分配到空头头寸。
✅将多头分配给具有整体正面新闻情绪的股票,将空头分配给具有负面情绪的股票。
✅采用等权重或基于市值的权重。
2)指标
✅累计回报和年化回报:用于衡量交易策略的整体盈利能力。
✅夏普比率和最大回撤:用于评估交易绩效的风险。
3)回测
✅美国股票市场、中国市场。
✅基准方法:基于规则的、基于机器学习(或深度学习)的和基于强化学习的。
✅LLM Agent实现了 15% 至 30% 的年化回报,超过了最强的基准,这表明在金融交易中使用 LLM 具有巨大潜力。
如何学习大模型 AI ?
由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。
但是具体到个人,只能说是:
“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。
这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。
我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。
我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
这份完整版的大模型 AI 学习和面试资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】
01.大模型风口已至:月薪30K+的AI岗正在批量诞生
2025年大模型应用呈现爆发式增长,根据工信部最新数据:
国内大模型相关岗位缺口达47万
初级工程师平均薪资28K(数据来源:BOSS直聘报告)
70%企业存在"能用模型不会调优"的痛点
真实案例:某二本机械专业学员,通过4个月系统学习,成功拿到某AI医疗公司大模型优化岗offer,薪资直接翻3倍!
02.如何学习大模型 AI ?
🔥AI取代的不是人类,而是不会用AI的人!麦肯锡最新报告显示:掌握AI工具的从业者生产效率提升47%,薪资溢价达34%!🚀
由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。
但是具体到个人,只能说是:
“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。
这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。
我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。
我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
1️⃣ 提示词工程:把ChatGPT从玩具变成生产工具
2️⃣ RAG系统:让大模型精准输出行业知识
3️⃣ 智能体开发:用AutoGPT打造24小时数字员工
📦熬了三个大夜整理的《AI进化工具包》送你:
✔️ 大厂内部LLM落地手册(含58个真实案例)
✔️ 提示词设计模板库(覆盖12大应用场景)
✔️ 私藏学习路径图(0基础到项目实战仅需90天)
第一阶段(10天):初阶应用
该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。
- 大模型 AI 能干什么?
- 大模型是怎样获得「智能」的?
- 用好 AI 的核心心法
- 大模型应用业务架构
- 大模型应用技术架构
- 代码示例:向 GPT-3.5 灌入新知识
- 提示工程的意义和核心思想
- Prompt 典型构成
- 指令调优方法论
- 思维链和思维树
- Prompt 攻击和防范
- …
第二阶段(30天):高阶应用
该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。
- 为什么要做 RAG
- 搭建一个简单的 ChatPDF
- 检索的基础概念
- 什么是向量表示(Embeddings)
- 向量数据库与向量检索
- 基于向量检索的 RAG
- 搭建 RAG 系统的扩展知识
- 混合检索与 RAG-Fusion 简介
- 向量模型本地部署
- …
第三阶段(30天):模型训练
恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。
到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?
- 为什么要做 RAG
- 什么是模型
- 什么是模型训练
- 求解器 & 损失函数简介
- 小实验2:手写一个简单的神经网络并训练它
- 什么是训练/预训练/微调/轻量化微调
- Transformer结构简介
- 轻量化微调
- 实验数据集的构建
- …
第四阶段(20天):商业闭环
对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。
- 硬件选型
- 带你了解全球大模型
- 使用国产大模型服务
- 搭建 OpenAI 代理
- 热身:基于阿里云 PAI 部署 Stable Diffusion
- 在本地计算机运行大模型
- 大模型的私有化部署
- 基于 vLLM 部署大模型
- 案例:如何优雅地在阿里云私有部署开源大模型
- 部署一套开源 LLM 项目
- 内容安全
- 互联网信息服务算法备案
- …
学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。
如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。
这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费
】
更多推荐
所有评论(0)