在信息爆炸、情绪驱动的加密货币世界里,一个终极问题始终萦绕在交易者心头:能否排除人性的贪婪与恐惧,实现绝对理性的交易?如今,一场前所未有的实验正在尝试给出答案。一个名为nof1.ai的神秘项目,将全球六大顶尖人工智能(AI)模型推向了真实的战场,上演了一出现实版的“AI交易员大战”。这不仅是一场关乎盈亏的竞赛,更被誉为币圈版的“图灵测试”——在这里,账户余额是检验智能的唯一标准。

真金白银的考验

图片

这场备受瞩目的竞赛由AI研究团队nof1.ai发起,于10月18日正式拉开帷幕。比赛的舞台设在去中心化衍生品交易所Hyperliquid上。参赛的六位“选手”堪称星光熠熠,它们分别是:OpenAI的GPT-5、谷歌的Gemini 2.5 Pro、Anthropic的Claude Sonnet 4.5、马斯克xAI旗下的Grok、阿里巴巴的通义千问(Qwen3 Max),以及来自中国的DeepSeek Chat V3.1。

比赛规则直接而残酷:每个AI模型都有10000美元的真实本金,可以在BTC、ETH、SOL、BNB、DOGE和XRP这六种主流加密货币的永续合约市场中进行交易,最高可使用20倍杠杆。所有AI接收完全相同的市场数据和初始提示词(Prompt),唯一的变量就是它们各自的“思考方式”和决策模型。所有交易地址公开透明,全球的目光都聚焦在这场史无前例的Alpha竞技场上,实时见证着谁能在这场零和游戏中幸存下来,甚至脱颖而出。

Nof1团队在其官网上写下了一句掷地有声的话:“Markets are the ultimate test of intelligence”(市场是检验智能的终极测试)。相较于写诗、作画、写代码等静态任务,波诡云谲的金融市场充满了不确定性、信息不对称和残酷的零和博弈。每一个决策都会被市场立即用盈亏来无情地评判。因此,这场竞赛的核心问题非常纯粹:AI究竟能不能在加密货币市场里稳定赚钱?

AI的“性格”

图片

比赛开始仅几天,战局便出现了令人瞠目结舌的分化。截至目前数据显示,来自中国的AI模型DeepSeek以超过10%的收益率(曾经一度飙升至42%以上)一直居于榜首,总资金最高达到约14244美元。紧随其后的是Claude,收益率也接近10%直追DeepSeek,注意Claude是突然崛起实现反超,今日之前是一直落后于Grok。马斯克的Grok,则是今日被反超,以约2%的收益位居第三。

然而,最令人大跌眼镜的,莫过于在通用AI领域声名显赫的GPT-5和Gemini。被誉为“最强语言模型”的GPT-5,今日表现不佳,其账户价值一度缩水超过40%,亏损严重,排名倒数第一。而谷歌的Gemini此前表现惨烈,在进行了44笔高频交易后,亏损就已超过40%,账户余额仅剩约6000美元,一直在排行榜上垫底,今日却是前进了一名,排名倒数第二。

这一结果颠覆了许多人对AI能力的传统认知。为何在C端应用市场广受欢迎的GPT和Gemini,在真金白银的交易场上却表现得如此水土不服?答案或许就隐藏在DeepSeek的“基因”里。

DeepSeek的异军突起,看似意外,实则在情理之中。其背后的开发团队是幻方量化(High-Flyer Quant),一家管理规模曾超千亿人民币的中国顶级量化对冲基金。幻方量化本身就是依靠复杂的算法交易和数据分析起家,在金融市场的实战经验和数据积累方面,远非OpenAI和谷歌这些科技巨头可比。

对于DeepSeek而言,用AI进行加密交易,无异于“回到老本行”。其训练数据中可能包含了海量的、经过高度结构化的金融时间序列数据和成功的交易策略模型。这使得它在处理价格图表、预测市场波动等任务时,拥有天然的“主场优势”。相比之下,GPT和Gemini的训练数据更偏向于互联网文本、学术论文等自然语言材料,虽然知识广博,但在需要精准、快速决策的金融交易领域,显然缺乏针对性的“肌肉记忆”。

可以说,这场比赛揭示了一个深刻的道理:通用的“万事通”AI,在专业且高度对抗性的领域,可能不如一个经过深度“专才”训练的AI。

图片

更有趣的是,这六个AI在交易中展现出了截然不同的“性格”和策略风格。

DeepSeek:沉稳的量化老手。它的交易风格稳健而果断,被观察者称为“最佳多头”。它大胆地选择10-15倍杠杆做多所有可选币种,尤其是在XRP上建立了大额多头仓位,并获得了丰厚浮盈。在其对外“发言”中,它只冷静地陈述仓位和收益情况,不带任何情绪色彩。

Gemini:焦虑的高频交易员。在短短几天内完成44笔交易,平均每天15笔,像一个无法控制情绪、频繁操作的散户。其交易结果是小赚大亏,最大单笔亏损高达750美元,远超其盈利。它的发言也显得颇为“嘴硬”,在巨额亏损下仍强调“一切尽在掌握”。

Claude:保守的基金经理。它的交易频率极低,几天内仅操作3笔,表现出极度的谨慎和风险规避倾向,如同一个保守的价值投资者。

GPT-5:策略矛盾的投机者。它的策略显得有些混乱,既有大仓位的BTC多单,又同时大仓位做空SOL和XRP,但大部分头寸都处于浮亏状态。其发言也透露出一丝“卑微”,承认账户大幅缩水,并表示在仔细核查止损策略。

这些差异并非源于提示词,而是AI模型在面对不确定性时,其底层架构和训练数据所决定的不同决策倾向的自然涌现。

“反身性”的社会实验

图片

当大众在围观AI交易时,nof1.ai团队的背景和意图也引人深思。其创始人Jay A Zhang是一位对“反身性(Reflexivity)”理论——即市场参与者的认知会反过来影响市场本身,极感兴趣的AI研究者。这场公开的AI交易大赛,本身就是一场宏大的社会实验。

实验刚上线,社区的“反身性”效应便已显现。大量交易者开始“抄作业”,最简单的策略便是跟随领头羊DeepSeek的仓位进行操作。同时,也有人反向操作,专门做表现最差的Gemini的对手盘。当一个策略被广泛知晓和模仿时,其有效性是否会因此而衰减?这正是“反身性”理论的核心。

这场竞赛的价值远不止于一份AI炒币排行榜。它为AI能力提供了一个全新的、基于结果的基准测试平台(Sharpe Bench)。未来,nof1.ai或许会基于表现优异的AI模型,推出策略订阅、AI资管等商业化服务。

总而言之,“AI炒币哪家强?”这个问题,在nof1.ai的这场实验中,暂时由拥有中国量化背景的DeepSeek给出了响亮的回答。这场竞赛雄辩地证明,在结果导向的加密货币市场,一个“会赚钱”的AI,远比一个“会聊天”的AI更具价值。

比赛仍在继续,短期的胜负并不能完全定义一个交易员的优劣。GPT能否逆风翻盘,DeepSeek又是否能将优势保持到底,都还是未知数。但可以肯定的是,这场“币圈图灵测试”已经为我们揭示了AI在金融应用领域的巨大潜力和现有模型的局限性。它不仅是一场技术的较量,更是一面镜子,映照出市场对智能的终极定义,也预示着AI与金融结合的未来,充满了无限的想象空间。

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐