【AIGC】Claude（Anthropic）

bryant_meng

837人浏览 · 2026-03-02 13:51:11

bryant_meng · 2026-03-02 13:51:11 发布

在这里插入图片描述

Claude 是由 Anthropic 公司开发的一系列大型语言模型（LLM），旨在提供安全、可靠、有益且符合人类价值观的 AI 助手。自 2023 年初首次发布以来，Claude 已成为与 OpenAI 的 GPT 系列、Google 的 Gemini 并列的主流大模型之一。

2025年11月19日，Anthropic宣布与微软扩大战略合作，Claude Sonnet 4.5、Haiku 4.5和Opus 4.1模型正式上线 Microsoft Foundry 平台公测。

2024

全球最强大模型一夜易主，GPT-4时代终结！Claude 3提前狙击GPT-5，3秒读懂万字论文理解力接近人类（2024年03月05日）
- 就在刚刚，GPT-4被从大模型铁王座上扯下来了！OpenAI最强竞对Anthropic发布的Claude 3系列模型，已经实现了对GPT-4的全面超越。网友表示：GPT-4时代已经终结，OpenAI可以请出Q*了。
- Anthropic，就是曾因安全理念不合，而从OpenAI「叛逃」出的员工组成的初创公司，他们的产品一再给OpenAI暴击。
- Claude 3系列的3个模型，都将至少支持20万token的上下文窗口。
- Claude 3 Opus（作品）、Claude 3 Sonnet（十四行诗）、Claude 3 Haiku（俳句）
全球最强模型Claude 3颠覆物理/化学！2小时破解博士一年实验成果，网友惊呼：科研不存在了（2024.03.07）
Bengio团队提出多模态新基准，直指Claude 3.5和GPT-4o弱点（2024.06.28）
- 在中文的困难难度上，模型遇到了更大的麻烦。表现得最好的是 GPT-4o，但其只有 2.2% 的准确率。除了 CogVLM2-Chinese 和 Qwen-VL-Max，绝大多数模型的准确率都接近 0%。
- 视觉字幕恢复（Visual Caption Restoration, VCR）任务旨在恢复图像中被遮挡的文本，这一任务在视觉问答（Visual Question Answering, VQA，没有标准答案）和 OCR （可以不依赖于上下文）之间架起了桥梁。
菲尔兹奖得主亲测GPT-4o，经典过河难题破解失败！最强Claude 3.5回答离谱，LeCun嘲讽LLM（2024.06.30）
- 在此，他给出了一个新的基准——废话比率（crapness ratio），即LLM给出的总答案与正确答案之间的比率。
- 这里，ChatGPT必须在逻辑上把「农民」和人联系起来，把「鸡」和动物联系起来，然后规划出最佳的过河次数。
- 另一位网友同样发现，如果用「动物」代替「鸡」，那么Claude 3.5 Sonnet一下子就解决了这个问题。
- 几乎是每提出一个新的测试集，模型就能迅速达到人类水平甚至超越
Claude 3.5两小时暴虐50多名专家，编程10倍速飙升！但8小时曝出惊人短板（2024-11-24）
- AI自主研发会真的「失控」了吗？最新研究显示，Claude 3.5 Sonnet 和 o1-preview 在2小时内的研发任务中，击败了50多位人类专家。但另一个耐人寻味的现象是，给予更长时间周期后，人类专家在8小时任务中优势显现。
- 虽然良好的实验可以帮助人类专家在环境中做出明智的预测，但智能体还是主要依赖猜测，更多是运气而不是技巧的问题。
中科院北大等揭示「蒸馏真相」：除Claude豆包Gemini，其他很多模型都「蒸」过头（2025-01-21）
- 过度蒸馏可能会导致同质化，降低模型之间的多样性，并削弱它们稳健处理复杂或新任务的能力。这些限制凸显了系统地量化蒸馏过程及其影响的必要性。
- https://github.com/Aegis1863/LLMs-Distillation-Quantification/blob/main/paper.pdf
- ICE的结果如图4所示，宽松分数和严格分数都表明GLM-4-Plus、QwenMax和Deepseek-V3是疑似响应数量最多的三个大语言模型，这表明它们的蒸馏程度较高。
- 这项工作首次对大语言模型的蒸馏进行了评估和量化，主要聚焦两个关键方面：1. 识别越狱攻击下的自我认知矛盾，以评估大语言模型在自我认知方面的一致性；2. 分析多粒度的响应相似性，以衡量大语言模型之间的同质化程度。
- 越狱攻击利用大语言模型中的漏洞，允许用户绕过安全过滤器和道德准则。

2025

Anthropic CEO惊人预警：27年AI超越人类！Claude今年更新全剧透（2025-01-22）
AI编程新王Claude 4，深夜震撼登基！连续编码7小时，开发者惊掉下巴（2025-05-23）
- CEO Dario Amodei亲自上阵，携 Claude Opus 4 和 Claude Sonnet 4 亮相，再次将编码、高级推理和AI智能体，推向全新的标准
- 总的来说，Claude 4是向虚拟协作者迈出的一大步——能够保持完整的上下文理解，在较长项目中持续专注，从而推动变革性的影响。
RLHF已死，RLVR引爆AGI革命！Claude 4核心成员万字对谈（2025-06-07）
- LLM可以处理智力高度复杂的问题，但前提是问题上下文要明确、边界要清晰。如果任务比较模糊，或者需要在环境中反复探索、试错、迭代，它们就会吃力。
- 具体而言，就是「可验证奖励的强化学习」（RL from verifiable rewards）。
AI写爆款博客火出圈，主笔竟是Claude！（2025-06-19）
- 最近，Anthropic给自家AI开了个博客。这个叫「Claude Explain」的博客页面，内容主要由AI模型Claude生成。
- 目前尚不清楚Claude的原始写作内容在文章中占多大比例。
- 剧情反转——这博客才活了一个月就挂了！
- 有些人觉得这博客就是个包装精美的营销套路，还有人吐槽Anthropic没说清楚哪些内容是Claude自己写的，哪些是人类改的。
- AI让工作更高效，而不是抢饭碗
- AI不是万能的，尤其是需要细腻沟通的时候，还得靠人。现在明白啥叫「技术要狠，人情味要稳」了。
- 「会用AI」和「只会用AI」，是完全不一样的。
万字长文，一个半月高强度Claude Code使用后感受！（2025-08-12）
- 「如果你真的想进入深度的 vibe coding 状态，让 AI 发挥最大潜力，这种随时准备接管的心态反而会成为阻碍。人类开发者的干预时机和直接下场写代码的时候越少，最终呈现出的效率和效果反而越好。」
- 擅长的地方
- 不擅长的地方
- 还有个更现实的问题：训练数据的偏差。训练集丰富程度的差异直接决定了模型在不同领域的表现。
- 思考先行还是实践先行
- 如果你是个经验丰富的开发者，对项目架构已经有了清晰的认识，那么先进行充分的规划确实能让后续的实现更加顺畅。
- 但如果你对某个技术栈完全不熟悉，或者正在做一个全新的探索性项目，那么「先干起来」可能反而是更好的选择。
- Plan Mode 还有个隐藏的好处：它能帮你整理思路。有时候你觉得自己想清楚了，但真要说出来或者写下来，才发现还有很多细节没考虑到。
- 小步迭代还是放飞自我
- 放飞自我也不是完全不可取
- 如何在有限的上下文窗口内完成复杂任务，就成了使用 CC 的一门必修课。
- subagent
- PR 的含义
- 从 8 月底开始，weekly 限制正式实施。
Karpathy氛围编程最新指南！三层AI编程结构：顺境Cursor，逆境Claude，绝境GPT-5 Pro（2025-08-25）
- Cursor——主要负责自动补全与小范围代码修改，高效传达任务意图。
- Claude Code/Codex——用于实现较大功能块，快速原型开发和跨领域代码尝试。
- GPT-5 Pro——解决最棘手的 bug 或复杂抽象，提供深度文档/资料支持。
- 第二层，就是 Claude Code/Codex 等可以在 Cursor 侧栏中配置的模型
- Karpathy表示，GPT-5 Pro非常强大，能挖掘出各种深奥的文档和论文。在处理清理抽象结构、做文献综述、调查研究等复杂任务中，也能返回高相关性的资源和线索。
突发！Claude全面封禁中国公司（2025-09-05）
Claude Sonnet 4.5发布，卷编程，Claude是认真的。（2025-09-30）
- 我们都知道，GPT-5 Codex 曾自称能独立运行超过 7 小时。但这次，Claude Sonnet 4.5 把自主编码时长提到了 30 多个小时。

Anthropic 发布 AI Agent 上下文工程指南（2025-10-02）

今年6月，Andrej Karpathy 带火了一个词——上下文工程。他支持用“上下文工程”（context engineering）取代“提示词工程”（prompt engineering）

维度	提示词工程 (Prompt Engineering)	上下文工程 (Context Engineering)
关注焦点	指令本身（怎么说）	信息供给（给什么）
时间跨度	单次交互（Stateless/短时有状态）	多轮对话、长期任务（Stateful/长时有状态）
核心技术	角色扮演、思维链（CoT）、分隔符、示例微调	RAG（检索增强生成）、向量数据库、记忆分层、窗口管理、动态插值
解决问题	提升单次回答的准确性、格式规范性和逻辑性	解决“遗忘”问题，保持任务连贯性，实现个性化和复杂推理
系统架构	通常属于应用层的逻辑细节	涉及系统架构设计（如记忆模块、检索管道）
局限性突破	难以突破模型上下文窗口限制，无法记住长期历史	通过外部存储和动态检索，理论上可支持无限长的“记忆”
典型场景	文案生成、代码片段编写、单次翻译	智能客服、个人AI助理、复杂数据分析Agent、自动化工作流

如果把大模型比作一位博学的顾问：提示词工程是在研究如何向他提问才能让他回答得更好。上下文工程是在研究如何为他整理资料、建立档案，让他不仅能回答当前问题，还能记得你的喜好、了解项目的来龙去脉，从而成为真正的长期合作伙伴。
提示词工程像是给员工写一封精准的“邮件”或下达一个明确的“口头指令”，希望对方一次性把事做对。上下文工程像是为员工搭建一个完整的“工作台”，不仅包括当前的指令，还放上了项目档案、过往会议纪要、公司规章制度和常用工具，让员工能基于完整背景持续工作。
Anthropic 明确指出：构建 AI 应用的重心，已经从寻找合适的提示词，转向一个更根本的问题：怎样的上下文配置最有可能引导模型做出我们想要的行为？
Anthropic 认为，上下文工程是提示词工程的自然演进。
上下文工程正是一门从这一动态演变的信息海洋中，精准选取适合的信息放入有限的上下文窗口内容的艺术。
优秀的上下文工程应该去寻找最少数量但信息量最高的 token 集，从而最大程度地促使期望结果的出现。
针对长期任务的上下文工程，智能体需要专门的技术来绕过上下文窗口大小限制。
压缩是将接近上下文窗口限制的对话进行总结，并用摘要重新启动新的上下文窗口的做法。
结构化笔记，也称为智能体记忆，是指智能体定期将信息以笔记形式记录下来，并持久地存储在上下文窗口之外的内存中，以便后续重新载入上下文窗口使用。
子智能体架构提供了另一种绕过上下文限制的方法。主智能负责统筹协调，制定高层计划，而子智能体则专注于执行深入的技术任务，或调用工具获取相关信息。每个子智能体可以在本地进行大量探索，使用数万个 token 或更多，但最终仅向主智能体返回精炼后的成果摘要（通常为 1,000-2,000 个 token）。
无论你是为长时间跨度任务实现压缩，设计 token 高效的工具，还是使智能体能够即时探索其环境，指导原则都保持不变：找到最小的高信号 token 集，最大化你期望结果的可能性。

新型「验证码」诞生？这张图让 ChatGPT、Claude、Gemini 都翻了车（2025-10-27）

2026

有用！收藏！Claude Code创始人首次公开：我的13个使用技巧！（2026-01-04）
笑死！xAI员工竟用Claude写代码？这回Anthropic反手拔了马斯克的网线（2026-01-10）
- Anthropic的官方立场很明确——他们的服务条款明确禁止：使用 Claude 构建竞争性产品或服务；对其技术进行逆向工程或复制服务
- 早在2025年8月，Anthropic就曾以类似理由封杀过OpenAI的开发者级API访问权限。
- 事实上，xAI已经在2025年8月推出了grok-code-fast-1——一个精通TypeScript、Python、Java、Rust、C++和Go的编程模型，并且已经通过Cursor等平台开放使用。
- 核心能力不能外包
- AI工具正在从中立基础设施变成阵营武器
编程已死，键盘长草！Claude Code之父对谈Kaparthy，全程爆金句（2026-02-04）
- Andrej Karpathy与Claude Code负责人Boris Cherny展开了一场关于编程未来的终极对谈。面对AI接管100%代码编写的现状，Karpathy坦言人类正处于「脑萎缩」与能力进化的十字路口。
- 这场对话的双方，一位是特斯拉前AI总监、OpenAI创始成员 Andrej Karpathy，他是「Software 2.0」概念的提出者，一直站在编程范式转移的最前沿；另一位是 Claude Code 的缔造者、Anthropic 的核心人物 Boris Cherny，他正在亲手打造终结传统编程的工具。
- Karpathy 略带自嘲但也无比诚实地承认，「这有点伤自尊，告诉 AI 该写什么，就像在指挥一个实习生。但当你习惯了那种大规模驾驭软件的『代码操作』能力后，你根本回不去了。」
Claude新模型4.6来了！更多饭碗没了：华尔街财务、编译器、安全白帽、PPT…通通失守（2026-02-06）
- 一睁眼，Anthropic上新模型，让Claude Opus 4.6来给您拜！年！了！消息一出，金融数据服务商FactSet最惨盘中暴跌10%，S&P Global、穆迪、纳斯达克公司纷纷下跌，各大指数全线跳水。
- 投资者的恐慌聚焦在一个问题：谁能保证几年内不被AI颠覆？不能就抛售。
- 今天以前，大家对Claude的印象，就是编程能力断档性的强。Claude Opus 4.6 冷笑一声，梆梆一拳打破这个印象：俺在更多的领域都很强！
- 至少就官方说法而言，财务分析、研究，以及Office三件套，Claude Opus 4.6都可以玩儿得贼溜。
- 带着 1M 上下文和自适应思考杀回巅峰
- 无论是复杂的法律、金融专业知识还是刁钻的学术研究，它的推理理解深度都达到了目前frontier models的顶峰。
- 16个Agent两周写完C编译器，运行毁灭战士。Opus 4.6带来的一项核心能力升级是 Agent Teams，即多个 Claude 实例并行协作，无需人类实时监督。
- 为了防止多个Agent撞车，都屁颠屁颠跑去解决同一个问题，系统用了一个简单的锁机制。
价格狂飙6倍！Claude凌晨上线极速模式，网友集体破防：比OpenAI还黑（2026-02-08）
- 就在刚刚，Claude Opus 4.6上线了一个极速模式（Fast mode）。性能一致，速度却达到了正常模式下的2.5 倍！
- 标准模式下Opus 4.6的输出定价是每百万token 25美元，而Fast Mode直接飙到了150美元。
硬碰硬！刚刚，Claude Opus 4.6与GPT-5.3-Codex同时发布（2026-02-08）
- opus、sonnet
- 北京时间 2 月 6 日凌晨，Anthropic 与 OpenAI 相继推出了新版本基础大模型，分别是 Claude Opus 4.6 与 GPT-5.3-Codex。
- 为了证明 Opus 4.6 的强大智能体能力，Anthropic 的一名研究员使用 16 个智能体从零开始构建了一个基于 Rust 的 C 语言编译器，设定任务后就基本放手不管了。最后 AI 输出的代码长达 10 万行，可以编译 Linux 内核，耗资 2 万美元，超过 2000 次 Claude Code 会话，历时两周。
- 该编译器可以在 x86、ARM 和 RISC-V 上构建可启动的 Linux 6.9，它通过了 GCC 99% 的压力测试，可以编译 FFmpeg、Redis、PostgreSQL、QEMU，还通过了开发者的终极考验：编译并运行了 Doom 游戏。
刚刚，Anthropic 53页绝密报告曝光：Claude自我逃逸，将引爆全球灾难！（2026-02-12）
- Anthropic认为：Claude Opus 4.6 的风险已经逼近 ASL-4，是时候拉响警报了。
- 历史一再证明，当危险技术逼近边界时，最先察觉的不是公众，不是媒体，不是资本市场，而是内部安全人员。
- AI Safety Level（ASL）分级如下
从零搓出一个Claude Code，一篇超详细的总结！（2026-02-12）
- 这篇文章记录了我作为一个 Agent 开发初学者，跟着 Datawhale 的 Hello-Agent 教程一步步学习和实践的过程。
- https://github.com/YYHDBL/MyCodeAgent.git
- Claude Code、GitHub Copilot、Cursor、Codex……工具一个比一个强。
- 以前我觉得，AI 时代工程师的价值会下降。现在我觉得恰恰相反：模型越强大，越需要工程能力来驾驭它。就像汽车引擎越来越强，但好的底盘、刹车、悬挂系统反而更重要。
Claude官方接入这个画图神器了，我不允许你还不知道这么好用的东西！（2026-02-23）
- 最早的时候，我使用Visio画图，但 Visio 画的图太冰冷了一点，比较适合教科书那种严肃的风格
- 后来我开始用 draw.io
- Excalidraw 诞生于2020年，Facebook工程师Vojtech Rinik闲着没事，突发奇想做了这么个工具。
- 访问 https://excalidraw.com 就能马上开始画。
- Claude 现在可以通过 MCP 连接 Excalidraw 了！
- Excalidraw 本质上是一个“手绘风格”的在线白板工具，它的核心是让你（或团队）手动绘图，而不是默认由 AI 自动生成图片。但是，现在的 Excalidraw 已经深度集成了 AI 功能，你可以选择让它帮你画。
最新AI Jun Shi 模拟：Claude、Gemini、GPT对决，95%对局发射核弹（2026-02-28）
- 伦敦国王学院的学者肯尼斯·佩恩（Kenneth Payne）近期完成了一项针对前沿大语言模型的兵棋推演实验。
TLP 下令：BaiGong 全面封杀Claude！
- 有史以来第一次，谷歌、OpenAI等巨头出人意料地统一战线，坚定地站在Anthropic这一边。
- 原因竟是，五角大楼逼迫 Claude，向 jun fang 开放「所有合法用途」，彻底拆除安全护栏。
- Dario Amodei公开回应：我们的良知决不允许向这些要求妥协。
- 这一次，意味着价值2亿美金合同泡汤不说，所有联邦机构必须立即停止使用Claude。

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

【云馨AI】需求是否真的做完了？COSMIC 一键生成「功能点对比清单」，AI自动帮你验收需求

2048 AI社区

我用 AI Agent 搭了一套多平台自动分发系统，踩了这些坑

这套系统的核心不是某个具体技术，而是分层的自动化策略有 API 用 API（最稳定、维护成本最低）没 API 用无头浏览器（Puppeteer + Stealth，适合大多数场景）反爬严格就复用真实浏览器会话（AppleScript 注入，兜底方案）每增加一个新平台，先评估它属于哪一层，再选择对应的技术方案。不要试图用一种方案覆盖所有平台——每个平台的反爬策略、编辑器实现、API 开放度都不同。-