登录社区云,与社区用户共同成长
邀请您加入社区
暂无图片
为遵守国家网络实名制规定,未绑定将限制内容发布与互动
bind_tools预编译工具说明书,挂载在 LLM 请求参数上;绑定时:提取工具元数据→缓存到新 LLM 实例;调用时:自动把工具清单塞进接口请求体传给大模型;运行时:模型根据说明书生成调用指令,本地代码查表执行真实函数。
SFT微调实战:方法对比与应用指南 本文深入解析大模型监督微调(SFT)的核心技术与工程实践,重点对比全参微调、LoRA和QLoRA三种方法的优劣及适用场景。主要内容包括: SFT定位:作为预训练与对齐间的关键环节,解决模型对话能力和业务适配问题 方法对比: 全参微调效果最好但成本最高(70B模型需840GB显存) LoRA通过低秩适配降低显存需求至1/3,支持多任务热切换 QLoRA进一步量化基
/ 登记新会话// 注销会话// 查列表注意多了一个type参数。这个参数是整个架构的点睛之笔,我后面会展开讲。负责管理会话(chatId)ChatMemory负责管理聊天内容(Message)Repository决定:有哪些会话Memory决定:每个会话聊过什么两者配合实现:历史记录 + 上下文记忆ChatHistoryRepository 管"有哪些会话"(目录),ChatMemory 管"每
本文通过分析解读Jing Huang等人的论文,探讨了大模型相较于小模型具备更强学习能力的根本原因。研究者们基于Scaling Law提出了两类能力划分:数据可补能力和必须靠模型规模才能获得的能力。研究发现: 任务学习顺序由"效用=频率×信号强度"决定,稀有复杂任务效用最低,往往只有大模型能学会;大模型通过减少梯度干扰和保留稀有任务记忆突破瓶颈:常见任务饱和后梯度减弱腾出容量,同时大模型能积累微弱
提示词缓存是 Agent 降低成本的核心机制,但稍有不慎就会全部作废。本文整理了 Claude Code 与 Reasonix 在缓存布局、模型切换、工具管理、消息传递、分叉操作五个方面的血泪教训,每一条都附有具体方案。
CC Switch:从配置切换器到AI编程统一管理平台 摘要: CC Switch已从最初的Claude Code/Codex供应商切换工具,发展为功能全面的AI编程管理平台。它通过统一界面管理多个AI编程工具(Claude Code、Codex、Gemini CLI等)的配置,支持供应商切换、本地代理路由、跨工具能力同步等功能。核心演进包括:采用SSOT架构集中管理供应商数据、扩展支持6+工具、
这不是客气——这是一个关键的指令。没有这句话,模型会倾向于"总要存点什么"来表现自己在工作。明确允许它说"没什么值得存的",大幅减少了低质量记忆的产生。当 memory 和 skill 同时需要 review 时,用。
进水温度 28℃,为什么算力还是跑不满?
找到匹配的会话后,不是直接把原始对话扔回给主模型——那太长了。它用一个辅助模型(Gemini Flash)对每个匹配的会话做摘要():加载匹配会话的完整对话记录以匹配位置为中心,截断到 ~100,000 字符(发给 Gemini Flash,用一个聚焦的 summarization prompt 生成摘要返回带元数据的摘要结果用便宜的辅助模型(Gemini Flash)来压缩长对话,再把短摘要喂给
总的来说,NANO 不只是提出了一个新的滤波算法,而是重新审视了非线性滤波的基本范式:将滤波问题的预测和更新步等价为对状态分布的优化问题,从而规避了线性化近似;通过自然梯度在高斯流形上直接优化后验,滤波器可以快速收敛到滤波问题的最优高斯解。对于高非线性、高噪声、异常观测频发的实际系统,这一方法为状态估计提供了一条兼具理论完备性、鲁棒性和工程效率的新路径!百度网盘:https://pan.baidu