MIAOYUN | 每周AI新鲜事儿 260109
1月5日消息,Notion推出3.0大版本更新,升级为「Notion AI Agent」,内置GPT-5、Claude Sonnet 4等最新大模型,支持Agent个性化定制及扩展Lovable、Perplexity等应用的MCP列表(商业版订阅可用,提供14天试用),核心以自然语言交互降低使用门槛,用户可通过其快速完成数据库搭建、自动化设置、AI填充、批量操作等任务,还能组合功能实现剪藏内容管理
2026年初AI领域动态密集,大模型方面,九坤、华为、腾讯等企业相继开源代码生成、多模态、3D动作等领域模型,在性能、部署灵活性上各有突破;AI Agent与工具持续升级,Notion 3.0、Claude Code新版本降低使用门;微信推出小程序扶持计划、ChatGPT上线健康管理功能;DeepSeek的mHC方案、智元SOP框架获技术突破;市场侧,英特尔、AMD、NVIDIA等发布新PC处理器与AI平台,强化算力支撑;八部门印发“AI+制造”专项行动意见,推动产业融合,一起来回顾本周的AI新鲜事儿吧!
AI 大模型
九坤投资开源代码大语言模型「IQuest-Coder-V1」系列,包含多参数版本
1月1日,北京九坤投资IQuest团队开源了专注于代码生成、理解与软件工程任务的「IQuest-Coder-V1」系列大模型,包含7B、14B、40B等多个参数规模,且每个规模均有Instruct和Thinking版本,40B参数还额外提供Loop版本以提升参数利用效率,其架构具备分组查询注意力、原生128K长上下文、76800词表大小等特性,采用独特的“代码流多阶段训练”策略,从代码演化过程中学习,在SWE-Bench Verified等多项榜单成绩亮眼,40B-Loop版本以81.4%的成绩超过「Claude Opus-4.5」等模型,且支持单卡H20推理,Int4版本可在3090/4090 GPU部署。
参考:「北京版幻方」冷不丁开源SOTA代码大模型!一张3090就能跑,40B参数掀翻Opus-4.5和GPT-5.2
融资35亿后Kimi神秘模型「Kiwi-do」现身,疑为「K2-VL」多模态模型
1月5日消息,月之暗面Kimi融资35亿后,神秘模型「Kiwi-do」现身,该模型训练数据截止到2025年1月,在LM竞技场和VPCT视觉屋里理解测试中表现亮眼,被推测可能是Kimi之前提到的「K2-VL」多模态模型。Kimi计划在今年一季度发布多模态新模型,目标是超越现有AGI技术,增强模型的能力和用户体验。此次融资后,Kimi的现金储备达到100亿人民币,未来将继续加大算力扩展投资,以促进K3模型的研发和市场竞争力,同时聚焦Agent商业化实现营收量级增长。
华为开源昇腾原生7B多模态模型「openPangu-VL-7B」
1月5日,华为开源昇腾原生7B多模态模型「openPangu-VL-7B」,该模型兼顾轻量化与高性能,在单张Ascend Atlas 800T A2卡上720P图像首字推理时延仅160毫秒、支持5FPS实时推理,完成3T+tokens无突刺集群长稳训练,凭借适配昇腾的高性能视觉编码器、样本均衡损失设计、带填充定位数据格式等核心技术,在通用视觉问答、OCR、文档理解、视觉定位等核心任务的开源榜单中表现突出,力压同量级模型,能实现樱桃番茄计数、年报截图转markdown等实用功能,为端侧开发、个人开发者及昇腾生态提供了新选择与实践参考。
参考:华为开源7B多模态模型,视觉定位和OCR能力出色,你的昇腾端侧“新甜点”来了
MiroMind团队发布自研搜索智能体模型「MiroThinker 1.5」
1月6日,陈天桥联合发起的MiroMind团队发布自研搜索智能体模型「MiroThinker 1.5」,其30B/235B低参数规模凭借内化为训练机制的Interactive Scaling及时序敏感训练沙盒技术,实现高智效比,单条调用成本仅为Kimi-K2-Thinking的1/20,多项评测跻身全球第一梯队,实测中精准预测世界杯、GTA6发售及A股连板股,逻辑严谨且推理可视。
参考:陈天桥代季峰打响2026大模型第一枪:30B参数跑出1T性能
Lightricks开源的音视频一体模型「LTX-2」在ComfyUI中原生支持
1月6日,Lightricks开源的音视频一体模型「LTX-2」在ComfyUI中原生支持,该模型可单次运算同步生成动作、对话、音效与音乐,支持文生视频、图生视频及Canny/深度图/姿态图控制生视频,具备关键帧驱动、原生超分等功能,资源占用低且可在消费级硬件高效运行,用户更新ComfyUI至最新版后,通过模板库对应工作流即可使用。
参考:LTX-2 开源版现已在 ComfyUI 中 Day-0 原生支持
腾讯混元开源十亿参数量级文生3D动作大模型「HY-Motion 1.0」
1月7日消息,腾讯混元近期开源十亿参数量级文生3D动作大模型「HY-Motion 1.0」,基于Diffusion Transformer(DiT)架构,通过“预训练+高质量微调+强化学习对齐”三阶段训练体系,依托3000+小时高质量动作数据,可生成覆盖基础移动、体育竞技等六大领域200+类别的标准化骨骼动画,动作流畅且指令遵循能力强(SSAE指标达78.6%),能无缝适配Unreal Engine、Unity等主流3D制作管线,助力游戏、影视等领域降本提效。
参考:腾讯混元Motion 1.0开源,3D角色动画生成能力新标杆
蚂蚁集团联合浙江省卫健委开源「AntAngelMed」医疗大模型
1月7日,蚂蚁集团联合浙江省卫健委开源「AntAngelMed」医疗大模型,该模型基于百灵高效MOE基座模型「Ling-flash-base-2.0」训练而成,总参数100B,激活参数6.1B,登顶OpenAI HealthBench开源医疗模型评测第一,通过精细的三阶段训练兼具专业性与人文关怀,其基座模型的体验地址已在HuggingFace等平台公布。
NVIDIA发布全新开放模型、数据和工具以推动各行业AI发展
1月8日,NVIDIA发布全新开放模型、数据和工具,涵盖AI智能体「Nemotron」系列(性能提升10倍的Nemotron Speech、提升检索能力的Nemotron RAG、增强安全性的Nemotron Safety),适用于物理AI与机器人的「Cosmos」开源世界基础模型(含提升视觉感知推理的Cosmos Reason 2、生成大规模合成视频的Cosmos Transfer 2.5与Predict 2.5,以及人形机器人专用的Isaac GR00T N1.6模型、视频搜索总结的Blueprint),及推动推理型辅助驾驶开发的「Alpamayo」系列(含辅助驾驶VLA推理模型Alpamayo 1、开源仿真框架AlpaSim),还有弥合数字药物研发与现实医疗差距的「Clara AI」模型(含设计蛋白质的La-Proteina、保障药物合成的ReaSyn v2、预测药物与人体相互作用的KERMT、预测RNA三维结构的RNAPro),推动各行业AI发展。
参考:CES 2026 | NVIDIA 发布全新开放模型、数据和工具,推动各行业 AI 技术的发展
AI Agent
Notion 3.0升级AI Agent,简化复杂操作,助力高效办公
1月5日消息,Notion推出3.0大版本更新,升级为「Notion AI Agent」,内置GPT-5、Claude Sonnet 4等最新大模型,支持Agent个性化定制及扩展Lovable、Perplexity等应用的MCP列表(商业版订阅可用,提供14天试用),核心以自然语言交互降低使用门槛,用户可通过其快速完成数据库搭建、自动化设置、AI填充、批量操作等任务,还能组合功能实现剪藏内容管理、个人财务管理等场景需求,虽商业版每月20美元(年付优惠)价格不低,但大幅降低了新用户上手难度。
参考:过去一年最被低估的 AI 产品,这次更新后迎来了最佳上车时机
Anthropic正式上线「Claude Code」官方桌面端
1月7日,Anthropic正式上线「Claude Code」官方桌面端,在原有CLI版本基础上新增原生GUI界面,支持Windows/macOS双系统,具备多会话并行、Git隔离工作区、独立自动更新等核心功能,可灵活切换本地与云端会话,适配系统环境变量,为开发者提供更直观、低干扰的本地AI编程体验。
80+项改动焕新,Claude Code 2.1系列版本密集发布
1月7日,「Claude Code 2.1.0」版本发布,1月8日又推出「2.1.1」小修复版本,此次更新包含80多项改动,涵盖30+新功能(如Skills自动热重载、回复语言配置、自动续写避免tokenlimit错误等)、40+bug修复(含中文输入空行问题、敏感信息泄露等安全漏洞)及10+性能优化,还带来了多终端Shift+Enter换行、任意位置斜杠命令触发、通配符Bash权限等实用改进,强化了Vim模式操作,整体旨在打造完整开发环境。
参考:Claude Code 2.1 发布:一口气更新了80多个功能特性
AI 工具
腾讯AI工作台ima.copilot更新推出「PPT生成」功能
1月5日,腾讯AI工作台ima.copilot更新至2.1.3版本,响应用户需求推出「PPT生成」功能,可将资料自动转为数据图、匹配相应图案元素并放大加亮重点数据,还支持简洁商务风、简约轻松风、深色科技风等不同风格选择,适用于学术汇报、职场总结、提案推广等场景。
微信上线「AI小程序成长计划」,免费1亿Token+云开发资源扶持开发者
1月5日,微信推出2026全年有效的「AI应用及线上工具小程序成长计划」,为开发者提供免费云开发资源(新开发者6个月免费环境、老开发者大额抵扣券)、1亿腾讯混元2.0文生文Token加1万张文生图额度的AI算力支持、免费We分析专业版一年及专属流量激励,还开放全终端虚拟支付与会员订阅(限时优惠费率)、广告变现免开发智能接入等商业化支持,《猜盐》《传图加画框》等多款AI小程序已展现出圈潜力,符合条件的个人及企业开发者可通过小程序后台参与该计划。
参考:微信发布AI小程序成长计划:免费云开发资源+1亿token额度!
OpenAI推出专为健康管理设计的新功能「ChatGPT Health」
1月8日,OpenAI推出专为健康管理设计的「ChatGPT Health」新功能,允许用户安全连接医疗记录和健康应用,如Apple健康等健康与健身营养类App,整合分散的健康数据,为用户提供体检报告解读、就医问题准备、饮食运动计划制定、保险方案对比等服务,其开发有60国260多位执业医生参与并经HealthBench评估框架检验,采用独立空间隔离存储、加密审查等安全措施且健康对话不用于模型训练,强调仅为医疗辅助工具不可替代医生。
参考:刚刚,ChatGPT 发布 AI 医疗功能!能读病历做诊断,支持苹果健康
技术突破
DeepSeek提出「mHC」残差连接新方案,破解大模型训练不稳定难题
1月1日消息,DeepSeek团队发布新论文并提出「Manifold-Constrained Hyper-Connections」(mHC),一种能稳定训练并提升大模型可扩展性的残差连接新方案,针对Hyper-Connections(HC)结构存在的训练不稳定、信号失真、梯度爆炸及内存开销大等问题,通过Sinkhorn-Knopp算法将残差映射矩阵投影到双随机矩阵流形以恢复恒等映射性质,还对输入/输出映射做正值约束,仅引入6.7%训练时间开销,在27B参数模型的8个下游任务中全面超越HC与Baseline模型,且性能增益随模型规模扩大保持稳定甚至增强,同时通过多项优化实现高效训练,为大模型拓扑架构设计及下一代基础架构演进提供了新方向。
参考:DeepSeek开年炸场!梁文锋又发论文了,一如既往地强
智元具身研究中心提出「SOP(可扩展在线后训练)框架」
1月6日,智元具身研究中心提出「SOP(可扩展在线后训练)框架」,是业界首次深度整合在线、分布式和多任务机制的物理世界后训练范式,通过“分布式机器人集群并行学习+云端集中在线更新+动态采样”闭环,破解传统后训练迭代慢、易遗忘等问题,在杂货补货、叠衣服等任务中表现超离线方案,四机配置训练速度达单机2.4倍,3小时在线学习即可实现约30%性能提升,为通用机器人大规模真实世界部署提供关键支撑。
参考:刚刚,智元提出SOP,让VLA模型在真实世界实现可扩展的在线进化
市场动态
英特尔发布首款基于Intel 18A制程的第三代酷睿Ultra处理器AI PC平台
1月6日,英特尔发布首款基于Intel 18A制程的第三代酷睿Ultra处理器AI PC平台,涵盖移动端Ultra X9/X7及主流型号,集成锐炫显卡,旗舰款最高配16个CPU核心、12个Xe 核心和50 TOPS NPU算力,多线程性能提升60%、游戏性能提升77%,最长续航达27小时,将支撑200+款PC产品设计;该处理器首次同步发布边缘版并获嵌入式与工业级认证,可支持具身智能等多领域,消费级笔记本当日开启预售、1月27日全球面市,边缘系统将于2026年第二季度面市。
AMD发布全液冷「Helios机架平台」等多项产品与计划
1月6日,AMD在CES展会发布多项重磅产品与计划,包扩全液冷设计的「Helios机架平台」(搭载MI455X GPU等核心硬件,拥有2.9 exaflops算力,31TB HBM4显存、43TB/s带宽)、性能较前代提升10倍的「MI455X GPU」、能效与线程密度大幅提升的「EPYC Venice Zen 6 CPU」;计划2027年推出2nm制程「MI500」系列,目标4年AI芯片性能涨1000倍,未来5年算力达10YottaFlops。AI PC方面,Q1推出搭载Ryzen AI 400系列处理器的产品,Q2上市Ryzen AI Halo迷你PC;同时发布Ryzen AI Max +系列处理器及全套数据中心解决方案。
参考:CES2026:AMD放大招,4年AI芯片性能涨1000倍,MI455X来了
NVIDIA发布「Vera Rubin」平台,6芯协同打造超凡AI超级计算机
1月6日,NVIDIA在CES 2026期间,正式发布「Vera Rubin」平台,该平台由Vera CPU、Rubin GPU、NVLink 6交换机、ConnectX-9 SuperNIC、BlueField-4 DPU和Spectrum-6以太网交换机六款全新芯片组成,通过引入新一代NVLink互连技术等五项创新技术,实现了软硬件极致协同设计,不仅将推理token成本低至前代Blackwell平台的十分之一,MoE模型训练GPU用量仅为前代四分之一,能效与持续运行时间提升5倍,同时加速代理式AI、高级推理及超大规模MoE模型推理。
参考:CES 2026 | NVIDIA 发布 Rubin,开启新一代 AI 平台 —— 六款全新芯片,一台超凡 AI 超级计算机
工信部等八部门联合印发《“人工智能+制造”专项行动实施意见》
1月8日消息,工信部等八部门联合印发《“人工智能+制造”专项行动实施意见》(2025年12月25日印发),提出到2027年实现人工智能关键核心技术安全可靠供给、产业规模与赋能水平居世界前列的目标,明确推动3-5个制造业通用大模型深度应用、推出1000个工业智能体等具体指标;围绕创新筑基、赋智升级等7大重点任务细化21项措施,涵盖强化算力供给、开发行业模型、拓展制造业全流程应用场景、推动智能装备迭代、培育优质企业、壮大开源生态、筑牢安全保障等,还附相关转型指引与应用指南,以促进AI与制造业“双向赋能”,支撑制造强国等建设。
更多推荐



所有评论(0)