2025年11月23日全球AI前沿动态

AI领域大模型竞争白热化，谷歌、OpenAI等推新模型，国内蚂蚁、华为等发力产品落地；具身智能、多模态成突破点，医疗AI加速落地，同时面临算力、伦理等挑战，资本聚焦算力与场景应用。

happyprince

1015人浏览 · 2025-11-22 22:17:42

happyprince · 2025-11-22 22:17:42 发布

摘要

国内技术关键词

蚂蚁灵光(蚂蚁集团)[★★★]：蚂蚁集团推出的全模态通用AI助手，核心为“闪应用”快速生成架构，30秒可生成定制化应用，上线3天下载量破50万，推动AI应用开发门槛大幅降低，重塑C端AI产品生态。

华为Flex:ai(华为)[★★★]：华为开源的AI容器技术，核心为GPU与NPU资源动态切分聚合调度，算力利用率提升30%，适配多类算力设备，破解AI产业算力利用难题，助力算力普惠化。

腾讯混元HunyuanVideo1.5(腾讯)[★★]：腾讯开源的视频生成模型，核心为Diffusion Transformer架构，参数量8.3亿，可在消费级显卡运行，1080P画质生成成本降为行业三分之一，推动AI视频创作平民化。

小米MiMo-Embodied(小米)[★★]：小米推出的跨具身大模型，核心为多阶段训练策略的MiMo-VL架构，融合自动驾驶与具身智能，29项基准测试表现优异，开源后推动跨领域具身智能技术普及。

阿里千问APP(阿里巴巴)[★★★]：阿里巴巴推出的个人AI助手，核心为Qwen 3大模型，集成119种语言实时翻译，公测两天冲入App Store前三，深度联动阿里生态，角逐C端AI入口。

字节Depth Anything 3(字节跳动)[★★]：字节跳动推出的3D重建模型，核心为单一Transformer架构，姿态估计提升44%、几何估计提升25%，支持视频重建与空间感知，突破3D视觉过度设计困境。

通义AgentEvolver(阿里巴巴)[★★]：阿里通义实验室推出的自进化智能体系统，核心为自我提问与反馈机制，14B模型任务完成率从29.8%升至57.6%，减少55.6%训练步数，提升智能体自主演化能力。

OceanBase seekdb(蚂蚁集团)[★★]：蚂蚁开源的AI原生数据库，核心为多模数据混合检索架构，三行代码即可构建知识库，支持百亿级数据检索，兼容主流AI框架，降低AI应用开发门槛。

微博VibeThinker(微博)[★★]：微博发布的数学大模型，核心为轻量化训练架构，单次后训练成本仅7800美元，数学竞赛基准超越DeepSeek R1，推动小模型在垂直领域的效率革命。

快手VANS(快手)[★★]：快手与香港城市大学联合研发的视频问答模型，核心为“视频作为答案”范式，在程序性教学与未来预测测试中超越现有模型，强化视频细粒度语义理解能力。

灵宇宙小方机(灵宇宙)[★★]：灵宇宙推出的AI终端，核心为LingOS操作系统，双十一销售额同比增长230%，登顶京东AI玩具榜单，构建“硬件+系统”的人机交互生态。

北大AI-Newton(北京大学)[★★]：北京大学研发的物理定律发现系统，核心为符号回归方法，从实验数据中自主推导出牛顿定律等，识别50条物理定律，开辟AI自主科学发现新路径。

同济Med-Go32B(同济大学附属东方医院)[★★★]：同济大学附属东方医院开源的通用医学基座模型，核心为临床数据训练的专用架构，为专病模型研发提供基础支撑，降低医疗AI开发门槛。

解放军总医院SpineGPT(解放军总医院)[★★★]：解放军总医院研发的脊柱诊疗AI大模型，核心为SpineMed-450K数据集与SpineBench评测基准，超越通用模型，显著提升脊柱疾病诊断与治疗决策水平。

小米HAD增强版(小米汽车)[★★]：小米汽车推出的辅助驾驶系统，核心为强化学习与世界模型技术，新增紧急转向辅助功能，交通参与者行为预测准确率提升60%，优化复杂路况决策能力。

国外技术关键词

Gemini 3(谷歌)[★★★]：谷歌发布的多模态大模型，核心为100万token上下文窗口与Deep Think推理模式，LMArena排行榜以1501分登顶，多模态推理与编程能力领先，重塑大模型性能标杆。

GPT-5.1-Codex-Max(OpenAI)[★★★]：OpenAI推出的代码生成模型，核心为超长上下文持续工作架构，SWE-Bench Verified测试准确率达77.9%，相同推理水平下少用30%思考token，大幅提升软件工程效率。

SAM 3D(Meta)[★★★]：Meta发布的三维重建模型，核心为空间位置-语义联合编码架构，含SAM 3D Objects与SAM 3D Body，单张2D图像可生成精细3D模型，开放Segment Anything Playground供用户体验。

Grok 4.1(xAI)[★★]：xAI推出的大模型，核心为低幻觉优化与共情能力强化，幻觉率从12%降至4%，EQ-Bench3情商测试排名领先，击败谷歌Gemini 3模型，强化创意写作与情感交互能力。

WeatherNext 2(谷歌DeepMind)[★★]：谷歌DeepMind发布的天气预报模型，核心为函数生成网络架构，单TPU1分钟完成全球15天预测，速度提升8倍，集成至谷歌多款产品，优化极端天气预警能力。

Antigravity(谷歌)[★★]：谷歌推出的AI原生IDE平台，核心为多智能体协作与产物驱动工作流，集成代码编辑器、浏览器与AI代理，支持Gemini 3等多模型，重塑软件开发闭环。

Nemotron Parse v1.1(NVIDIA)[★★]：NVIDIA发布的文档解析模型，核心为ViT-H视觉编码器与mBart解码器，参数量不足1B，复杂表格提取准确率超传统模型，生成机器可读的Markdown和LaTeX格式。

Project Prometheus(贝佐斯初创公司)[★★★]：贝佐斯创立公司推出的物理AI系统，核心为从物理世界学习的模型架构，获62亿美元融资，聚焦机器人、药物设计等领域，开启物理AI竞争新赛道。

SAM 3(Meta)[★★]：Meta升级的分割模型，核心为可提示概念分割技术，支持文本与视觉多模态提示，覆盖27万独特概念，SA-CO基准测试达人类表现的75 - 80%，强化图像视频分割能力。

Claude系列(Anthropic)[★★★]：Anthropic推出的大模型，核心为安全对齐技术与长上下文处理，全面登陆Azure云平台，成为唯一覆盖三大主流云的前沿模型，获微软、英伟达150亿美元投资。

Nano Banana Pro(谷歌)[★★]：谷歌发布的图像生成模型，核心为Gemini 3 Pro多模态理解架构，支持14张图混合生成、4K原生输出，生成速度提升5倍，集成谷歌搜索验证功能，减少图像幻觉。

SIMA 2(谷歌DeepMind)[★★]：谷歌DeepMind推出的通用AI智能体，核心为Gemini模型集成架构，在虚拟3D世界自主游戏、推理并学习，具备深度规划与意图理解能力，迈向通用人工智能关键一步。

CraftStory Model 2.0(CraftStory)[★★]：CraftStory推出的视频生成系统，核心为并行扩散架构，突破时长限制生成5分钟高质量视频，采用专有数据集训练，适配企业培训、营销等商业场景。

Olmo 3(艾伦人工智能研究所)[★★]：艾伦人工智能研究所发布的开源大模型，核心为Dolci训练堆栈与Dolma 3语料库，含7B和32B两种变体，专注推理与工具使用，对标主流开源模型。

LabOS(英伟达与斯坦福大学)[★★]：英伟达展示的科研平台系统，核心为AI与XR技术融合架构，实现人机协同实验操作，提升科研效率与准确性，开启AI - XR科研新时代。

医疗垂直关键词

SpineGPT(解放军总医院)[★★★]：解放军总医院联合高校研发的脊柱诊疗大模型，核心为SpineMed - 450K椎体级别指令数据集与SpineBench基准，在脊柱疾病诊断与治疗决策任务中超越通用模型，显著提升诊疗精准度。

Med-Go32B(同济大学附属东方医院)[★★★]：同济大学附属东方医院开源的通用医学基座模型，核心为临床多模态数据训练架构，为专病模型和临床智能体研发提供基础支撑，降低医疗AI开发门槛。

小肺侠(武汉儿童医院)[★★]：武汉儿童医院联合研发的儿童喘息性疾病垂类大模型，核心为儿科临床病例训练的诊断算法，专注基层儿科诊疗规范化，辅助医生精准诊断儿童喘息性疾病。

Hulu-Med(浙江大学等)[★★]：浙江大学等联合发布的通用医学视觉语言大模型，核心为单一模型统一理解医学文本、2D/3D图像及视频，30项权威评测中27项超越现有开源模型，推动医学AI全能化。

MultiXpert医疗系统(中科院)[★★]：中科院研发的医疗AI系统，核心为零样本疾病识别算法，在胸片分析中精准识别未知疾病，无需大量标注数据，适配基层医疗资源短缺场景。

医学智能实验室项目(Function Health)[★★]：Function Health推进的医学智能项目，核心为AI驱动的实验室自动化架构，获2.98亿美元B轮融资，扩展医学智能实验应用，提升医疗研究效率。

脊柱诊疗评测基准SpineBench(解放军总医院)[★★]：解放军总医院设计的临床级评测基准，核心为脊柱疾病诊疗全流程评估指标，为脊柱AI模型提供标准化测试依据，保障医疗AI模型临床可靠性。

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

【网络编程与 Socket】Socket 是什么？网络编程的最小抽象单元

2048 AI社区

从字到运镜：商用AI海报软件哪家真的理解电商视觉？

2048 AI社区

2025零基础转行大模型：普通人亲测，3个月拿下40万年薪岗位！

2048 AI社区

所有评论(0)

查看更多评论

happyprince

@ld326

已为社区贡献35条内容