摘要

AI领域大模型竞争白热化,谷歌、OpenAI等推新模型,国内蚂蚁、华为等发力产品落地;具身智能、多模态成突破点,医疗AI加速落地,同时面临算力、伦理等挑战,资本聚焦算力与场景应用。

国内技术关键词

蚂蚁灵光(蚂蚁集团)[★★★]:蚂蚁集团推出的全模态通用AI助手,核心为“闪应用”快速生成架构,30秒可生成定制化应用,上线3天下载量破50万,推动AI应用开发门槛大幅降低,重塑C端AI产品生态。

华为Flex:ai(华为)[★★★]:华为开源的AI容器技术,核心为GPU与NPU资源动态切分聚合调度,算力利用率提升30%,适配多类算力设备,破解AI产业算力利用难题,助力算力普惠化。

腾讯混元HunyuanVideo1.5(腾讯)[★★]:腾讯开源的视频生成模型,核心为Diffusion Transformer架构,参数量8.3亿,可在消费级显卡运行,1080P画质生成成本降为行业三分之一,推动AI视频创作平民化。

小米MiMo-Embodied(小米)[★★]:小米推出的跨具身大模型,核心为多阶段训练策略的MiMo-VL架构,融合自动驾驶与具身智能,29项基准测试表现优异,开源后推动跨领域具身智能技术普及。

阿里千问APP(阿里巴巴)[★★★]:阿里巴巴推出的个人AI助手,核心为Qwen 3大模型,集成119种语言实时翻译,公测两天冲入App Store前三,深度联动阿里生态,角逐C端AI入口。

字节Depth Anything 3(字节跳动)[★★]:字节跳动推出的3D重建模型,核心为单一Transformer架构,姿态估计提升44%、几何估计提升25%,支持视频重建与空间感知,突破3D视觉过度设计困境。

通义AgentEvolver(阿里巴巴)[★★]:阿里通义实验室推出的自进化智能体系统,核心为自我提问与反馈机制,14B模型任务完成率从29.8%升至57.6%,减少55.6%训练步数,提升智能体自主演化能力。

OceanBase seekdb(蚂蚁集团)[★★]:蚂蚁开源的AI原生数据库,核心为多模数据混合检索架构,三行代码即可构建知识库,支持百亿级数据检索,兼容主流AI框架,降低AI应用开发门槛。

微博VibeThinker(微博)[★★]:微博发布的数学大模型,核心为轻量化训练架构,单次后训练成本仅7800美元,数学竞赛基准超越DeepSeek R1,推动小模型在垂直领域的效率革命。

快手VANS(快手)[★★]:快手与香港城市大学联合研发的视频问答模型,核心为“视频作为答案”范式,在程序性教学与未来预测测试中超越现有模型,强化视频细粒度语义理解能力。

灵宇宙小方机(灵宇宙)[★★]:灵宇宙推出的AI终端,核心为LingOS操作系统,双十一销售额同比增长230%,登顶京东AI玩具榜单,构建“硬件+系统”的人机交互生态。

北大AI-Newton(北京大学)[★★]:北京大学研发的物理定律发现系统,核心为符号回归方法,从实验数据中自主推导出牛顿定律等,识别50条物理定律,开辟AI自主科学发现新路径。

同济Med-Go32B(同济大学附属东方医院)[★★★]:同济大学附属东方医院开源的通用医学基座模型,核心为临床数据训练的专用架构,为专病模型研发提供基础支撑,降低医疗AI开发门槛。

解放军总医院SpineGPT(解放军总医院)[★★★]:解放军总医院研发的脊柱诊疗AI大模型,核心为SpineMed-450K数据集与SpineBench评测基准,超越通用模型,显著提升脊柱疾病诊断与治疗决策水平。

小米HAD增强版(小米汽车)[★★]:小米汽车推出的辅助驾驶系统,核心为强化学习与世界模型技术,新增紧急转向辅助功能,交通参与者行为预测准确率提升60%,优化复杂路况决策能力。

国外技术关键词

Gemini 3(谷歌)[★★★]:谷歌发布的多模态大模型,核心为100万token上下文窗口与Deep Think推理模式,LMArena排行榜以1501分登顶,多模态推理与编程能力领先,重塑大模型性能标杆。

GPT-5.1-Codex-Max(OpenAI)[★★★]:OpenAI推出的代码生成模型,核心为超长上下文持续工作架构,SWE-Bench Verified测试准确率达77.9%,相同推理水平下少用30%思考token,大幅提升软件工程效率。

SAM 3D(Meta)[★★★]:Meta发布的三维重建模型,核心为空间位置-语义联合编码架构,含SAM 3D Objects与SAM 3D Body,单张2D图像可生成精细3D模型,开放Segment Anything Playground供用户体验。

Grok 4.1(xAI)[★★]:xAI推出的大模型,核心为低幻觉优化与共情能力强化,幻觉率从12%降至4%,EQ-Bench3情商测试排名领先,击败谷歌Gemini 3模型,强化创意写作与情感交互能力。

WeatherNext 2(谷歌DeepMind)[★★]:谷歌DeepMind发布的天气预报模型,核心为函数生成网络架构,单TPU1分钟完成全球15天预测,速度提升8倍,集成至谷歌多款产品,优化极端天气预警能力。

Antigravity(谷歌)[★★]:谷歌推出的AI原生IDE平台,核心为多智能体协作与产物驱动工作流,集成代码编辑器、浏览器与AI代理,支持Gemini 3等多模型,重塑软件开发闭环。

Nemotron Parse v1.1(NVIDIA)[★★]:NVIDIA发布的文档解析模型,核心为ViT-H视觉编码器与mBart解码器,参数量不足1B,复杂表格提取准确率超传统模型,生成机器可读的Markdown和LaTeX格式。

Project Prometheus(贝佐斯初创公司)[★★★]:贝佐斯创立公司推出的物理AI系统,核心为从物理世界学习的模型架构,获62亿美元融资,聚焦机器人、药物设计等领域,开启物理AI竞争新赛道。

SAM 3(Meta)[★★]:Meta升级的分割模型,核心为可提示概念分割技术,支持文本与视觉多模态提示,覆盖27万独特概念,SA-CO基准测试达人类表现的75 - 80%,强化图像视频分割能力。

Claude系列(Anthropic)[★★★]:Anthropic推出的大模型,核心为安全对齐技术与长上下文处理,全面登陆Azure云平台,成为唯一覆盖三大主流云的前沿模型,获微软、英伟达150亿美元投资。

Nano Banana Pro(谷歌)[★★]:谷歌发布的图像生成模型,核心为Gemini 3 Pro多模态理解架构,支持14张图混合生成、4K原生输出,生成速度提升5倍,集成谷歌搜索验证功能,减少图像幻觉。

SIMA 2(谷歌DeepMind)[★★]:谷歌DeepMind推出的通用AI智能体,核心为Gemini模型集成架构,在虚拟3D世界自主游戏、推理并学习,具备深度规划与意图理解能力,迈向通用人工智能关键一步。

CraftStory Model 2.0(CraftStory)[★★]:CraftStory推出的视频生成系统,核心为并行扩散架构,突破时长限制生成5分钟高质量视频,采用专有数据集训练,适配企业培训、营销等商业场景。

Olmo 3(艾伦人工智能研究所)[★★]:艾伦人工智能研究所发布的开源大模型,核心为Dolci训练堆栈与Dolma 3语料库,含7B和32B两种变体,专注推理与工具使用,对标主流开源模型。

LabOS(英伟达与斯坦福大学)[★★]:英伟达展示的科研平台系统,核心为AI与XR技术融合架构,实现人机协同实验操作,提升科研效率与准确性,开启AI - XR科研新时代。

医疗垂直关键词

SpineGPT(解放军总医院)[★★★]:解放军总医院联合高校研发的脊柱诊疗大模型,核心为SpineMed - 450K椎体级别指令数据集与SpineBench基准,在脊柱疾病诊断与治疗决策任务中超越通用模型,显著提升诊疗精准度。

Med-Go32B(同济大学附属东方医院)[★★★]:同济大学附属东方医院开源的通用医学基座模型,核心为临床多模态数据训练架构,为专病模型和临床智能体研发提供基础支撑,降低医疗AI开发门槛。

小肺侠(武汉儿童医院)[★★]:武汉儿童医院联合研发的儿童喘息性疾病垂类大模型,核心为儿科临床病例训练的诊断算法,专注基层儿科诊疗规范化,辅助医生精准诊断儿童喘息性疾病。

Hulu-Med(浙江大学等)[★★]:浙江大学等联合发布的通用医学视觉语言大模型,核心为单一模型统一理解医学文本、2D/3D图像及视频,30项权威评测中27项超越现有开源模型,推动医学AI全能化。

MultiXpert医疗系统(中科院)[★★]:中科院研发的医疗AI系统,核心为零样本疾病识别算法,在胸片分析中精准识别未知疾病,无需大量标注数据,适配基层医疗资源短缺场景。

医学智能实验室项目(Function Health)[★★]:Function Health推进的医学智能项目,核心为AI驱动的实验室自动化架构,获2.98亿美元B轮融资,扩展医学智能实验应用,提升医疗研究效率。

脊柱诊疗评测基准SpineBench(解放军总医院)[★★]:解放军总医院设计的临床级评测基准,核心为脊柱疾病诊疗全流程评估指标,为脊柱AI模型提供标准化测试依据,保障医疗AI模型临床可靠性。

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐