AI潮汐日报0807期:Genie 3一句话生成交互宇宙、OpenAI 首开源、AI象棋争霸冷门迭爆
AI 潮汐日报,旨在提供最新潮、最核心、最有意思的AI速递。四大专栏:今日热点、应用速递、研究进展、思维碰撞。
AI 潮汐日报,旨在提供最新潮、最核心、最有意思的AI速递。四大专栏:今日热点、应用速递、研究进展、思维碰撞。
今日热点
重新定义“生成式AI”,谷歌DeepMind推出世界模型Genie 3
谷歌DeepMind Genie 3凭720p/24fps实时世界模型,一句Prompt即可生成可探索、可编辑、物理一致且连续数分钟的3D场景,已用于训练SIMA智能体,游戏/影视/教育降本80%。
开源核弹!OpenAI深夜放出gpt-oss 120B/20B,性能追平o4-mini
凌晨一点,OpenAI把“封闭”标签撕了——gpt-oss 120B与20B同步上架GitHub和Hugging Face。120B在Codeforces、AIME、HealthBench全面硬刚o4-mini,20B塞进RTX 4090就能跑。七年之后,OpenAI终于把“Open”还给了AI。
应用速递
Grok 4“神之一手”横扫棋坛:首届AI象棋争霸赛冷门迭爆
谷歌Kaggle首届全球AI象棋赛,闭源Grok 4、Gemini 2.5 Pro等4-0血洗开源DeepSeek R1、Kimi K2;Kimi连走非法子8回合出局,DeepSeek中盘自爆,Grok 4获马斯克“随手转发”认证。
研究进展
ICML 2025|SatImp:用“饱和度×重要性”重写LLM反学习
港浸大联合团队提出SatImp加权框架,首次把“关键词重要性”引入LLM反学习;在TOFU基准上,SatImp优于梯度上升、NPO等主流方法,显著减少过度遗忘,实现精准擦除敏感知识。
磐石KRCL规划器:像运动员一样“自我纠错”,性能碾压o1
中科院磐石团队发布“神经-符号”融合规划器KRCL,借人类运动闭环反馈机制,只在“需要时”启动符号校正,IPC竞赛8项任务覆盖率、PlanBench效率均显著超越OpenAI o1,已集成至磐石科学大模型。
思维碰撞
微软 GitHub CEO 警告:软件工程师要么拥抱 AI,要么转行
写代码的时代正在倒计时。GitHub CEO 敲桌直言:Copilot 已经把怀疑者变信徒,未来 90% 字符将由 AI 代笔,人类只剩“设计+审核”两件事。不会用 AI?请把工位留给愿意当“代码创意总监”的人。
更多推荐
所有评论(0)