围绕 AI 的下一轮竞争,海外科技媒体正在形成一个越来越清晰的判断:真正的突破点,可能不在模型参数,而在交互方式与硬件形态

近日,The Information 披露,OpenAI 正在为 2026 年初推出的新一代音频模型做系统级准备。过去两个月内,公司已整合多个工程、产品和研究团队,对音频模型进行全面重构,为未来的 audio-first personal device 提前铺路。

图片

在 The Information 看来,这并不是一次常规能力升级,而是一次明确的战略押注——

“OpenAI is all in on audio.”

从 OpenAI 看硅谷整体方向

海外媒体普遍认为,OpenAI 的选择并非个案,而是硅谷集体转向的一个缩影。
 

The Verge 在相关报道中直接点明:

“Silicon Valley is declaring war on screens.”

这一判断正在被越来越多的产品动作所印证。

在家庭场景中,语音助手已成为基础设施;在可穿戴领域,Meta 为 Ray-Ban 智能眼镜引入 five-microphone array,试图强化嘈杂环境下的“听觉增强”;谷歌开始测试 “Audio Overviews”,将搜索结果转化为对话式语音摘要;特斯拉则将 xAI 的 Grok 引入车载系统,通过自然对话完成导航、空调等核心功能。

在海外媒体看来,这些动作共同指向一个趋势:音频正在从“辅助能力”升级为“主交互入口”

无屏硬件:实验、失败与再次下注

围绕“去屏幕化”的硬件探索,海外媒体的态度也趋于理性。

Humane AI Pin 被普遍视为一次昂贵但必要的实验;Friend AI 项链因 “record your life and offer companionship” 的产品设想,引发隐私与伦理层面的持续争议。但与此同时,市场并未因此退却。

The Information 提到,至少已有两家公司正在研发 AI rings,预计于 2026 年发布,其中一家由 Pebble 创始人 Eric Migicovsky 领衔。这类产品被形容为让用户真正可以

“talk to the hand.”

在多家媒体看来,形态是否成功仍有不确定性,但底层判断高度一致:

“audio is the interface of the future.”

OpenAI 新一代音频模型的关键变化

从海外媒体披露的信息看,OpenAI 计划在 2026 年初推出的音频模型,将显著改变“人与 AI 对话”的体验方式。

The Information 指出,新模型将:

  • 具备更自然的语音表达

  • 能像真实对话者一样处理中断

  • 甚至可以在用户说话时进行实时回应

这些能力被认为是迈向“陪伴型 AI 设备”的关键一步。

Jony Ive 的加入,释放了什么信号?

海外媒体特别关注到一个关键人物:前 Apple 首席设计官 Jony Ive。在其公司 io 以 $6.5 billion 被 OpenAI 收购后,Ive 加入了 OpenAI 的硬件探索。

The Information 援引其理念指出,Ive 将 audio-first 设计视为一次机会,去

“right the wrongs of past consumer gadgets.”

在海外媒体看来,这一表态释放出明确信号:OpenAI 并不打算复制一块“新的屏幕”,而是试图重新定义人与设备的关系。

未来洞见

综合多家海外媒体的判断,OpenAI 押注音频,本质上是在参与一场更大的竞争:当大模型能力逐渐趋同,真正的分水岭将来自交互方式、设备形态与使用场景。

2026 年,是否会成为“智能硬件元年”仍有争议,但可以确定的是,AI 正在从屏幕里走出来

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐