AI真的能帮我们办事了?!

1 分钟内点 100 杯奶茶:

不需要手动刷、不需要反复确认,整个过程几乎就是一句话交代需求,然后放在后台自动执行。

AI 会自动拉取地址信息,如果没有指定甜度、冰量等细节,也会主动追问确认。

确认需求后在淘宝闪购中查询可选方案,给出多种组合建议。

图片

图片

选定后,直接在 APP 内完成下单和支付,全程无需跳转。

图片

图片

过去这一年大模型赛道可以说是卷疯了,智力已经拉到博士后水平,但多数模型会做的依旧停留在会聊天、会写东西、会给建议,离真正帮我们办事还差一大截。

即使是最前沿的模型又往往会因为安全、权限等导致 AI 应用生态被限制,无法真正落地,比如被主流 APP 屏蔽。

但这一次,在千问发布会上,我看到了模型不一样的可能性。

这次更新中,千问接入了淘宝、高德、支付宝、飞猪等阿里生态服务,并一次性上线了 400+ 新功能。

强大模型加上阿里全面生态的加持,目标非常简单:让 AI 能动手办事。

也就是说,用户不用自己操作软件,只需要会表达需求,最后自己控制支付。

并且也不用在多个 APP 之间来回跳转,提问、确认需求、支付等全部操作浓缩进一个对话框。

图片

一、AI时代下的超级入口

旅行计划

我相信用 AI 来做旅行攻略这样的 case 很多小伙伴已经看过不少了。

但我这次还是想用这个案例,是因为我发现千问能做出来的效果和我之前测的 AI 不太一样。

1月下旬想带父母去成都玩3天,请生成详细的计划。

先来看看 ChatGPT 的回答:

图片

图片

是不是完美符合文章开头的描述?会聊天会给建议,但能做的也就这么多,吃住行玩都还是得自己上各个平台去找。

我把同样的提示词丢给千问,它直接给我生成了一个网页:

可以说 ChatGPT 回答中的信息它都有,比如要考虑到老年人的旅游节奏。

但它的回答明显要比 ChatGPT 丰富很多。

比如成都三日游的路线它直接在高德地图上直观的显示了出来,这一点对我这样的路痴非常重要,让我能够快速知道景点的大致位置,避免找不着北。

每一天给出了详尽的游玩景点。

对于每一个景点,都生成了图文并茂的全面介绍,还能一键跳转高德导航、打车,一键跳转详情。

图片

还会贴心给出两个景点之间的距离。

对于门票和住宿,也都可以一键跳转飞猪进行预订。

图片

对比看下来,两个模型主要的差异还是在生态上。

模型越来越强大,但急需全面稳定的生态才施展得开拳脚。

千问在票务、娱乐方面有飞猪,地图导航、出行打车有高德,购物外卖有淘宝,政务办手续有支付宝,再加上它最新接入的“支付宝 AI 付”的原生支付功能……

图片

诸此种种,才是我认为它“不一样”的地方。毕竟这么全的生态支撑,放眼全球估计也就阿里和谷歌两家有。

图片

旅游这个案例只体现出了前两个功能,我们一起慢慢往下看~

千问+淘宝

外卖文章开头已经放上了效果,这里来测试一下用它买东西。

推荐一款高性价比的扫地机器人

图片

图片

千问可以借助淘宝海量的商品数据库以及用户评价给出购物建议,用户直接在 APP 就能查看到真实、详细的商品详情。

看中后一键跳转到淘宝下单,整个过程非常丝滑。

千问+支付宝

支付宝 AI 付功能让用户在点外卖等场景下可以直接在 APP 内完成支付的操作。

图片

开头的 case 有,这里就不重复展示了。

除此之外,千问 APP 还能调用支付宝的政务能力,像户口、社保、公积金、签证等 50+ 事务都支持一句话查询。

来看个例子。

公积金从北京迁到杭州

生成的网页全面覆盖了转移条件、所需材料、办理流程、线上线下渠道选择、办理时效以及常见问题解答等关键内容。

最重要的是它基于 2026 年最新政策,还贴心强调了“无需返回北京办理”和“推荐使用全国住房公积金小程序线上操作”等关键点,非常智能。

千问+办公

除了生态方面的全面支持,这次千问 APP 还新上线了“任务助理”。

图片

在对话框点亮即可使用。

这里我让它帮我写一份 AI 发展历程的长篇报告。

搜集AI出现至今的重要事件、人物,以及对社会带来的影响,以及未来发展等信息,写一个长篇报告,用pdf交付

生成了一份 36 页,共 26548 字的报告。

图片

图片

内容详尽,结构也很清晰。

报告系统梳理了 AI 发展的完整历史,介绍了图灵、麦卡锡、辛顿等关键人物,然后分析了 AI 在经济、就业、伦理和日常生活等领域的意义和影响,最后对 AI 未来发展进行了展望。

一起来看一段。

图片

报告生成的过程中可以新开对话,任务会在后台进行,并在完成后发来通知,无需人工盯梢。

二、背后的意义

要评价一个工具,最重要的指标只有一个:用户体验。

这些实测 case 看下来,最明显的变化,是用户需要手动的操作被不断压缩。

之前通常是我们从 AI 那得到建议,然后去各个 APP 或者平台上手动输入、搜索、点击。

这也是 AI 老给人一种“空架子”感觉的原因之一,因为实际上需要人工的工作量一项没少。

而在上面这些实测 case 中,模型在强大生态和工具的加持下,能力边界大大提升,从“代点”进化到“代办”,能真正办事。

即使是需要跳转到其他 APP 的情况,也无需手动输入、搜索,而是一键跳转。

这样的体验仅仅是 AI 办事时代的开始。

图片

模型执行任务的过程中产生的高质量行为数据,可以继而优化模型性能,更精准实现用户需求,用户更爱用,也就有更多的优质数据。

这样也就在生态中形成了正向的数据闭环,让模型能力持续提升。

三、最后

聪明只是 AI 作为一项工具的基础,AI 办事才是能力的关键体现。

这次千问背靠阿里生态,上线 400+ 新功能,是 AI 从“言”到“行”,对未来人工智能的一次有效探索。

这也让我想起 07 年第一代 iPhone 发布的时候,虽然当时 iPhone 的性能极其不稳定,甚至不能随便点,必须严格按固定的演示路径操作,但这并不影响它改写历史。

因为苹果做的,不是改良或者追赶,是直接重新定义了手机。

这次千问的发布,也给我同样的感觉。模型智能不断升级换代,但如果不落到能干活上,再强大的性能也只是空中楼阁。

让模型的手真正伸进用户的生活中,不仅能思考,还能执行,真正替用户办事。

我想这正是千问这次更新的核心,也是未来 AI 在产品竞争上的主战场。

感兴趣的朋友可以亲自上手体验一下~

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐