原文:towardsdatascience.com/ai-use-cases-are-fundamentally-different-3946f089c68e

AI 用例本质上是不同的

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/6b7b00284f99e434048636f11bb26906.png

by Author

**AI 成功整合的关键在于选择正确的 AI 用例。**这是在深入研究算法、数据和工程之前,面向产品的技术人员的观点。

AI 项目往往失败,因为它们实际上是无起点的项目,没有解决正确的人类问题或达到满足用户期望的最低性能标准。

AI 就像软件版的胶带,适用于许多事情但不是所有事情。同样,优秀的产品能帮助人们真正高效地完成特定任务。但 AI 可以做很多事情,而且做得相当不错。

这就是寻找 AI 机会的案例,这些机会可以通过 AI 独特地解决,即使性能中等,仍然具有价值

寻找 AI 表现特别出色的用例不起作用。它忽略了 AI 固有的概率特性。相反,寻找具有中等 AI 表现的用例,将带来即时的价值,风险更低。

之前的研究通过不起眼的计算和谷歌的醉酒岛屿隐喻来探讨这个主题。

**有效利用中等 AI 性能的用例有着重复成功的记录。**本文描述了最终用户如何体验 AI,包括 5 个类别中的产品示例:

  1. 传感器融合

  2. 生成式 AI

  3. 自然语言处理

  4. 计算机视觉

  5. 自主机器人


传感器融合

来自多个传感器的数据可以创建更准确和完整的表示。这种 AI 形式在硬件和软件产品中最为常见。

一个简单的例子是计步器。计步器广受欢迎,激励人们每天锻炼。但 AI 不需要表现得特别出色,只要合理即可发挥作用。

但 AI 不需要表现得特别出色,只要合理即可发挥作用。

对于消费者来说,90%准确率的计步器(每 10 步误计 1 步)通常足以监测日常健身。有意的设计也可以补充适度的 AI 性能。例如,确切的步数被设计为对用户来说不那么重要,只要他们达到 10,000 步或以上的基准目标,或者完成他们的环

对于企业来说,计步器可能需要 95-99%的高精度,例如专业的临床研究。

无论是哪种情况,AI 都具有独特的价值,因为即使它的存在也比替代品更好:(1)一个人自己数步,或者(2)什么都没有。类似情况下,适度的 AI 性能是有用的:面部识别用于标记照片,实时翻译购物推荐语音邮件转录电池寿命优化

所有这些都是窄 AI 的例子,通常不被注意,但在日常生活中却经常出现频繁出现。窄 AI 是为特定任务(计步)在定义的上下文(身体活动跟踪)中设计的。它们通常由大型公司部署,因为部署后的风险较低,因为 AI 能力的设计是为了使用而受到限制的护栏。


生成式 AI

生成式 AI 的本质是不会两次提供相同的结果。这在错误和某些不可预测性通常被接受的使用案例中效果很好:艺术、音乐、写作、电影与娱乐、游戏等。

像 Krea.ai这样的产品、Superside这样的产品,以及Microsoft cocreator都将 AI 定位为创意合作伙伴,将草图转化为专业作品。AI 只需要工作得足够好,并产生合理的视觉效果。

新手、爱好者、专业人士

生成式 AI 主要帮助新手,快速将他们的想法变为现实。新手用户也信任 AI 能做得相对不错。然而,专业人士却带着独特的视角,AI 将难以产生。而爱好者(艺术家、作家、音乐家等)在创作的情感高潮和低谷中经历愉快的意外,在这个过程中对 AI 的依赖挑战了这种人类经验的保存

多用途 AI 与伦理

生成式 AI 是多用途的。但与窄 AI 不同,当人们可以随意修改时,多用途 AI 很少能设计得既安全又不会伤害任何人。多用途 AI

AI 不是某种自然现象,它将自行出现并变得危险。我们设计和构建它,Yann Lecun

多用途 AI 在许多应用中都很有用,但也更容易出现意外后果。在各个行业的用例中存在担忧,许多例子表明模型重复内容,或通过混搭先前的例子创建新内容

但是,在适当的情况下应用,即使是表现中等的生成式 AI 也非常有用:(1) 当一些错误是可以接受的,****(2**) 随机性增强用户体验时,(3) 当你想要从 0 到 1 而不是从 1 到 10 时,(3) 当快速变化的前期工作比原创内容更有用时。


自然语言处理

这是今天最广泛使用的 AI 形式。在消费者和企业用例中,语言无处不在,文本数据最易于从数字交互中获取。

对于自然语言处理难以实现的用例通常需要领域专业知识和细微的语言理解:检测讽刺、理解复杂的叙事、适应需要从人类经验中做出专家决策的新情况。

对于自然语言处理更容易实现的用例可以从两个角度来观察:(1) 为实习生而不是领域专家的任务,(2) AI 可以首先进行尝试以减轻大部分工作,然后由人类完成剩余工作的情况

  1. 这些任务适合实习生,而不是领域专家。Notion 可以从你的整个工作空间中找到相关关键词,Otter.ai 可以将语音转换为文本转录,SummarizeBot 可以将文档压缩成摘要,Paperpile 帮助研究人员查找和引用论文,iOS 可以在应用程序中翻译文本转录语音消息。所有这些都是增强工作流程的任务,不需要领域专业知识。

  2. 人工智能可以先进行初步筛选,然后由人工验证。垃圾邮件过滤器是一个简单的二分类器,将电子邮件标记为垃圾邮件或非垃圾邮件。新闻文章也可以按类别进行标记:体育、科技、娱乐、政治、其他……这些任务对于人类来说既耗时又容易出错,但对于人工智能来说则相对快速且简单。

两个镜头都描述了人工智能可以有效地管理大量容易出错且重复性高的任务,从而让人们能够专注于专业且细致的工作。


计算机视觉

世界上大部分数据都是视觉和空间数据。尽管语言在当今最为常见,但表示或能够通过文本表示的数据非常少。

对世界进行建模极其困难。自动驾驶(一个愿望)不断被承诺,但难以实现(尚未商业化):

一个从未坐过驾驶座位的青少年可以在大约 20 小时内学会驾驶,而目前最好的自动驾驶系统需要数百万或数十亿条标记的训练数据和数百万次虚拟环境中的强化学习试验。即便如此,它们在可靠驾驶汽车的能力上仍不及人类。Yann Lecun (Meta Research)

与人工智能难以以高精度实现的应用场景,如自动驾驶、高风险决策或可能取代人类的 AI 代理相比,有许多简单的 AI 机会具有广泛的应用价值

许多复杂的 AI 用例都是从简单的检测开始的,这本身就可以非常广泛地发挥作用。

例如,自动驾驶停车技术难以构建,且仅服务于一小部分害怕在市区停车的驾驶员。但它的起点是一个任何驾驶员都可能觉得有用的简单预测:这个车位够大吗?

构建自动化的 AI 维护系统很困难。但一个有用的 AI 功能可以简单地监控设备使用情况并通过视觉检查跟踪故障。**用户可以从简单的反馈循环开始建立对 AI 的信任,**随着数据的允许逐渐向复杂性发展。

AI 新闻标题往往承诺令人向往的使用案例,导致历史上混合的结果最近。但增量 AI 解决方案仍然可以令人愉悦,是完整的产品。


自主机器人

人机合作在机器人学领域得到了广泛研究。其概念现在正逐渐渗透到数字产品体验中,被标记为共同飞行员、代理体验、AI 伙伴、AI 合作者。

自主级别

考虑机器人学中定义的6 个自主级别,从无自主性(级别 0,垃圾邮件过滤器)到完全自主性(级别 6,能够独立管理不同任务的个人助理)。

大多数今天的 AI 系统位于 1-5 级之间,是半自主的 AI 系统,需要人类反馈。这些系统设计起来很困难,因为它们涉及两个相互适应的代理,一个是 AI 系统,其准确性取决于使用条件,另一个是人类用户,他们拥有可变的任务专业知识和 AI心理模型

AI 系统性能与设计

对于非自主和完全自主的系统,用户的心理模型保持相对一致,期望 AI 能够合理地独立工作,或者完全不工作。完全自主的系统完全依赖于 AI 系统性能,仅在需要时通知用户。

然而,今天的大多数用例都涉及半自主 AI。这些系统主要依赖于设计来(1)根据系统性能调节用户期望,和(2)根据用户对系统的信任允许不同的工作流程。例如,用户可能信任 AI 独立工作而不受监督,或者希望了解 AI 系统以知道何时以及何时介入,或者决定完全不使用 AI 完成任务。

一个成功的例子是 Roomba,这款机器人吸尘器。人们可以让 Roomba 自由漫游(完全自主),当它陷入困境时介入(半自主),或者暂停 Roomba 的日程安排,转而手动清洁空间(无自主性)。

即使是中等 AI 性能,比如错过一些地方或陷入困境,Roomba 仍然提供了巨大的便利。这是一个独特的人机合作,机器人的意图很明显,因为它的动作是可见的。

随着系统性能的提升,以及人们越来越多地使用产品来体现其实用价值,用户对系统的信任也在增加。


人工智能用例本质上是不同的

人工智能的表现正在迅速提升。但与传统软件不同,人工智能的结果本质上是不确定的。

人工智能项目的挑战在于解决方案已经隐含其中。成功项目在有效销售问题之前会获得动力。但与从有价值的用户问题开始工作相比,从事人工智能项目暗示解决方案已经被预先确定为人工智能。

这表明了一种不同的寻找用例的方法,即匹配人类需求与概率系统

需要人工智能表现出色用例往往无法满足预期。它们设定了一个过高的标准,人工智能在每种场景下对每个用户来说都难以合理实现。

相反,寻找那些即使人工智能表现适中仍然有价值的用例,是从用户已经获得价值的基础开始的。

随着准确性的提高和幻觉的减少,用户体验自然会得到改善。


参见本文序言:

为什么人工智能项目会失败?


感谢阅读!我很乐意了解您的想法

Elaine 写关于设计、人工智能、新兴技术。关注获取更多信息,或在 LinkedIn 上联系她。

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐