将您的内容转化为人工智能的强大燃料
以前用户是直接阅读内容,以后人通过AI获取内容。所以,创作AI友好的内容极其关键。
作者 | Walden & Olivier
结构良好的内容使人工智能工具能够向内容创作者和内容消费者提供更准确和相关的结果。但是你的内容结构良好吗?AI真的在访问它吗?为什么不问AI?

近两年来,我们看到公司寻求使用生成人工智能(GenAI)作为引擎来改变我们创建、管理和优化技术内容的方式,包括产品和操作指南、在线帮助系统以及用于劳动力培训和发展的课件,仅举几例。
然而,将生成式人工智能应用于内容的结果受到了损害,结果从不完整的信息到彻底的幻觉。问题不在于人工智能技术本身。相反,它在于一个更基本的领域:支撑这些系统运行的内容质量和组织结构。
将内容视为人工智能的燃料会有所帮助。分散的内容基础设施和糟糕的内容质量就像受污染的燃料一样,严重限制了任何人工智能投资的潜力。换句话说,如果没有强大的内容基础,即使是最先进的人工智能实现也很难实现其承诺的价值。
在本文中,我们将研究组织应该实施的技术和业务最佳实践,以实施人工智能,并将技术内容转化为最大化性能的优质燃料。
AI在技术内容上的价值
在深入探讨如何为AI优化内容之前,让我们先来看看AI可以帮助技术内容团队提高效率和效果的三种方式。
-
内容协助的重点是使用生成式人工智能工具来帮助内容创作,例如,创建符合公司风格指南的初稿。
-
内容访问有两个方面:一方面,它关注生成式人工智能如何帮助员工、客户和其他利益相关者更快地找到他们需要的信息,例如,使用人工智能驱动的聊天机器人或语义搜索。另一方面,它是关于如何访问专有内容来为人工智能模型提供信息。
-
内容智能是使用人工智能来分析内容并解决以下问题的实践:我的内容差距在哪里?我的内容有重复吗?我的内容有多有价值?它真的符合我的观众的可读性标准吗?
人工智能的这三种应用的共同点是,在大多数情况下,人工智能工具需要针对组织的专有内容和数据运行,才能实现其全部承诺价值。这对人工智能应该如何在企业内实施以及如何组织内容以支持任何人工智能驱动的帮助都有影响。
将人工智能引入内部
成功的人工智能实施的核心是一个称为“接地”的过程,即将人工智能模型与组织自己当前、准确和相关的信息联系起来。一些较大的公司从头开始构建定制的人工智能模型。然而,大多数企业采取两种方法之一:他们要么用公司特定的信息调整现有的人工智能模型或工具,要么,他们使用检索增强生成(RAG)技术将内部数据库连接到现有的人工智能工具,然后提示工具提供上下文响应。
商用AI工具的普及程度不容小觑。例如,根据OpenAI的数据,80%的财富500强公司都有员工使用ChatGPT工作。问题是:这个统计数据来自与公司电子邮件域相关联的注册ChatGPT消费者账户。换句话说,对这些用户没有明确的公司控制和内容治理。
因此,组织应考虑采用企业版本的生成式AI工具,使公司能够在具有高级安全和隐私保护的环境中处理自己的数据和内容源。其中一些企业级工具包括OpenAI的ChatGPT企业版、Microsoft 365 Copilot企业版和适用于Google Workspace的Gemini。除了支持安全性和隐私,它们还支持高度的定制。
并不总是需要为人工智能工具签署多年合同,并且有一些经济高效的方法可以入门。选择人工智能工具时,重要的是阅读供应商关于数据保留、人工智能模型训练等的政策。一个典型的例子是:OpenAI和Microsoft Azure都提供无服务器版本的ChatGPT。但Microsoft Azure有一个无服务器、非持久版本的ChatGPT,它不会根据用户提示进行训练;使用之间没有数据持久性;一旦会话结束,您的会话数据将被正确销毁,您只需为每次使用付费。微软的隐私和数据保留政策非常明确。
什么是检索增强生成?
检索增强生成(RAG)是优化大型语言模型输出的过程,因此它在生成响应之前会引用其训练数据源之外的权威知识库。大型语言模型(大语言模型)根据大量数据进行训练,并使用数十亿个参数来生成原始输出,用于回答问题、翻译语言和完成句子等任务。RAG将大语言模型已经强大的功能扩展到特定领域或组织的内部知识库,所有这些都不需要重新训练模型。这是一种提高大语言模型产出的具有成本效益的方法,因此它在各种情况下都保持相关性、准确性和有用性。
资料来源:aws.amazon.com
RAG的作用
当今的生成式人工智能工具通常基于大型语言模型(大语言模型)技术。为了有效地利用具有内部内容存储库的人工智能工具并提供重要的护栏,许多公司会发现RAG系统是目前最容易访问和维护的解决方案。RAG系统可以将用户的提示带到组织的内容存储库,在那里它将找到最相关的内容。然后,它使用这些内容来增强用户的提示,然后以补充文档文本甚至附加说明的形式将其传递给具有高度具体上下文的大语言模型,以改善大语言模型的响应。例如:“用这些附加信息回答这个用户的提示,不要创建任何超出该上下文的答案。不要回答具体内容中没有回答的问题。”
使用RAG解决方案以这种方式提供上下文感知可以通过向大语言模型提供有针对性的事实上下文以及可能帮助其收紧答案范围的附加指令来减少幻觉。这在劳动力环境中极其重要。您不希望大语言模型在创建安全合规员工培训文档时开始编造内容。
一些企业内容管理系统现在嵌入了RAG技术。然而,员工也可以使用现成的工具创建自己的RAG系统。其中最受欢迎的是LangChain,这是一个用于开发由大语言模型驱动的应用程序的开源框架。使用这些工具之一创建RAG不需要专门的数据科学家。然而,它确实需要能够理解和编写一些Python代码的人,并且能够访问存储内容的系统和大语言模型本身。事实上,在一家公司,我们看到一个有一些Python编程经验的项目负责人自己创建了RAG系统。
为RAG访问优化内容
RAG系统在企业内容和人工智能工具的大语言模型之间提供了关键的联系,但内容的结构将最终决定人工智能驱动流程的性能。内容应该被分解成可重用的主题或组件,然后被标记,这样信息就可以很容易地被聚合和搜索。如果内容没有以这种方式构建,技术作者应该在超越人工智能实现的试点阶段之前开始分阶段进行这些更新。
RAG解决方案可以通过应用程序编程接口(API)连接到多个内容源。例如,这些可能包括用于产品文档和在线帮助的内容管理系统(CMS)、用于在线和面对面课程的学习管理系统(LMS)以及用于支持团队的具有集成知识库的客户关系管理(CRM)系统。
更有效的方法是通过API将RAG系统连接到内容联合平台,该平台可以聚合来自不同系统的现有内容,以及推出内容。这种方法有助于RAG解决方案的上下文搜索,同时确保内容的一致性和准确性。
API为AI工具提供了对内容本身的访问,但企业需要考虑另一个重要的访问点:语义数据层。
投资语义层访问
语义层是一种搜索索引,其中对组织的内容存储库进行语义分析。它通过允许人工智能工具执行高级功能来支持内容智能,例如重复分析和内容库存映射。
重复分析提供了以下问题的答案:“这两个内容有多相似?我可以让其中一个退休吗?”不仅仅是看文本是否相同,还要看它是否以相同的方式涵盖了相同的主题。所以,这是一个重要的功能。
内容清单映射基于语义分析映射出组织的内容,并使特定的技术内容能够与基于一组分类或标签的特定分类法进行比较。它可以帮助回答这样的问题:“这个产品和那个产品有多少页的内容?没有特定产品的页面吗?是否存在多余的内容,或者是否存在需要退役的旧内容?”类似地,对于学习和发展内容,特定的分类法可能包括技能作为参数,有助于回答诸如:“我们的内容有效地强化了哪些技能?”以及“我们在哪里错过了劳动力培训机会?”
一些企业内容管理解决方案提供语义分析。然而,与RAG解决方案一样,有现成的工具可以让任何具有中等技术水平的人构建自己的工具。一个受欢迎的选择是Algolia,这是一个现成的搜索提供商,包括开箱即用的语义分析。或者,想要完全控制的用户可以利用诸如Hugging Face之类的资源,这是一个广泛认可的开源社区,提供对大量神经模型的访问,其中许多模型旨在提供语义内容分析。
解决治理工作流
除了这些技术考虑之外,重要的是评估组织的内容开发和治理工作流程,以确定可以利用人工智能的领域以及需要人工审查的领域。例如,可以将AI模型直接构建到工作流中,以便当技术作者完成产品指南的起草工作时,它将经历AI驱动的审查过程,其中AI模型表示:“似乎此内容与您的内容存储库中的其他信息相矛盾。你想回顾一下矛盾的内容吗?”
这种方法可以提高内容质量和效率,因为生成式人工智能工具与人类内容作者结合使用。AI有效地充当写作伙伴,为内容作者提供需要人工确认动作的实时反馈和质量控制。通过这种方式,人类内容作者和AI助手相互合作,提供了一系列的制衡。
治理策略应包括基于角色的访问控制、人类或人工智能对内容修改的可跟踪性,以及为下游人工智能检索而对内容进行适当的结构化和标记。拥有既定设计和语音指南的公司将具有优势,因为这些指南可用于指导AI工具。
企业还需要考虑制定和执行如何以及何时使用生成式人工智能功能的公司政策。这将是一项跨职能的工作,除了培训、学习和发展以及技术沟通团队的领导之外,还将汇集法律、人力资源、信息技术和合规团队的成员。
组建项目团队
一些公司拥有庞大的数据科学家和工程师团队来实施他们的人工智能内容优化项目。然而,如前所述,职能可以由一个具有中等技术专长的项目负责人很好地处理。对于许多组织来说,解决方案将采取中间道路:项目经理和具有机器学习专业知识的工程师。
重要的是,组织必须将人工智能针对内容的任何应用视为产品,项目经理需要充当传统的产品所有者。此人将作为业务和实际实施之间的联络人,通知利益相关者并确保项目中的工程师能够回答他们的问题。
结论
我们在本文开始时将内容视为人工智能的燃料。当通过正确的技术、内容结构、治理、政策和团队结构正确实施时,可以形成共生关系:组织良好且易于搜索的内容使人工智能工具能够为员工、客户、合作伙伴和其他利益相关者提供更准确和相关的帮助。与此同时,针对组织的内容清单应用的人工智能驱动分析为技术写作团队提供了新的见解,以不断增强这些用户体验。
更多推荐



所有评论(0)