文章对比语义层、本体论和上下文图三大技术,指出2026年AI核心需求是知识表示、推理能力和丰富上下文,而非单纯指标。语义层解决计算一致性问题,本体论支持逻辑推理,上下文图捕捉决策上下文。知识架构将成为AI时代核心竞争力,组织需平衡两种技术投资,培养知识工程技能,构建支持AI推理的数据架构。


编者摘要:文档围绕语义层、本体论和上下文图三大语义表示技术展开,对比了它们的核心目标与应用场景*——语义层聚焦指标标准化与一致性,解决数据计算统一问题;本体论通过正式知识表示建模意义,支持逻辑推理;上下文图捕捉决策推理与操作上下文,记录为什么的关键信息,指出2026AI的核心需求并非单纯指标,而是知识表示、推理能力和丰富上下文**,同时探讨了现有架构的局限、行业实践案例(如医疗保健、生命科学、Palantir)及组织构建AI原生数据架构的挑战与方向,强调知识架构将成为关键竞争力。*

一、背景与主要矛盾
  1. 数据危机催生语义层

    2000 年代末,多数据库组织面临指标计算不一致(如 “收入” 定义差异)、分析师 80% 时间用于数据清理、管理层不信任仪表板数据的问题,语义层应运而生。

  2. 语义层的成效与局限

    成效:实现指标一致性、标准化数据团队工作,兑现 “一次定义指标、非技术用户自助服务” 的承诺(代表工具:Looker 的 LookML)。

  • 局限:仅解决 “计算” 问题,无法传递 “意义”,无法解释指标背后的原因、风险及应对方案,未能建模组织现实。
  1. 主要矛盾

    行业曾误以为 “标准化计算 = 获得意义”,但实际上意义≠测量,AI 的崛起迫使行业重新审视数据架构的核心目标。

二、三大关键语义技术解析
技术类型 核心定义 关键特征 / 标准 核心价值 典型案例
语义层 原始数据库上的语义抽象层,通过标准化指标计算提供数据访问 YAML 配置、SQL 抽象、维度模型 指标一致性、跨工具统一、非技术用户自助分析 LookML、dbt MetricFlow
本体论 形式化、明确的共享概念规范,结构化表示领域知识 OWL、SKOS、RDF 标准,含类、属性、关系定义 知识表示、逻辑推理、消除数据歧义 基因本体论(生物信息学)、SNOMED CT(医疗,35 万 + 概念)
上下文图 记录决策推理与操作上下文的知识图谱,聚焦 “为什么” 基于程序知识本体(PKO),涵盖程序规范、执行历史等 6 大领域 捕捉隐性知识、提供决策轨迹、支持异常排查 Palantir Foundry、西门子微电网操作建模
三、语义层与本体论的差异与场景
对比维度 语义层 本体论
核心目标 优化测量(指标计算与一致性) 优化意义(知识表示与推理)
面向对象 人类(通过 BI 工具消费数据) 系统 / AI(支持推理与决策)
关键能力 指标定义、SQL 生成、数据访问 逻辑推理、关系推断、歧义消除
技术基础 YAML 配置、数据库实体 形式逻辑、标准语义格式
知识理论 数学计算路径(原始数据→业务理解) 知识组织理论(概念→关系→意义)

场景边界总结

场景特征 适合用语义层 适合用本体论
需求核心 指标查询、数据统计、报表生成 知识理解、逻辑推理、决策支持
用户类型 业务用户、分析师、管理层 专业研究者、AI 系统、决策人员
数据 / 知识复杂度 结构化数据、简单指标关系 异构数据、复杂概念关联
是否需要推理 不需要(仅计算与展示) 需要(显式关系→隐性知识)
典型行业 / 领域 零售、互联网、传统企业运营 医疗、生命科学、金融风控、情报、工业制造

简单来说:语义层解决 “让普通人快速拿到靠谱的指标数据”,本体论解决 “让系统 / AI 看懂复杂的领域知识并帮人做决策”。两者并非互斥,但应用场景的核心需求和价值输出完全不同 ——2026 年 AI 时代,语义层仍适用于日常数据分析,而本体论将成为复杂场景 AI 推理的核心支撑。

四、AI 对数据架构的变革性影响
  1. AI 的核心需求

    上下文、意义、推理能力,而非单纯指标或仪表盘,需通过本体论和知识图谱获取概念、关系、约束等结构化领域知识。

  2. 行业动向

    2025 年 10 月,dbt Labs 开源 MetricFlow(Apache 2.0 许可证),将语义层定位为 “AI 与结构化数据的桥梁”。

  • 医疗保健、生命科学领域早已依赖临床本体 / 生物医学知识图,成为 AI 推理的成功范例。
  • Anthropic、LangChain 等强调 “上下文工程”,即向 LLM 提供完成任务所需的完整语义环境。
  1. 范式转变

    从 “指标优先” 转向 “知识架构优先”,AI 不需要图表化指标,而需要支持推理的概念与关系。

五、2026 年的难题与实践建议
  1. 核心难题

    语义层与本体论的融合可行性:两者基于不同理论、操作要求,弥合差距需根本性架构调整。

  • 技能缺口:本体构建需知识工程、形式逻辑等稀有技能,多数数据团队不具备。
  • 组织承诺:本体建设需多年投入,需将知识表示视为核心能力而非项目。
  1. 实践建议

    明确用途:为人类消费选语义层,为 AI 推理选本体 / 知识图谱,多数组织需两者并行。

  • 投入知识架构:培养图书馆学、分类学、知识工程相关技能,系统提取隐性知识。
  • 提前布局:避免竞争对手在知识表示领域领先,参考医疗、生命科学(20 年前布局)、Palantir(2012 年布局)的经验。
六、未来方向
  • 术语演进:“语义层”“本体论” 可能不足以描述 AI 原生数据架构,“上下文工程”“ContextOS” 等概念兴起。
  • 核心结论:竞争优势属于能支持 AI 进行概念、关系、领域知识推理的组织,统一指标是基础,知识架构是关键。
  • 七、关键问题Q&A
问题 1:语义层与本体论的核心差异体现在哪些方面,导致它们对 AI 的支持能力不同?

:核心差异集中在目标、能力与技术基础三大维度。目标上,语义层聚焦 “指标计算标准化”,优化数据测量一致性;本体论聚焦 “知识表示与推理”,优化意义传递。能力上,语义层仅能提供指标定义、SQL 生成等数据访问功能,无推理能力;本体论支持逻辑推理、关系推断、歧义消除,能从显式关系中衍生新知识。技术基础上,语义层依赖 YAML 配置和数据库实体,本质是句法与计算层面的抽象;本体论基于 OWL、RDF 等标准和形式逻辑,是语义层面的知识结构化。这种差异导致语义层仅能满足 AI 的基础数据查询需求,而本体论能提供 AI 推理所需的上下文与意义,是 2026 年 AI 的核心需求。

问题 2:2026 年 AI 对数据架构的核心需求是什么,现有哪些技术能满足这一需求?

:2026 年 AI 的核心需求是上下文、意义与推理能力,而非单纯的标准化指标。AI 需要理解领域中的概念定义、实体关系、约束规则,能解释 “为什么”(如决策原因、指标变化诱因),而非仅回答 “是什么”(如指标数值)。能满足这一需求的技术主要是本体论上下文图:本体论通过形式化标准建模领域知识,支持逻辑推理;上下文图作为特殊的知识图谱,捕捉决策推理轨迹、操作上下文和隐性知识(如西门子微电网操作中的控制逻辑、电动汽车充电模式的背后原因)。此外,知识图谱作为两者的载体,能为 LLM 提供结构化领域知识,成为 AI 与数据之间的关键桥梁。

问题 3:组织要构建支持 AI 推理的数据架构,面临的主要挑战是什么,可采取哪些应对措施?

:挑战有三点:

① 技术融合挑战:语义层与本体论基于不同理论,现有语义层架构难以直接升级为支持推理的知识架构;

② 技能缺口挑战:本体构建需知识工程、形式逻辑等稀有技能,多数数据团队缺乏相关能力;

③ 组织承诺挑战:本体与知识图谱建设需多年迭代完善,需持续投入资源,而非短期项目。

应对措施包括:

① 明确架构定位:为人类 BI 分析保留语义层,为 AI 推理单独构建本体 / 知识图谱,并行发展;

② 补齐技能短板:培养或引进图书馆学、分类学、知识工程人才,将知识架构视为核心学科;

③ 提前布局实践:参考医疗、生命科学(20 年前布局本体)的经验,从核心业务场景(如金融犯罪检测、供应链协调)切入,系统提取隐性知识并编码为正式表示。


我们已经在语义表示方面工作了几十年——知识图谱、本体、语义层。杰西卡·塔利斯曼理清了它们实际上是什么,以及人工智能需要它们做什么。


在2012年,Looker推出了LookML和一个愿景:定义一次你的指标,商业用户可以无需SQL自助服务。就在同一时间,生命科学、医疗保健和研究组织正在建立正式的本体和知识图谱,以建模他们的数据和领域。

两种方法都承诺使数据具有意义。十年后,一种驱动仪表盘。另一种推动药物发现,识别癌症治疗,提供临床决策支持,防止致命的药物相互作用,以及支持情报机构在生死决策中依赖的人工智能推理系统。

一个给了我们更漂亮的报告。另一个给了我们能够真正推理含义的机器。我们是否从根本上误解了我们试图解决的问题?人工智能即将迫使我们面对现实。

2026年AI实际上需要什么|

我们认为语义层将解决的问题

语义层是由真正的数据危机产生的。到2000年代末,所有拥有超过一个数据库的组织都面临着同样的噩梦:不同团队以不同方式计算“收入”,分析师将80%的时间花在数据清理和准备上,而高层管理者则无法信任他们仪表板中的数字,因为这些数字会根据构建它们的人而变化。

承诺是优雅的:一次定义你的指标,集中管理它们,让业务用户在不编写SQL的情况下自助服务。Looker的联合创始人Lloyd Tabb将LookML描述为“SQL的续集”,一种让数据团队在原始数据库上创建语义抽象层的语言,使数据“对非技术用户来说变得易于访问和理解。”

对于其所设计的目的,它发挥了作用。使用语义层的组织确实实现了更一致的指标定义。数据团队也标准化了他们的工作。语义层确实交付了它所承诺的内容。

但数据问题已经解决的观点是假设的,并没有确凿的实现。

我们假设核心问题在于计算。如果我们能够标准化指标的计算方式,那么意义就会随之而来。我们认为,从原始数据到业务理解的路径是一个数学过程。

但意义与测量并不相同。知道收入是通过SUM(order_total) WHERE order_status = ‘completed’来计算的,并不能告诉你Q3收入下降的原因,哪些客户处于风险中,或你应该如何应对。

语义层建模的指标未能代表一个组织的现实。

本体实际上是什么

在商业智能行业完善指标一致性的同时,其他领域正在解决一个根本不同的问题。生命科学组织需要整合使用不同词汇的数千项研究的成果。医疗保健系统需要既理解患者数据又具备医学知识的临床决策支持。语义网社区正在建立标准,使机器能够理解意义,而不仅仅是处理语法。

他们正在构建本体(形式化、明确的共享概念规范)以通过建模意义来解决系统冲突和管理模糊性。

本体是使用诸如OWL(Web本体语言)、SKOS(简单知识组织系统)和RDF(资源描述框架)等标准对领域知识进行结构化表示。它们定义了事物的类别、事物可以具有的属性、属性(本体成员元素的描述性修饰)以及它们之间的关系,所有这些都是以支持逻辑推理的机器可读格式进行的。

一个医学本体的很好例子是基因本体论,这在生物信息学中已经发挥了基础作用超过二十年。它不仅定义了与基因相关的指标——还对基因是什么、它们参与的生物过程、它们执行的分子功能以及它们所在的细胞成分进行了建模。最终结果是什么?研究人员查询基因本体论以可靠地发现诸如“这个通路中有多少个基因?”或者理解这些生物概念之间的关系。

另一个经过充分演练的例子是 SNOMED CT

在医疗保健领域,提供一个综合的临床术语和伴随本体,包含超过350,000个概念和数百万个关系。这使得系统能够理解“心肌梗死”和“心脏病发作”指的是同一事物,它是一种“缺血性心脏病”,并且与症状、治疗和解剖结构有特定的关系。

当我们着眼于用本体来定义意义时,我们最终是在讨论知识表示。超越指标,本体力求组织和管理知识,以支持对数据等内容的准确捕捉和表示。

你可能会想,语义层之间的差异有什么重要性?实际上,它们的结构和目标是根本不同的。

语义层通过规范化自然语言中的文本标签,以更可靠的方式告诉你诸如收入多少或网页访问次数等信息。

本体可以表示客户被定义为具有特定属性和特性的类。该客户下了一个订单,并且所订购的商品通过特定的直接和间接关系与特定市场中的其他产品相关联。市场被定义并表示为具有特定的特征。由于本体支持推理,系统能够从显式关系中推断和衍生出新知识。

语义层架构反映了一种非常不同的知识理论。语义层是为分析而构建的,帮助人类通过商业智能工具使用自然语言消费数据。本体是为推理而构建的,帮助系统和人工智能充分理解领域,以便消除数据歧义、发现上下文、进行推理和支持决策。

差别不仅在于技术的复杂性。语义层和本体论代表了关于数据系统本质的根本不同理论。一个优化于测量,另一个优化于意义。我们会回到这个区别,但首先:在我们建立一个的时候,其他人正在押注于另一个。

Palantir看到的我们没有看到的

在2012年,BI行业正在完善LookML,而Palantir则在情报机构和企业中推广Foundry,通过另一种赌注——本体论而非语义层。

Palantir正在为需要理解实体关系和因果链的操作决策构建解决方案。这包括情报分析、供应链协调和金融犯罪检测。

架构是以上下文为首要考虑,而非以指标为首要考虑。在2012年,这看起来是对大多数企业不具备的问题的过度设计。在2026年,当人工智能揭示基于YAML的指标定义的局限性时,这显得具有先见之明。

他们一直都是对的吗?还是他们解决了与大多数组织实际需要的问题不同的问题?

从仪表板到AI 推理| 来源:作者

答案可能在于理解Palantir实际上构建的内容,不仅仅是本体论,还有操作上下文图。

上下文图实际捕捉了什么

尽管Palantir的本体是封闭的且依赖于工具,但可以说他们所构建的是一个特定于Palantir工具和环境的专有上下文图。

当副总裁批准超过政策限制的折扣时,传统系统记录了决策但没有记录推理。当维修技术人员修改程序时,理由存在于他们的头脑中,而不在系统中。上下文图旨在创建这些决策推理的活记录,回答“为什么允许发生X?”而不仅仅是“发生了什么?”

理解这种区别很重要。知识图谱告诉你一个客户下了订单。上下文图谱也是知识图谱。上下文图谱可以告诉你为什么这个订单在违反标准条款的情况下仍然获得批准,类似例外的先例是什么,谁有权限批准这个订单,以及什么条件证明了这种偏差是合理的。

构建这样的系统需要一种正式的方法来表示过程知识。程序知识本体(PKO)由Cefriel的研究人员与包括西门子和博世在内的工业合作伙伴共同开发,提供了上下文图所需的语义架构。PKO区分了程序(关于如何完成某件事情的抽象规范)和执行(那些程序被执行的具体实例)。安全锁定程序指定了一般步骤。锁定执行表示特定技术人员在特定日期执行该程序,并记录特定的观察和结果。

该本体结构涵盖了六个概念领域的知识:程序规范、细化的行动步骤、变更跟踪(谁在何时修改了什么)、执行历史、智能体角色与权限,以及支持文档。这些共同构成了AI智能体处理模糊、充满判断的情境所需的审计轨迹和先例记录。

像西门子这样的组织已经证明了这种方法在实践中是有效的。通过将微电网设备操作建模为具有指定状态和转换的过程,他们将先前未记录的控制逻辑转化为明确的、可查询的知识。电动汽车车主现在可以理解他们的充电模式为何如此表现——不仅仅是充电速度慢,而是为什么(低光伏发电、高电网需求、电池容量限制)以及最佳条件通常何时发生。操作员可以分析设备之间的执行模式,并以完整的上下文可见性排查异常情况。

但这里面临的关键挑战是:这从根本上是一个知识管理问题。上下文图需要系统地引导隐性知识的提取——观察工作实践、采访专家、提取未经文档化的推理,并将其编码为正式的表示形式。如果没有这种知识工程的投资,决策痕迹将被困在Slack线程、电子邮件链和任何系统无法索引或查询的制度记忆中。

能够解决这个问题的组织——将上下文捕捉视为核心竞争力而非副项目——将在人工智能时代拥有可能成为决定性竞争优势的能力:不仅能够解释发生了什么,还能解释为什么会发生这一切。

YAML问题

让我们直言不讳地说我们错在哪里:我们试图在YAML文件中编码商业意义。

请看一下dbt语义层的工作原理:MetricFlow “使用语义模型和指标YAML配置中的信息来构建和运行用户数据平台中的SQL。”现代语义层的整个构架建立在YAML声明能够捕捉商业语义的假设之上。

yaml

semantic_models:

  • name:订单

defaults:

agg_time_dimension: order_date

entities:

-名称: 订单编号

类型:主要

措施:

-名称: 订单总额

agg: sum

这是一个极好的指标治理解决方案。但它绝不是业务的模型。YAML配置是计算模型,捕捉SQL 表和列的表示。它们是数据库实体,简单明了——缺乏关系、自然语言、定义和丰富的背景。关系是连接路径,缺少语义关系或业务流程。

将其与本体如何表示相同领域进行比较:

海龟

明确:

:Alice :placedOrder :Order001 .

:Order001 :hasItem :Item001 .

:Item001 :itemProduct :Laptop .

:Alice :customerLifetimeValue “1250.00”^^xsd:decimal .

推断(自动获取的内容):

:爱丽丝是:高价值客户。# 推理者推断出这一点

:爱丽丝:购买了:笔记本电脑. # 属性链推理

:Order001 :orderedBy :Alice . # 逆向属性

:Laptop :frequentlyBoughtWith :Mouse . # Symmetric property

:Alice :knowsCustomer :Carol . # Transitive reasoning

本体论表示捕捉了YAML 无法表达的意义。本体可以描述一个订单是一种商业交易,它是由一个客户下的,客户是一种人,并且具有不同于报价和发票的订单。本体超越了标签和验证这些标签存在的层面。本体包含支持推理的逻辑语义断言。

虽然我们认为结构化元数据就足够了,但整个科技行业正在(尽管缓慢地)认识到,我们曾假设数据团队能够建模业务逻辑。我们在这三点上都是错误的。

虽然元数据确实是结构性的,但尽管有“语义层”这个名称,它绝对不是语义性的。逻辑停留在语法和计算上,而不是表征、描述或富有上下文的。要建模本体,需要领域专业知识和正式的知识工程技能,而大多数数据团队根本没有这些技能。本体构建需要理解如何表示知识,而不仅仅是如何计算指标。

这绝不是对数据团队的批评。我们必须面对一个严酷的现实,即指标定义和本体工程本质上是不同的学科。我们不要自欺欺人地认为本体和语义层在目标或最终结果上有任何相似之处。

就像你不会要求一名财务分析师来构建临床术语一样,你当然也不会期望一名数据工程师来建模你领域的知识结构。或者,你会这样吗?

为什么人工智能改变一切

在2025年10月,dbt Labs在Coalesce 大会上做出了一个显著的公告:他们将MetricFlow 以Apache 2.0 许可证进行开源。原因是:“事实证明,语义层是构建AI 与结构化数据之间桥梁的关键组件。”

他们对问题的看法是正确的,但解决方案可能需要超出他们当前架构所能提供的内容。

该行业已经认识到,LLM 需要上下文和意义,而不是仪表板。LLM 需要理解事物是什么,它们如何相关,以及可以采取什么行动。这正是本体论和知识图谱所提供的,而不是语义层的能力。语义层用于查找,本体论用于上下文和推理。

上下文要求

我们已经确定AI智能体需要操作上下文。Anthropic的工程团队最近写道“上下文工程是设计一个系统的学科,该系统以正确的格式提供正确的信息和工具,以便为大型语言模型(LLM)提供完成任务所需的一切。”

在这个框架下,环境包括“提示、记忆、少量示例、工具描述”,模型操作的完整语义环境。这不是语义层可以大规模提供的内容。

知识图谱和本体是为这种上下文提供而专门构建的。它们不仅表示数据,还表示赋予数据意义的概念、关系和约束。大型语言模型可以查询知识图谱,并访问超越语义层和度量定义所提供的结构化领域知识。

这就是为什么医疗保健人工智能系统越来越依赖临床本体,为什么药物发现平台建立在生物医学知识图上,以及为什么企业人工智能部署开始融入语义技术。那些在正式知识表示方面投资的领域在理解上下文方面走在了前面,能够展示人工智能推理在大规模下实际有效的地方。

AI系统已经证明,我们必须建立动态和描述性的知识基础设施,以支持人类和机器的使用。由于AI在自然语言领域的工作,SQL化的标签和数据的句法表示无法满足我们在表示数据时的真正人类需求。

虽然度量定义最终通过可视化工具和仪表板为人类消费进行了优化,但其基础语义实际上是缺失的。知识图谱和本体不仅优化了机器和人类的可读性,还旨在支持推理和推断。

真正的架构差异

让我们来看看语义层和本体架构提供了什么:语义层是为人类通过BI工具消费而设计的。它们提供了指标定义和计算、用于分析的维度模型、SQL抽象,以便业务用户不需要技术技能,以及跨报告工具的一致性。它们回答基于指标的问题,并受到其“什么是X?”的限制。

本体和知识图谱旨在实现系统和领域理解。它们提供正式的概念定义和分类法,具有语义意义的显式关系类型,支持逻辑推理和推断,通过标准格式(RDF、OWL、SKOS)实现互操作性,并将领域专业知识集成到机器可读的形式中。它们提供了没有SQL和表约束的上下文。

建筑差异反映了关于数据系统用途的不同理论。

语义层源于商业智能行业对报告和指标的关注。核心问题是在工具和团队之间实现一致的度量。解决方案是集中化的指标治理。

本体是一种神经符号人工智能,起源于知识管理、图书馆科学和人工智能研究,这些领域的核心问题是对领域知识的表示和推理。其解决方案是正式的知识表示,采用标准使得互操作性和推理成为可能。

虽然这两种方法都能奏效,但它们的目的不同,所要实现的目标也不同。

2026年的难题

人工智能作为数据架构的主要消费者的出现,迫使行业面临一些不太舒服的问题。

是否存在折中方案?是否有可能构建“上下文感知的语义层”,在保持度量治理的同时,增强本体所提供的语义丰富性?dbt Labs在2025年与Snowflake和Salesforce共同加入的开放语义交换倡议暗示了这一方向。

但是,指标定义与正式本体之间的差距可能过于广泛,无法一开始就弥合,因为YAML配置和本体格式代表了不同的理论、操作要求、开发资源和含义。

语义层可以演变为知识图谱吗?数据基础设施已经存在。度量定义已经存在。组织可以在他们的语义层之上或连接到其上层叠本体结构吗?

一些公司和研究机构正在尝试。但是,将类、属性和推理规则添加到一个为SQL生成设计的系统中可能需要进行如此根本的架构更改,以至于实质上你正在从零开始构建知识图谱。

我们是否需要一个全新的分类?也许“语义层”或“本体论”都无法准确捕捉AI原生数据架构的实际需求。术语“

上下文工程

“已获得关注。Shopify首席执行官托比·吕特克将其描述为“为任务提供所有上下文的艺术,以便使大型语言模型能够合理地解决它。”

但上下文工程是一种实践,而不是一个平台。“ContextOS”实际会是什么样子?可能是某种结合了度量治理和知识表示的东西——但这比说起来容易得多。

dbt的语义层在未来中适合什么?MetricFlow的开源和OSI倡议表明,dbt Labs将AI视为未来的主要使用案例。他们的文档现在将语义层描述为使“AI智能体能够利用受管控的度量定义进行可信的对话分析”。

但是受到控制对话分析够了吗?还是说智能体需要那种只有正式本体和知识图谱才能提供的领域知识和上下文理解?

度量优先的范式是否已经死去?这可能是最难回答的问题。整个现代数据栈是建立在测量是理解基础的假设之上的。但是,AI系统与人类分析师的推理方式不同。它们不需要以图表形式呈现的指标;它们需要的是概念、关系和推理能力。

这是否意味着以指标为主的范式已经过时,还是说这意味着指标成为更丰富的知识架构的一种输入?

但我们不是已经听过这个了吗?这里有一个令人不安的问题:本体论只是一种炒作周期吗?

语义网在20年前就应该彻底改变互联网。知识图谱将取代数据库。然而,大多数试图构建本体的组织要么失败,要么放弃。

怀疑的案例:本体构建需要稀有技能(知识工程、形式逻辑)、多年的投入以及少数公司能够维持的组织承诺。也许语义层并不是错误的架构。也许我们正在寻找技术解决方案来应对组织问题。

反对意见:这次是不同的,因为人工智能改变了游戏规则。医疗保健和生命科学之所以投资于本体论,并不是因为它们是流行的,而是因为他们的工作需要正式的知识表示。基因本体论在生物信息学中已经基础性地存在了20多年,因为其他选择根本行不通。

现在人工智能使知识推理对每个人都至关重要。问题不在于本体论是否有效(在投资于这些领域的情况下,它们是有效的)。问题在于您的组织是否真的会建立一个。

这在实际中意味着什么

如果你正在构建一个AI分析师,你需要知识表示,而不仅仅是指标。你的AI并不消耗仪表盘,它消耗的是语义表示。如果该表示仅包括指标定义,而没有概念层次、关系类型或领域知识,你的AI只能回答计算问题,而无法回答推理或推断问题。

如果您正在评估语义层,请问:“这是为人类还是为人工智能?”答案决定了指标治理是否足够,或者您是否需要更丰富的知识建模。大多数组织都需要两者,但为人类和为人工智能构建可能需要不同的架构。

如果您正在考虑知识图谱或本体,准备好进行一种不同类型的投资。与数据团队可以相对快速定义的语义层不同,本体需要领域专业知识、知识管理和工程技能,并且通常需要多年的迭代完善。那些在生命科学、医疗保健、金融等领域取得成功的组织,将知识表示视为核心能力,而不是产品或项目。

赢家将是那些寻找意义而不仅仅是进行计算的人。统一的指标是基本要求。竞争优势属于那些数据架构能够支持人工智能进行关于概念、关系和领域知识推理的组织,超越了简单的聚合和过滤。

接下来我们要去哪里?

我认为实际上真正的情况是:语义层与本体框架可能本身就过于狭窄。

语义层是为一个人类通过仪表板消费数据的世界而设计的。本体论是为那些推理知识(而不仅仅是查询数据)是核心需求的领域而设计的。根据任务的不同,这两者都是有意义的。

但人工智能改变了背景。

问题并不在于是否采用语义层或本体论。而在于您的数据架构是否能够为AI系统提供它们在您领域中推理所需的内容。对于某些用例(指标查找、计算一致性、基本分析),语义层仍然是足够的。对于其他用例(复杂推理、推断、意义的引出以及特定领域的AI),则不够。

更重要的问题是:我们现在该做什么?

因为无论我们称之为语义层2.0、知识图谱、上下文工程、上下文图谱还是其他全新的名称,基于度量的思维时代正逐渐结束。AI系统需要理解你的领域是什么:概念、关系、约束、推理规则。

这是一个知识架构问题。

知识架构是一门完全不同的学科,所需的技能与定义度量标准的技能有所不同。它更接近于图书管理员、分类学家和知识工程师几十年来所做的工作,与数据团队通常今天所做的工作流程截然不同。它需要理解如何正式表示领域知识,这些技能是图书馆学、信息架构和语义网研究等领域多年来一直在发展的。

那些主动出击、构建能够真正推理其领域的AI系统的组织将会胜出。而那些不迎接挑战的组织虽然会有非常一致的计算,但却没有他们的AI实际上可以利用的知识基础设施。

这是一种知识架构问题。而知识架构与定义指标是完全不同的学科。它更接近于图书馆员、分类学家和知识工程师几十年来所做的工作——这些技能是图书馆学、信息架构和语义网研究等领域多年来一直在发展。

问题不在于你最终是否需要这个。而在于你是现在开始建设,还是等到你的竞争对手领先三年后再说。

医疗保健和生命科学在20年前就下了赌注。Palantir在2012年制作了他们的封闭本体式系统。你的是什么?

我很想听听你的想法。请在评论中分享你的想法!

我们正在探索这些架构选择及其战略意义。

论未来路径时:语义层能否进化?企业需要本体论吗?谁有机会把握万亿美元的上下文图谱机会?

​最后

我在一线科技企业深耕十二载,见证过太多因技术更迭而跃迁的案例。那些率先拥抱 AI 的同事,早已在效率与薪资上形成代际优势,我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在大模型的学习中的很多困惑。

我整理出这套 AI 大模型突围资料包:

  • ✅AI大模型学习路线图
  • ✅Agent行业报告
  • ✅100集大模型视频教程
  • ✅大模型书籍PDF
  • ✅DeepSeek教程
  • ✅AI产品经理入门资料

完整的大模型学习和面试资料已经上传带到CSDN的官方了,有需要的朋友可以扫描下方二维码免费领取【保证100%免费】👇👇
​​
在这里插入图片描述

为什么说现在普通人就业/升职加薪的首选是AI大模型?

人工智能技术的爆发式增长,正以不可逆转之势重塑就业市场版图。从DeepSeek等国产大模型引发的科技圈热议,到全国两会关于AI产业发展的政策聚焦,再到招聘会上排起的长队,AI的热度已从技术领域渗透到就业市场的每一个角落。

img
智联招聘的最新数据给出了最直观的印证:2025年2月,AI领域求职人数同比增幅突破200% ,远超其他行业平均水平;整个人工智能行业的求职增速达到33.4%,位居各行业榜首,其中人工智能工程师岗位的求职热度更是飙升69.6%。

AI产业的快速扩张,也让人才供需矛盾愈发突出。麦肯锡报告明确预测,到2030年中国AI专业人才需求将达600万人,人才缺口可能高达400万人,这一缺口不仅存在于核心技术领域,更蔓延至产业应用的各个环节。

在这里插入图片描述

​​
在这里插入图片描述

资料包有什么?

①从入门到精通的全套视频教程⑤⑥

包含提示词工程、RAG、Agent等技术点
在这里插入图片描述

② AI大模型学习路线图(还有视频解说)

全过程AI大模型学习路线

在这里插入图片描述

③学习电子书籍和技术文档

市面上的大模型书籍确实太多了,这些是我精选出来的

在这里插入图片描述

④各大厂大模型面试题目详解

在这里插入图片描述

⑤ 这些资料真的有用吗?

这份资料由我和鲁为民博士共同整理,鲁为民博士先后获得了北京清华大学学士和美国加州理工学院博士学位,在包括IEEE Transactions等学术期刊和诸多国际会议上发表了超过50篇学术论文、取得了多项美国和中国发明专利,同时还斩获了吴文俊人工智能科学技术奖。目前我正在和鲁博士共同进行人工智能的研究。

所有的视频教程由智泊AI老师录制,且资料与智泊AI共享,相互补充。这份学习大礼包应该算是现在最全面的大模型学习资料了。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。

在这里插入图片描述
在这里插入图片描述

智泊AI始终秉持着“让每个人平等享受到优质教育资源”的育人理念‌,通过动态追踪大模型开发、数据标注伦理等前沿技术趋势‌,构建起"前沿课程+智能实训+精准就业"的高效培养体系。

课堂上不光教理论,还带着学员做了十多个真实项目。学员要亲自上手搞数据清洗、模型调优这些硬核操作,把课本知识变成真本事‌!

​​​​在这里插入图片描述
在这里插入图片描述

如果说你是以下人群中的其中一类,都可以来智泊AI学习人工智能,找到高薪工作,一次小小的“投资”换来的是终身受益!

应届毕业生‌:无工作经验但想要系统学习AI大模型技术,期待通过实战项目掌握核心技术。

零基础转型‌:非技术背景但关注AI应用场景,计划通过低代码工具实现“AI+行业”跨界‌。

业务赋能 ‌突破瓶颈:传统开发者(Java/前端等)学习Transformer架构与LangChain框架,向AI全栈工程师转型‌。

👉获取方式:

😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓**

在这里插入图片描述

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐