一、 核心定位:它解决什么问题?

在AI领域,术语常常被混用,架构也千差万别。ISO/IEC 23053-2022 旨在:

  1. 建立共同语言: 明确定义与基于机器学习的AI系统相关的核心概念、组件和生命周期阶段,为供应商、开发者、用户和监管机构之间的沟通提供基础。

  2. 描绘标准架构: 提供一个通用的、高层次的框架来描述此类系统是如何构建和运作的。这就像为建造房屋提供一张标准的建筑蓝图,指明了需要哪些核心部分以及它们之间如何连接。

  3. 为后续标准奠定基础: 这个框架是“元标准”,它为制定更多具体的、细化的AI标准(如关于性能评估、数据管理、可信度等)提供了一个共同的参考模型。ISO/IEC 23894(风险管理)和 ISO/IEC 42001(管理体系)都可以被视为在这个框架之上对特定方面(风险、管理)的深化。

二、 核心内容解读:两大核心模型

该标准的核心贡献是两个关键模型:

1. 基于机器学习的AI系统的通用框架

这个框架将一个基于ML的AI系统分解为两个主要逻辑组成部分:

  • ML模型(Machine Learning Model):

    • 是什么: 这是系统的“大脑”或核心算法。它是通过使用训练数据解决一个ML问题(如分类、回归、聚类)而得到的输出结果。

    • 例子: 一个能够识别猫的图片的神经网络结构及其训练好的权重参数,就是一个ML模型。

  • ML系统(Machine Learning System):

    • 是什么: 这是包含了ML模型并使其能够在现实世界中运作的完整软件系统。它不仅包括模型,还包括所有必要的软件组件,如:

      • 输入处理模块: 接收原始数据(如用户上传的图片)并进行预处理(如调整尺寸、标准化)。

      • 推理引擎: 将处理后的数据输入ML模型,并执行计算得到输出(如“这是猫”的概率)。

      • 输出处理模块: 对模型的原始输出进行后处理,转化为对用户有意义的格式或行动(如显示标签、触发另一个系统)。

    • 关键点: 标准强调,我们实际使用的是ML系统,而不仅仅是ML模型。系统的整体行为和质量取决于所有组件的共同作用。

这个框架清晰地说明了模型系统的关系,纠正了“有一个好模型就等于有一个好产品”的常见误解。

2. ML系统及其模型的机器学习生命周期

标准描述了基于ML的AI系统的典型生命周期阶段,这是一个迭代的过程。下图清晰地展示了这一生命周期及其核心阶段:

下面我们来详解图中的每个阶段:

  • 概念与需求分析:

    • 确定业务目标,定义系统需要解决什么问题,并制定衡量成功的技术指标(如准确率、延迟)。

  • 数据工程:

    • 数据收集/获取: 获取用于训练和测试模型的数据。

    • 数据准备/预处理: 清洗数据、处理缺失值、进行数据标注等。这是非常关键且耗时的一步。

  • ML模型工程:

    • 模型训练: 使用准备好的训练数据来学习模型参数。

    • 模型评估与验证: 使用测试数据评估模型的性能,确保其达到要求且没有过拟合等问题。

  • 系统工程:

    • 系统集成: 将训练好的ML模型集成到完整的ML系统中,与其他软件组件结合。

    • 系统验证: 测试整个集成后的系统,确保其按预期工作。

  • 部署与运维:

    • 将系统部署到生产环境(如云端、边缘设备),并开始对外提供服务。

  • 监控与维护:

    • 这是持续迭代的关键环节。 监控系统在生产环境中的性能和表现。由于现实世界的数据分布可能会变化(概念漂移),模型性能可能会下降。因此需要根据监控结果,重新触发数据工程模型工程,对系统进行更新和维护。

三、 标准的关键价值与意义

  1. 促进互操作性: 统一的框架使得不同团队、不同公司开发的AI组件更容易被理解和集成。

  2. 提高可重复性和透明度: 按照标准化的生命周期来管理项目,可以使开发过程更加规范,结果更可预测,也更容易向利益相关者解释系统是如何构建的。

  3. 指导风险管理: 该框架明确了在生命周期的哪个阶段可能产生何种风险。例如,数据阶段的风险是偏见,部署阶段的风险是安全问题。这为实施ISO/IEC 23894(风险管理)提供了清晰的风险点地图。

  4. 支持可信AI: 通过强调整个系统(而不仅仅是模型)和持续监控的重要性,该标准间接支持了构建可靠、稳健、可信赖的AI系统。

四、 主要应用场景

  • AI项目规划与管理: 为项目经理提供了管理AI项目的标准流程和术语。

  • AI系统设计与架构: 为系统架构师和工程师提供了设计蓝图。

  • AI教育与培训: 作为理解AI系统构成的优秀教学框架。

  • 制定法规与标准: 为政策制定者和标准机构提供了技术参考。

总结

ISO/IEC 23053-2022 是一个基础性、描述性的标准。它不像ISO/IEC 42001那样是“要求”性标准,也不像ISO/IEC 23894那样是某方面的“指南”。

它的核心贡献在于:为复杂且快速发展的机器学习领域建立了一个清晰、共识性的概念模型和生命周期模型。 简单来说,它回答了“一个基于机器学习的AI系统到底是由什么构成的,以及它是如何从无到有并被维护的”这两个基本问题。它是理解和建设AI系统的“语法”和“地图”,是整个AI标准家族的基石之一。

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐