数据分类分级是数据安全的“地基”,通过“先分类、再分级、后施策”,厘清数据资产、识别重要敏感信息,配套差异化安全管控,既守住法律合规红线,又为数据有序流动和价值释放划出安全跑道。

图片

文末附40多G约4000份资料下载

(AI大模型及行业应用方案、企业数字化、数据中台、数据要素、数据资产、数据治理、数字化转型、IT信息化、行业数字化方案及报告等)

一、数据分类分级的背景与意义

1.1 背景驱动因素

  • 数字经济高速发展:数据成为核心生产要素,数据流动频繁,安全形势严峻。

  • 安全事件频发:数据泄露、滥用、跨境流动等问题加剧。

  • 法律政策要求

    • 《网络安全法》第21条:要求采取数据分类、重要数据备份和加密等措施。

    • 《数据安全法》第21条:明确提出建立数据分类分级保护制度。

1.2 实施意义

  • 承上启下:支撑管理制度落地,指导技术措施实施。

  • 风险评估基础:识别关键数据,合理配置安全资源。

  • 促进数据流动:明确可共享数据范围,平衡安全与利用。

  • 合规与降本:精准防护,降低合规成本,提升管理效率。


图片

图片

图片

图片

图片

二、国内外数据分类分级标准解读

2.1 国外标准

  • NIST SP 800-60:配合FIPS 199,提供信息类型与系统安全分类映射方法。

  • FIPS 199:定义信息安全分类标准(低、中、高)。

2.2 国内标准

标准编号

标准名称

核心内容

GB/T 38667-2020

大数据分类指南

提供分类维度与方法,如按来源、结构、质量、行业等

GB/T 39335-2020

个人信息安全影响评估指南

定义个人权益影响程度(严重、高、中、低)

GB/T 39725-2020

健康医疗数据安全指南

医疗数据分5级,明确每级数据的使用场景与安全措施

JR/T 0197-2020

金融数据安全分级指南

将金融数据分为1~5级,按影响对象与程度划分

教育部目录

教育政务信息资源目录

教育数据分为公开、内部、敏感三级

国标(征求意见稿)

重要数据识别指南

明确“重要数据”定义、识别原则与流程


图片

图片

图片

图片

图片

三、行业数据分类分级实践

3.1 通信行业(基础电信企业)

  • 分类维度:业务域、数据类型、主体、来源、形态等。

  • 分级维度:敏感性、重要性、影响范围、时效性等。

  • 等级划分:1~4级(如用户通信内容、位置信息为最高级)。

  • 工作流程

    1. 建立组织保障

    2. 梳理数据资源

    3. 分类与分级

    4. 标识与建清单

    5. 实施安全管控

  • 技术措施

    • 高等级数据需加密、脱敏、访问控制、审计追踪

    • 默认未分级数据按最高等级处理


图片

图片

图片

图片

图片

四、数据分类分级技术方法

4.1 基础识别技术

  • 关键字/词典匹配:支持多语言、权重评分。

  • 正则表达式:识别身份证、手机号、银行卡等结构化数据。

  • 图像识别:OCR提取图片、证件、截图中的文字信息。

  • 数据指纹识别:对结构化/非结构化数据生成指纹,实现相似度比对。

4.2 AI与机器学习

  • NLP语义分析:识别姓名、地址、机构等上下文敏感信息。

  • 模型训练流程

    • 样本收集 → 特征提取(TF-IDF、Word2Vec) → 分类模型(贝叶斯、决策树) → 验证与优化

  • 多技术融合:关键词+正则+语义+指纹+水印,提升识别准确率与覆盖率。


图片

图片

图片

图片

图片

五、分类分级系统建设框架

5.1 系统组成

  • 数据源接入:关系型数据库、大数据平台、文件服务器等

  • 数据识别:结构化/非结构化数据识别、敏感数据定位

  • 资产目录:建立数据资产目录与血缘图谱

  • 分类分级引擎:基于规则+模型自动分类分级

  • 安全管控:按等级实施加密、脱敏、访问控制、审计、水印等

5.2 性能与安全指标

指标类型

指标项

数值

技术指标

数据源支持

30+(Oracle、MySQL、Hive、ES等)

文件类型支持

100+(Office、PDF、图片、压缩包等)

识别元素

50+(身份证、手机号、地址、IMSI等)

性能指标

识别准确率

结构化96%,非结构化90%

识别速度

2500表/分,24万字/秒

安全指标

加密算法

AES256(存储)、RSA(传输)

权限控制

基于角色、细粒度授权、Token失效机制

安全认证

信通院认证、国产系统适配

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐