数据库设计之规范化和反规范化

文章目录一、规范化二、反规范化数据库设计的规范化能够经常被提及，但是反规范化很少被涉猎。实际应用中反规范化应用的场景很多。本文主要介绍一下数据库的反规范化。一、规范化常见的规范化有数据库设计的三范式。1NF 是最低的规范化要求。如果关系 R 中所有属性的值域都是简单域，属性不可再分。2NF 非主属性完全函数依赖于码3NF 非...

东语~

5685人浏览 · 2019-09-09 20:56:58

东语~ · 2019-09-09 20:56:58 发布

文章目录

- 一、规范化
- 二、反规范化

数据库设计的规范化能够经常被提及，但是反规范化很少被涉猎。实际应用中反规范化应用的场景很多。本文主要介绍一下数据库的反规范化。

一、规范化

常见的规范化有数据库设计的三范式。

1NF 是最低的规范化要求。如果关系 R 中所有属性的值域都是简单域，属性不可再分。
2NF 非主属性完全函数依赖于码
3NF 非主属性不传递依赖于任何一个候选码

二、反规范化

数据库中的数据规范化的优点是减少了数据冗余，节约了存储空间，相应逻辑和物理的I/O 次数减少，同时加快了增、删、改的速度，但是对完全规范的数据库查询，通常需要更多的连接操作，从而影响查询速度。因此，有时为了提高某些查询或应用的性能而破坏规范规则，即反规范化（非规范化处理）。

常见的反规范化技术包括：

（1）增加冗余列
增加冗余列是指在多个表中具有相同的列，它常用来在查询时避免连接操作。例如：以规范化设计的理念，学生成绩表中不需要字段“姓名”，因为“姓名”字段可以通过学号查询到，但在反规范化设计中，会将“姓名”字段加入表中。这样查询一个学生的成绩时，不需要与学生表进行连接操作，便可得到对应的“姓名”。
（2）增加派生列
增加派生列指增加的列可以通过表中其他数据计算生成。它的作用是在查询时减少计算量，从而加快查询速度。例如：订单表中，有商品号、商品单价、采购数量，我们需要订单总价时，可以通过计算得到总价，所以规范化设计的理念是无须在订单表中设计“订单总价”字段。但反规范化则不这样考虑，由于订单总价在每次查询都需要计算，这样会占用系统大量资源，所以在此表中增加派生列“订单总价”以提高查询效率。
（3）重新组表
重新组表指如果许多用户需要查看两个表连接出来的结果数据，则把这两个表重新组成一个表来减少连接而提高性能。
（4）分割表
有时对表做分割可以提高性能。表分割有两种方式。
水平分割：根据一列或多列数据的值把数据行放到两个独立的表中。水平分割通常在下面的情况下使用。

情况 1：表很大，分割后可以降低在查询时需要读的数据和索引的页数，同时也降低了索引的层数，提高查询效率。
情况 2：表中的数据本来就有独立性，例如表中分别记录各个地区的数据或不同时期的数据，特别是有些数据常用，而另外一些数据不常用。
情况 3：需要把数据存放到多个介质上。
（5）垂直分割：把主码和一些列放到一个表，然后把主码和另外的列放到另一个表中。如果一个表中某些列常用，而另外一些列不常用，则可以采用垂直分割，另外垂直分割可以使得数据行变小，一个数据页就能存放更多的数据，在查询时就会减少 I/O 次数。其缺点是需要管理冗余列，查询所有数据需要连接操作。

END

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

2025届最火的十大AI写作平台推荐榜单

2048 AI社区

2025届学术党必备的五大AI辅助论文工具推荐榜单

2048 AI社区

硬核劝学：2026年 AI 工程师“飞升”指南 (LLM/RL/VLM/AIGC 全路线)

如果这篇博客让你感到焦虑，那就对了。焦虑是学习的动力。去下载一个或Qwen2.5-7B。安装vLLM，尝试在本地部署它。阅读DPO的论文，并尝试用库跑通一个最小的对齐 Demo。只有动手写代码 (Write Code)，你才能真正拥有它。(附注：文中提到的所有论文建议直接在 arXiv 搜索标题，工具库直接上 GitHub 搜索 Star 数最高的即可。2025年的技术，唯快不破。