MySQL - 排序与分页：order by 和 limit 的优化技巧

MySQL排序分页优化指南摘要：本文深入探讨MySQL中ORDER BY和LIMIT的性能优化策略。当处理大数据量分页查询时，传统的LIMIT offset, size语法会因深度分页导致性能急剧下降。通过分析执行流程和EXPLAIN结果，揭示了全表扫描和文件排序的性能瓶颈。文章提出两种核心优化方案：1)覆盖索引+延迟关联技术，通过子查询先获取主键再关联回表；2)游标分页法，利用上一页最后记录的

Jinkxs

273人浏览 · 2025-11-24 09:00:00

Jinkxs · 2025-11-24 09:00:00 发布

在这里插入图片描述

👋 大家好，欢迎来到我的技术博客！
💻 作为一名热爱 Java 与软件开发的程序员，我始终相信：清晰的逻辑 + 持续的积累 = 稳健的成长。
📚 在这里，我会分享学习笔记、实战经验与技术思考，力求用简单的方式讲清楚复杂的问题。
🎯 本文将围绕MySQL这个话题展开，希望能为你带来一些启发或实用的参考。
🌱 无论你是刚入门的新手，还是正在进阶的开发者，希望你都能有所收获！

文章目录

MySQL - 排序与分页：ORDER BY 和 LIMIT 的优化技巧 💡

MySQL - 排序与分页：ORDER BY 和 LIMIT 的优化技巧 💡

在现代 Web 应用和企业级系统中，分页展示数据是再常见不过的需求。无论是电商平台的商品列表、社交网络的动态流，还是后台管理系统的用户报表，几乎每一个功能模块都离不开“排序 + 分页”这一经典组合。而在后端数据库层面，MySQL 通过 ORDER BY 和 LIMIT 实现了这一核心能力。

然而，随着数据量的增长，简单的 SELECT * FROM table ORDER BY column LIMIT offset, size 查询往往会成为性能瓶颈。一个原本毫秒级响应的接口，在百万甚至千万级数据面前可能变成几秒甚至超时。如何高效地实现排序与分页，成为每个 Java 开发者和 DBA 必须掌握的核心技能。

本文将深入剖析 MySQL 中 ORDER BY 与 LIMIT 的执行机制，揭示其性能陷阱，并提供一系列经过实战验证的优化技巧。我们将结合 Java（Spring Boot）代码示例、执行计划分析、索引策略、游标分页（Cursor-based Pagination）等高级方案，并辅以可视化图表和权威参考链接，帮助你构建高性能、可扩展的数据分页系统。

一、基础用法回顾：ORDER BY 与 LIMIT 是如何工作的？ 🧱

在深入优化之前，我们先回顾一下这两个关键字的基本语法和行为。

1.1 ORDER BY：排序你的结果集

ORDER BY 用于对查询结果按指定列进行升序（ASC，默认）或降序（DESC）排序：

SELECT id, name, created_at 
FROM users 
ORDER BY created_at DESC;

如果没有索引支持，MySQL 会使用 filesort（文件排序）算法对结果集进行内存或磁盘排序，这在大数据量下非常昂贵。

1.2 LIMIT：限制返回行数

LIMIT 用于限制查询返回的记录数量，常用于分页：

-- 返回前10条
SELECT * FROM products LIMIT 10;

-- 跳过前20条，返回接下来的10条（第3页，每页10条）
SELECT * FROM products LIMIT 20, 10;
-- 或写作：LIMIT 10 OFFSET 20

⚠️ 注意：LIMIT offset, row_count 中的 offset 是从 0 开始计数的。

1.3 组合使用：经典分页模式

最常见的分页 SQL 如下：

SELECT id, title, publish_time 
FROM articles 
ORDER BY publish_time DESC 
LIMIT 20000, 20;

这条语句看似简单，但当 offset 很大时（如 20000），MySQL 必须先扫描并排序前 20020 行，然后丢弃前 20000 行，只返回最后 20 行——这就是所谓的 深度分页问题（Deep Pagination Problem）。

二、性能瓶颈分析：为什么深度分页这么慢？ ⚠️

为了理解优化的必要性，我们必须先搞清楚 MySQL 在执行 ORDER BY ... LIMIT offset, N 时到底做了什么。

2.1 执行流程剖析

假设我们有如下表结构：

CREATE TABLE orders (
    id BIGINT PRIMARY KEY AUTO_INCREMENT,
    user_id INT NOT NULL,
    amount DECIMAL(10,2),
    created_at DATETIME NOT NULL,
    status TINYINT DEFAULT 1
);

并执行：

SELECT id, user_id, amount, created_at 
FROM orders 
ORDER BY created_at DESC 
LIMIT 100000, 20;

MySQL 的执行步骤大致如下：

全表扫描或索引扫描：根据 ORDER BY created_at 决定是否使用索引。
排序：若无合适索引，则进行 filesort。
跳过 offset 行：即使不需要这些数据，也必须读取并计数。
返回 limit 行：最终只取最后 N 行。

这个过程中，步骤3是最浪费资源的——你付出了读取 100020 行的代价，却只用了最后 20 行。

2.2 EXPLAIN 执行计划分析

让我们用 EXPLAIN 看看实际执行情况：

EXPLAIN SELECT id, user_id, amount, created_at 
FROM orders 
ORDER BY created_at DESC 
LIMIT 100000, 20;

可能的输出（简化）：

id	select_type	table	type	possible_keys	key	key_len	ref	rows	Extra
1	SIMPLE	orders	ALL	NULL	NULL	NULL	NULL	500000	Using filesort

type: ALL 表示全表扫描。
rows: 500000 表示预估扫描 50 万行。
Extra: Using filesort 表示需要额外排序。

即使我们在 created_at 上建了索引：

ALTER TABLE orders ADD INDEX idx_created_at (created_at);

再次 EXPLAIN：

id	select_type	table	type	possible_keys	key	key_len	ref	rows	Extra
1	SIMPLE	orders	index	idx_created_at	idx_created_at	6	NULL	100020	Using index

现在 type 变成了 index（索引扫描），Extra 显示 Using index（覆盖索引），不再需要 filesort。但注意：rows 仍然是 100020！MySQL 依然要遍历前 100020 个索引项才能拿到目标 20 条。

✅ 结论：即使有索引，深度分页依然低效，因为 offset 越大，扫描的索引条目越多。

三、优化策略一：覆盖索引 + 延迟关联（Deferred Join） 🔍

这是针对传统分页的一种经典优化手段，尤其适用于主键有序且排序字段有索引的场景。

3.1 原理

我们不直接查询所有字段，而是先通过索引获取所需行的主键 ID，再通过主键回表查询完整数据。由于主键查询极快（聚簇索引），整体性能大幅提升。

3.2 示例

原始低效查询：

SELECT id, user_id, amount, created_at 
FROM orders 
ORDER BY created_at DESC 
LIMIT 100000, 20;

优化后（延迟关联）：

SELECT o.id, o.user_id, o.amount, o.created_at
FROM orders o
INNER JOIN (
    SELECT id 
    FROM orders 
    ORDER BY created_at DESC 
    LIMIT 100000, 20
) tmp ON o.id = tmp.id
ORDER BY o.created_at DESC;

为什么更快？

子查询 SELECT id FROM orders ORDER BY created_at DESC LIMIT ... 只返回主键 ID。
如果 (created_at, id) 有联合索引，则子查询完全走索引，无需回表。
外层通过主键 id 关联，回表次数仅为 20 次（而非 100020 次）。

3.3 创建联合索引

为最大化效果，建议创建如下索引：

ALTER TABLE orders ADD INDEX idx_created_at_id (created_at, id);

这样，子查询可以完全使用该索引，避免回表和排序。

3.4 Java 代码示例（Spring Boot + MyBatis）

// OrderMapper.java
@Select("""
    SELECT o.id, o.user_id, o.amount, o.created_at
    FROM orders o
    INNER JOIN (
        SELECT id 
        FROM orders 
        ORDER BY created_at DESC 
        LIMIT #{offset}, #{pageSize}
    ) tmp ON o.id = tmp.id
    ORDER BY o.created_at DESC
    """)
List<Order> selectWithDeferredJoin(@Param("offset") int offset, @Param("pageSize") int pageSize);

调用：

int page = 5001; // 第5001页
int pageSize = 20;
int offset = (page - 1) * pageSize; // 100000

List<Order> orders = orderMapper.selectWithDeferredJoin(offset, pageSize);

💡 提示：此方法适用于 固定排序字段 + 主键递增 的场景，但无法解决 offset 过大的根本问题（只是减轻了回表开销）。

四、优化策略二：游标分页（Cursor-based Pagination）🚀

这是目前业界推荐的高性能分页方案，广泛应用于 Twitter、Facebook、GitHub 等大型平台。

4.1 核心思想

放弃使用 OFFSET，改为记住上一页最后一条记录的排序值（游标），下一页查询时以此为起点。

例如：

第一页：ORDER BY created_at DESC LIMIT 20
获取最后一条的 created_at = '2023-10-01 12:00:00' 和 id = 1001
第二页：WHERE created_at < '2023-10-01 12:00:00' OR (created_at = '...' AND id < 1001) ORDER BY created_at DESC, id DESC LIMIT 20

4.2 为什么高效？

无需跳过任何行，直接从游标位置开始扫描。
时间复杂度稳定为 O(log N + M)，其中 M 是每页大小。
即使翻到第 100 万页，性能依然如初。

4.3 实现要点

排序字段必须唯一或组合唯一（通常加上主键 id）。
游标需包含所有排序字段的值。
方向一致（只能向前或向后翻页，不能随机跳页）。

4.4 SQL 示例

假设我们按 created_at DESC, id DESC 排序：

-- 第一页
SELECT id, user_id, amount, created_at 
FROM orders 
ORDER BY created_at DESC, id DESC 
LIMIT 20;

-- 假设最后一条：created_at='2023-10-01 10:00:00', id=5000

-- 第二页
SELECT id, user_id, amount, created_at 
FROM orders 
WHERE (created_at < '2023-10-01 10:00:00') 
   OR (created_at = '2023-10-01 10:00:00' AND id < 5000)
ORDER BY created_at DESC, id DESC 
LIMIT 20;

4.5 索引设计

必须创建联合索引：

ALTER TABLE orders ADD INDEX idx_cursor (created_at DESC, id DESC);

⚠️ 注意：MySQL 8.0+ 支持显式指定索引排序方向，旧版本默认 ASC，但 DESC 查询仍可使用（只是效率略低）。

4.6 Java 实现（Spring Boot Controller）

@RestController
public class OrderController {

    @Autowired
    private OrderService orderService;

    // 游标分页接口
    @GetMapping("/orders/cursor")
    public PageResult<Order> getOrdersByCursor(
            @RequestParam(required = false) String cursorTime,
            @RequestParam(required = false) Long cursorId,
            @RequestParam(defaultValue = "20") int size) {

        LocalDateTime cursor = null;
        if (cursorTime != null) {
            cursor = LocalDateTime.parse(cursorTime);
        }

        List<Order> orders = orderService.queryByCursor(cursor, cursorId, size);

        // 构造下一页游标（取最后一条）
        String nextCursorTime = null;
        Long nextCursorId = null;
        if (!orders.isEmpty()) {
            Order last = orders.get(orders.size() - 1);
            nextCursorTime = last.getCreatedAt().toString();
            nextCursorId = last.getId();
        }

        return new PageResult<>(orders, nextCursorTime, nextCursorId);
    }
}

Service 层：

public List<Order> queryByCursor(LocalDateTime cursorTime, Long cursorId, int size) {
    return orderMapper.selectByCursor(cursorTime, cursorId, size);
}

MyBatis Mapper：

@Select({
    "<script>",
    "SELECT id, user_id, amount, created_at",
    "FROM orders",
    "<where>",
    "<if test='cursorTime != null'>",
    "(created_at &lt; #{cursorTime} OR (created_at = #{cursorTime} AND id &lt; #{cursorId}))",
    "</if>",
    "</where>",
    "ORDER BY created_at DESC, id DESC",
    "LIMIT #{size}",
    "</script>"
})
List<Order> selectByCursor(@Param("cursorTime") LocalDateTime cursorTime,
                           @Param("cursorId") Long cursorId,
                           @Param("size") int size);

4.7 前端配合

前端需保存上一页的游标（如 nextCursorTime 和 nextCursorId），并在请求下一页时传回。

{
  "data": [...],
  "nextCursorTime": "2023-10-01T10:00:00",
  "nextCursorId": 5000
}

✅ 优点：性能极佳，适合无限滚动（Infinite Scroll）。
❌ 缺点：不支持跳页（如直接跳到第 100 页）。

五、优化策略三：冗余字段 + 预计算 🧮

对于某些业务场景（如按热度、评分排序），实时计算成本高，可考虑预计算排序值并存储。

5.1 场景举例

商品按“综合得分”排序（销量×0.3 + 评论数×0.5 + 收藏数×0.2）
用户动态按“权重”排序（发布时间衰减 + 互动加权）

5.2 实现方式

新增 sort_score 字段。
通过定时任务或触发器更新该字段。
查询时直接 ORDER BY sort_score DESC。

ALTER TABLE products ADD COLUMN sort_score DECIMAL(10,4) DEFAULT 0;

CREATE INDEX idx_sort_score ON products(sort_score DESC);

Java 更新逻辑（可放入定时任务）：

@Transactional
public void updateProductSortScore() {
    List<Product> products = productMapper.selectAllForScoring();
    for (Product p : products) {
        BigDecimal score = calculateScore(p);
        productMapper.updateSortScore(p.getId(), score);
    }
}

查询：

SELECT * FROM products ORDER BY sort_score DESC LIMIT 20;

💡 此方法牺牲实时性换取查询性能，适用于对排序精度要求不高的场景。

六、其他实用技巧 🛠️

6.1 避免 SELECT *

只查询必要字段，减少 I/O 和网络传输。

-- Bad
SELECT * FROM orders ...

-- Good
SELECT id, user_id, amount FROM orders ...

6.2 使用覆盖索引（Covering Index）

确保 SELECT 字段全部包含在索引中，避免回表。

-- 索引包含所有查询字段
CREATE INDEX idx_cover ON orders(created_at, id, user_id, amount);

此时查询可完全在索引中完成（Using index）。

6.3 限制最大 offset

在业务层面禁止深度分页。例如：

Google 搜索最多显示 10 页。
电商网站限制“仅展示前 100 页”。

Java 示例：

if (page > 100) {
    throw new IllegalArgumentException("Page number too large");
}

6.4 使用缓存

对高频访问的前几页结果进行 Redis 缓存：

String cacheKey = "orders:page:" + page;
List<Order> cached = redisTemplate.opsForList().range(cacheKey, 0, -1);
if (cached != null && !cached.isEmpty()) {
    return cached;
}
// 查询 DB 并缓存

七、可视化：不同分页策略性能对比 📊

下面是一个基于模拟数据的性能对比图（单位：毫秒）：

xychart-beta
    title "分页策略响应时间对比（数据量：100万）"
    x-axis 页面 [1, 100, 1000, 5000, 10000]
    y-axis 响应时间 (ms)
    line [5, 8, 15, 80, 200] : "传统 OFFSET"
    line [5, 6, 7, 9, 12] : "延迟关联"
    line [4, 4, 5, 5, 6] : "游标分页"

从图中可见：

传统分页随页码增加急剧恶化。
延迟关联有所改善，但仍受 offset 影响。
游标分页始终保持稳定低延迟。

八、权威参考与延伸阅读 🔗

以下是一些高质量、可正常访问的技术资料：

MySQL 官方文档 - ORDER BY Optimization
https://dev.mysql.com/doc/refman/8.0/en/order-by-optimization.html
👉 详细解释了 MySQL 如何优化排序，包括索引使用和 filesort 触发条件。
Use The Index, Luke! - Pagination
https://use-the-index-luke.com/sql/partial-results/fetch-next-page
👉 经典数据库性能优化网站，深入讲解游标分页原理。
High Performance MySQL (O’Reilly)
https://www.oreilly.com/library/view/high-performance-mysql/9781449316971/
👉 数据库领域圣经，第6章专门讨论查询性能优化。
GitHub Engineering: How we scaled GitHub’s feed
https://github.blog/2019-03-27-how-we-scaled-githubs-feed/
👉 GitHub 如何用游标分页支撑亿级动态流。

九、总结：选择适合你的分页策略 ✅

策略	适用场景	是否支持跳页	性能	实现复杂度
传统 OFFSET	小数据量、需跳页	✅	差（深度分页）	低
延迟关联	中等数据量、固定排序	✅	中	中
游标分页	大数据量、无限滚动	❌	极佳	中高
预计算排序	复杂排序逻辑	✅	极佳	高

作为 Java 开发者，你应该：

优先考虑游标分页，尤其在移动端或信息流场景。
对管理后台等需跳页的场景，限制最大页码 + 延迟关联。
永远不要在生产环境裸奔 SELECT * ... LIMIT 100000, 20！

记住：好的分页设计，不是让数据库做更多，而是让它做更少。通过合理的索引、查询重构和业务妥协，我们可以轻松应对亿级数据的分页挑战。

希望这篇长文能成为你优化 MySQL 分页查询的实用指南。如果你有任何问题或实践经验，欢迎在评论区分享！🌟

🙌 感谢你读到这里！
🔍 技术之路没有捷径，但每一次阅读、思考和实践，都在悄悄拉近你与目标的距离。
💡 如果本文对你有帮助，不妨 👍 点赞、📌 收藏、📤 分享给更多需要的朋友！
💬 欢迎在评论区留下你的想法、疑问或建议，我会一一回复，我们一起交流、共同成长 🌿
🔔 关注我，不错过下一篇干货！我们下期再见！✨