1小时文献量30秒读完！手把手教你构建论文总结 Agent Skill

大家好我是小肥肠。转眼又到了写论文的季节，你是不是又在为需要阅读大量参考文献发愁？今天我们将开发一个 Agent Skill。你只需提供文件源文件，它便能自动输出文献总结报告，告别低效的人肉阅读，让 AI 替你完成最枯燥的预研工作。

c18213590220

583人浏览 · 2026-02-02 14:02:27

c18213590220 · 2026-02-02 14:02:27 发布

大家好我是小肥肠。转眼又到了写论文的季节，你是不是又在为需要阅读大量参考文献发愁？今天我们将开发一个 Agent Skill。你只需提供文件源文件，它便能自动输出文献总结报告，告别低效的人肉阅读，让 AI 替你完成最枯燥的预研工作。

1. 前言

面对堆积如山的参考文献，最让人崩溃的往往不是看不懂，而是看不完。传统的查阅方式是逐一打开 PDF，手动标记重点，再苦哈哈地归类整理，效率极低且容易遗漏关键信息。

本文我们将开发一个 Agent Skill，利用 PyMuPDF4LLM 精准拆解 PDF 论文后调用 AI 深度分析总结。你只需提供文件，它便能自动输出结构化报告，告别低效的人肉阅读，让 AI 替你完成最枯燥的预研工作。

先来看一下实现效果，原文PDF如下：

经过 Agent Skill整理后的内容：

2. 前置设计工作

2.1. 需求背景

在科研或深度学习过程中，我们往往面临两个核心痛点：

从上图可以看出我们面临的主要是信息过载与论文格式难以解析的两大痛点。基于 Agent Skill，我们可以将这些枯燥、重复、高出错率的预研工作完全自动化。AI 不再只是个翻译官，而是变成了一个能直接操作本地文件、精准拆解结构并产出专业简报的科研数字助手。

2.2. 技术栈梳理

在创建Skill前，需要进行几个前置操作：

1. 安装python（这个不讲了，网上手把手教程很多，自行根据自己的操作系统搜索一下安装教程）

2. 安装安装PyMuPDF4LLM，打开命令提示词，输入如下指令

pip install pymupdf4llm

3. 安装ClaudeCode，整合大模型，我这边整合的Doubao-Seed-Code，具体教程可参考：

文风自我进化？10分钟教你用 Agent Skills 搭建一个能“无限迭代”的小说生成器

3. 技术实现

本文的Agent Skill目录结构设计如下：

xfc-paper-summary/
├── SKILL.md          # 必填：使用说明 + 元数据
├── scripts/          # 可选：可执行代码
├── references/       # 可选：文档资料
└── assets/           # 可选：模板、资源文件

1. 按照上述目录结构创建文件夹

2.编写读取文献代码

进入xfc-paper-summary/scripts/路径，创建process.py文件，填入源代码：

import pymupdf4llm
import os
import sys

def extract_pdf_to_markdown(input_path: str) -> str:
    if os.path.isabs(input_path) and os.path.exists(input_path):
        target_path = input_path
    else:
        target_path = os.path.join(os.path.dirname(os.path.dirname(__file__)), "assets", input_path)
    if not os.path.exists(target_path):
        raise FileNotFoundError(f"未找到文献文件，请检查路径是否正确: {target_path}")
    markdown_text = pymupdf4llm.to_markdown(target_path)
    return markdown_text

if __name__ == "__main__":
    if len(sys.argv) > 1:
        pdf_input = sys.argv[1]
    else:
        assets_dir = os.path.join(os.path.dirname(os.path.dirname(__file__)), "assets")
        if not os.path.exists(assets_dir):
            os.makedirs(assets_dir)
            
        pdf_files = [f for f in os.listdir(assets_dir) if f.endswith(".pdf")]
        if not pdf_files:
            print("Error: assets 目录下没有找到 PDF 文件，请提供绝对路径或放入 assets 中。")
            sys.exit(1)
            
        print(f"检测到 assets 中的文献: {', '.join(pdf_files)}")
        pdf_input = pdf_files[0]

    try:
        print(f"--- 正在解析文献: {pdf_input} ---")
        md = extract_pdf_to_markdown(pdf_input)
        print(md) 
    except Exception as e:
        print(f"解析过程中出现故障: {e}")
        sys.exit(1)

在代码中判断有没有输入绝对路径，若没有则找到assets 文件夹，调用 pymupdf4llm 库，将原本是图片感或二进制格式的 PDF 论文转换成带格式的 Markdown 纯文本。

3.编写SKILL.md

进入xfc-paper-summary/路径，创建SKILL.md文件，这里给出编写思路，自行去豆包里扩充就行：

--- 
name: xfc-paper-summary description: 资深论文解析专家。支持自动解析本地PDF并生成结构化总结报告。 
---

编写提示词：
1. 调用 .claude/skills/xfc-paper-summary/scripts/process.py 解析文献
2. 深度拆解与总结，需要拆解为以下框架
- 研究背景
- 核心方法论
- 实验结论
- 局限与启发
3. 使用 `write_to_file` 工具将总结后的内容写入.claude/skills/xfc-paper-summary/reference/文件夹下

4.测试调用xfc-paper-summary

回到.claude上级目录，在文件路径处输入cmd打开命令提示符窗口：

输入"claude"

输入"帮我分析总结这个文献 D:/wx/紫砂产业现存问题与策略_杨施雨.pdf"

可以看到claude code自主调用了skill并完成了文献的拆解和总结

我们只要跟随claude code的牵引流程，不停选择yes，即可完成总结文档的写入。

以上就是整个skill构建的完整流程拆解，动手能力强的读者可以跟着教程实践一遍。上述skill已经被收录到了小肥肠共学群中，需要原件可以加入社群直接使用哦。

4. 结语

这种基于 Agent Skill 的开发思路，本质上是让 AI 拥有了操作本地文件和执行特定算法的能力。不仅是论文总结，你可以举一反三，将其应用在财务报表分析、技术文档库整理等更多场景中。

如本次分享对你有帮助，麻烦一键三连支持一下小肥肠，我们下期再见~

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

LMDeploy重磅更新：从支撑模型到被模型反哺，推理引擎迈入协同进化时代！

2048 AI社区

企业估值中的人工智能法律助手评估

本文旨在探讨人工智能技术在企业估值过程中法律风险评估方面的应用。我们将重点关注如何利用AI技术识别、分析和量化企业面临的法律风险，以及这些风险如何影响企业整体估值。AI法律助手的基本原理法律风险评估的技术实现风险因素对企业估值的影响模型实际应用案例分析本文首先介绍AI法律助手的基本概念和技术背景，然后深入探讨核心算法原理和数学模型。接着通过实际代码示例展示技术实现，最后讨论应用场景和未来发展趋势。

2048 AI社区

AI应用架构师：如何设计可扩展的智能家居系统？

智能家居的本质是**“感知-决策-执行”的闭环智能系统**，而可扩展性是其从“单设备控制”走向“全场景协同”的核心瓶颈。从“设备异构”到“协议统一”的设备层抽象；从“集中式处理”到“边缘-云端协同”的计算分层；从“ polling 轮询”到“事件驱动”的流量优化；从“单体应用”到“微服务拆分”的功能扩展。通过理论推导、架构设计、代码实现与案例分析，本文为架构师提供一套可落地的可扩展智能家居设计框架