һ���� Code Agent ��ĵ�

当前主流AI编程助手(如Claude Code、Cursor等)普遍存在无法直接读取PDF文件的短板。本文介绍了一种简单解决方案：只需运行命令npx skills add tanis90/pdf-converter-mineru，即可为Code Agent添加PDF处理能力。该技能基于开源的MinerU文档解析引擎，支持论文、技术文档、扫描合同等多种PDF格式的读取、分析和内容提取，并能自动选择快

lingxie2512

235人浏览 · 2026-04-08 18:18:02

lingxie2512 · 2026-04-08 18:18:02 发布

Claude Codeã€Cursorã€Kimi Codeã€Codexã€Clineâ€”â€”çŽ°åœ¨å¤§å®¶å†™ä»£ç è¶Šæ¥è¶Šä¾èµ– Code Agentã€‚ä½†å¤§æ¨¡åž‹æœ‰ä¸€ä¸ªçŸæ¿ï¼šè¯»ä¸äº† PDFã€‚

ä½ ä¸¢ç»™å®ƒä¸€ä¸ª PDF æ–‡ä»¶è·¯å¾„ï¼Œå®ƒåªä¼šå‘Šè¯‰ä½ "è¿™æ˜¯ä¸ªäºŒè¿›åˆ¶æ–‡ä»¶ï¼Œæˆ‘è¯»ä¸äº†"ã€‚è®ºæ–‡ã€æŠ€æœ¯æ–‡æ¡£ã€äº§å“æ‰‹å†Œã€æ‰«æåˆåŒâ€”â€”å
¨éƒ½æ‰“ä¸å¼€ã€‚

è§£å†³æ–¹æ¡ˆåªéœ€è¦ä¸€è¡Œå‘½ä»¤ï¼š

npx skills add tanis90/pdf-converter-mineru

è£
å®Œä¹‹åŽï¼Œä½ çš„ Code Agent å°±èƒ½ç›´æŽ¥è¯»å–ã€è§£æžã€æ€»ç»“ä»»ä½• PDF æ–‡ä»¶ï¼ŒåŒ
æ‹¬æ‰«æä»¶ã€‚

è¿™è¡Œå‘½ä»¤åšäº†ä»€ä¹ˆ

npx skills add æ˜¯ OpenClaw çš„ Skill å®‰è£
å‘½ä»¤ã€‚OpenClaw æ˜¯ Code Agent çš„æŠ€èƒ½å¸‚åœºâ€”â€”ç±»ä¼¼ VS Code çš„æ‰©å±•å•†åº—ï¼Œä½†é¢å‘çš„æ˜¯ AI ç¼–ç¨‹åŠ©æ‰‹ã€‚

è¿™è¡Œå‘½ä»¤ä¼šæ‹‰å–ä¸€ä¸ªå« pdf-converter-mineru çš„ Skillï¼Œè£
åˆ°ä½ æœ¬åœ°çš„ skills ç›®å½•ä¸‹ã€‚è£
å¥½ä¹‹åŽï¼Œä½ çš„ Code Agent å°±èŽ·å¾—äº†ä¸€ä¸ªæ–°èƒ½åŠ›ï¼šè°ƒç”¨ MinerU Open API æŠŠ PDF è½¬æˆ Markdownï¼Œç„¶åŽè‡ªå·±é˜
è¯»å’Œç†è§£å†
å®¹ã€‚

æ•´ä¸ªè¿‡ç¨‹å¯¹ä½ æ¥è¯´æ˜¯é€æ˜Žçš„ã€‚ä½ ä¸éœ€è¦æ‰‹åŠ¨è°ƒç”¨ä»»ä½•å‘½ä»¤ï¼Œä¹Ÿä¸éœ€è¦é
ç½® MCP serverâ€”â€”ç›´æŽ¥å¯¹ä½ çš„ Code Agent è¯´"å¸®æˆ‘è¯»è¿™ä¸ª PDF"å°±è¡Œã€‚

å“ªäº› Code Agent æ”¯æŒ

è¿™ä¸ª Skill åŸºäºŽ OpenClaw çš„å¼€æ”¾æ ‡å‡†ï¼Œä¸€æ¬¡å®‰è£
ï¼Œè·¨å·¥å
·é€šç”¨ï¼š

| Code Agent | æ”¯æŒæƒ
å†µ |
|:—|:—|
| Claude Code | åŽŸç”Ÿæ”¯æŒ |
| Cursor | æ”¯æŒ |
| Cline | æ”¯æŒ |
| Augment | æ”¯æŒ |
| Kimi Code | æ”¯æŒ |
| CodeBuddy | æ”¯æŒ |
| Warp | æ”¯æŒ |

ä¸ç®¡ä½ æ—¥å¸¸ç”¨å“ªä¸ª Code Agentï¼Œè£
ä¸€æ¬¡å°±è¡Œã€‚

å®ƒèƒ½åšä»€ä¹ˆ

è£
å®Œ Skill ä¹‹åŽï¼Œä½ å¯ä»¥ç›´æŽ¥è¿™æ ·å¯¹ä½ çš„ Code Agent è¯´ï¼š

è¯»è®ºæ–‡ï¼š

> å¸®æˆ‘è¯»ä¸€ä¸‹ ./papers/attention-is-all-you-need.pdfï¼Œæ€»ç»“æ ¸å¿ƒè´¡çŒ®

æå–è¡¨æ ¼ï¼š

> æŠŠ quarterly-report.pdf é‡Œçš„è´¢åŠ¡æ•°æ®è¡¨æ ¼æå–å‡ºæ¥

æ‰«æä»¶è¯†åˆ«ï¼š

> è¿™ä»½æ‰«æçš„åˆåŒ contract-scan.pdfï¼Œå¸®æˆ‘æ‰¾åˆ°ä»˜æ¬¾æ¡æ¬¾

æ‰¹é‡å¤„ç†ï¼š

> æŠŠ ./docs/ ä¸‹æ‰€æœ‰ PDF è½¬æˆ Markdown

Code Agent ä¼šè‡ªåŠ¨åˆ¤æ–ç”¨å“ªç§æ¨¡å¼ï¼š

å°æ–‡ä»¶ã€å¿«é€Ÿé˜
è¯» â†’ flash-extractï¼ˆå
ç™»å½•ï¼Œç§’å‡ºç»“æžœï¼‰
å¤§æ–‡ä»¶ã€éœ€è¦ä¿ç•™è¡¨æ ¼å’Œå
¬å¼ â†’ extractï¼ˆé«˜ç²¾åº¦æ¨¡å¼ï¼‰

ä½ ä¸éœ€è¦è®°ä»»ä½•å‘½ä»¤å‚æ•°ã€‚

ä¸ºä»€ä¹ˆä¸ç”¨ MCP server

ç»™ Code Agent åŠ æ–‡æ¡£èƒ½åŠ›ï¼Œå¾ˆå¤šäººç¬¬ä¸€ååº”æ˜¯"è£
ä¸ª MCP server"ã€‚æ¯”å¦‚è·‘ä¸€ä¸ªæœ¬åœ°çš„ document parsing æœåŠ¡ï¼Œé
ç½® JSONï¼Œå†å†™å¥½ tool çš„ schemaã€‚

èƒ½ç”¨ï¼Œä½†å¤ªé‡äº†ã€‚

Skill çš„ä¼˜åŠ¿æ˜¯ï¼š

**ä¸€è¡Œå®‰è£
**ï¼Œä¸éœ€è¦ Dockerã€ä¸éœ€è¦é¢å¤–è¿›ç¨‹ã€ä¸éœ€è¦é
ç½®æ–‡ä»¶
é›¶è¿ç»´ï¼Œä¸ç”¨ç®¡æœåŠ¡æ˜¯å¦åœ¨è·‘ã€ç«¯å£æœ‰æ²¡æœ‰å†²çª
è·¨å·¥å
·é€šç”¨ï¼ŒåŒä¸€ä¸ª Skill åœ¨ Claude Codeã€Cursorã€Kimi Code é‡Œéƒ½èƒ½ç”¨
è‡ªåŠ¨é€‰æ‹©ç–ç•¥ï¼ŒCode Agent è‡ªå·±å†³å®šç”¨ flash æ¨¡å¼è¿˜æ˜¯ç²¾åº¦æ¨¡å¼
å¼€ç®±å³ç”¨ï¼Œè£
å®Œç›´æŽ¥è¯´è¯å°±è¡Œ

MCP server æ›´é€‚åˆéœ€è¦é•¿æœŸè¿è¡Œã€æœ‰å¤æ‚çŠ¶æ€ç®¡ç†çš„åœºæ™¯ã€‚è€Œ"è¯»ä¸€ä»½ PDF"è¿™ç§æ— çŠ¶æ€çš„èƒ½åŠ›ï¼Œç”¨ Skill æ˜¯æ›´è½»é‡çš„é€‰æ‹©ã€‚

åº•å±‚çš„æ–‡æ¡£è§£æžèƒ½åŠ›åˆ°åº•æ€Žä¹ˆæ ·

åº•å±‚ç”¨çš„æ˜¯ MinerUï¼Œä¸Šæµ· AI Lab å¼€æºçš„æ–‡æ¡£è§£æžå¼•æ“Žï¼ŒGitHub 56000+ Starsï¼ŒOmniDocBench è¯„æµ‹ç»¼åˆæŽ’åç¬¬ä¸€ã€‚

MinerU ä¸æ˜¯ç®€å•çš„æ–‡æœ¬æå–å·¥å
·ã€‚å®ƒæ˜¯ä¸€ä¸ªå®Œæ•´çš„ document AI å¼•æ“Žï¼Œæ ¸å¿ƒèƒ½åŠ›åŒ
æ‹¬ï¼š

ç‰ˆé¢åˆ†æžï¼šåŒæ ã€ä¸‰æ ã€æ··åˆæŽ’ç‰ˆéƒ½èƒ½æ£ç¡®è¯†åˆ«
**è¡¨æ ¼è¯†åˆ«**ï¼šå¤æ‚åµŒå¥—è¡¨æ ¼ä¿ç•™ç»“æž„ï¼Œä¸ä¼šæ‹†ç¢Ž
**å
¬å¼è¯†åˆ«**ï¼šæ•°å¦å
¬å¼è‡ªåŠ¨è½¬ LaTeX
OCRï¼šæ‰«æä»¶ã€æ‹ç
§æ–‡æ¡£ã€å›¾ç‰‡åž‹ PDF éƒ½èƒ½å¤„ç†ï¼Œæ”¯æŒ 80+ ç§è¯è¨€
å¤šæ ¼å¼è¾“å‡ºï¼šMarkdownã€Wordã€HTMLã€LaTeXã€JSON

å¦‚æžœä½ åœ¨åš RAG pipelineï¼Œè¿™æ„å‘³ç€ä½ å¯ä»¥ç›´æŽ¥åœ¨ Code Agent é‡Œå®Œæˆ"PDF â†’ ç»“æž„åŒ– Markdown â†’ å‘é‡åŒ–"çš„å‰ä¸¤æ¥ï¼Œä¸ç”¨é¢å¤–å†™ PDF è§£æžä»£ç ã€‚

å¦‚æžœä½ åœ¨é€‰ best pdf parser for RAGï¼ŒMinerU åœ¨è¡¨æ ¼è¿˜åŽŸå’Œå
¬å¼è¯†åˆ«ä¸Šçš„ç²¾åº¦ï¼Œæ˜¯å¤§å¤šæ•° Python PDF parser åšä¸åˆ°çš„ã€‚

å®žé™

ä½¿ç”¨åœºæ™¯

åœºæ™¯ä¸€ï¼šè¯»æŠ€æœ¯æ–‡æ¡£å†™ä»£ç

ä½ åœ¨ç”¨ä¸€ä¸ª APIï¼Œæ–‡æ¡£åªæœ‰ PDF ç‰ˆæœ¬ã€‚ä»¥å‰ä½ å¾—è‡ªå·±æ‰“å¼€ PDFï¼Œç¿»åˆ°å¯¹åº”ç« èŠ‚ï¼Œå†å¤åˆ¶ç²˜è´´åˆ°å¯¹è¯é‡Œã€‚çŽ°åœ¨ï¼š

> è¯»ä¸€ä¸‹ api-reference.pdfï¼Œæ‰¾åˆ°è®¤è¯ç›¸å
³çš„éƒ¨åˆ†ï¼Œç„¶åŽå¸®æˆ‘å†™ä¸€ä¸ª Python çš„è®¤è¯ client

Code Agent ä¼šè‡ªå·±è§£æž PDFï¼Œæ‰¾åˆ° auth ç« èŠ‚ï¼Œç†è§£å‚æ•°å’Œæµç¨‹ï¼Œç„¶åŽç›´æŽ¥å†™ä»£ç ã€‚

åœºæ™¯äºŒï¼šè®ºæ–‡è°ƒç ”

ä½ è¦è°ƒç ”æŸä¸ªæ–¹å‘çš„ 5 ç¯‡è®ºæ–‡ï¼š

> æŠŠ ./papers/ ä¸‹é¢ 5 ç¯‡ PDF éƒ½è¯»ä¸€éï¼Œç»™æˆ‘ä¸€ä¸ªå¯¹æ¯”è¡¨æ ¼ï¼Œåˆ—å‡ºæ¯ç¯‡çš„æ–¹æ³•ã€æ•°æ®é›†ã€ä¸»è¦ç»“æžœ

åœºæ™¯ä¸‰ï¼šå¤„ç†æ‰«ææ–‡æ¡£

æ³•åŠ¡ç»™äº†ä¸€å †æ‰«æçš„åˆåŒ PDFï¼Œä½ éœ€è¦æå–å
³é”®æ¡æ¬¾ï¼š

> è¯» contract-2024.pdfï¼Œè¿™æ˜¯æ‰«æä»¶ï¼Œå¸®æˆ‘æå–åˆåŒé‡‘é¢ã€ä»˜æ¬¾æœŸé™ã€è¿çº¦æ¡æ¬¾

MinerU çš„ OCR ä¼šå
ˆæŠŠæ‰«æä»¶è½¬æˆæ–‡å—ï¼ŒCode Agent å†ç†è§£å†
å®¹å¹¶æå–ä½ è¦çš„ä¿¡æ¯ã€‚

åœºæ™¯å››ï¼šæ–‡æ¡£æ ¼å¼è½¬æ¢

> æŠŠ report.pdf è½¬æˆ Word å‘ç»™æˆ‘
> æŠŠ paper.pdf è½¬æˆ Markdown å˜åˆ° ./output/
> æŠŠ slides.pptx è½¬æˆ Markdown

æ”¯æŒ PDFã€å›¾ç‰‡ã€DOCXã€PPTXã€Excel ç‰æ ¼å¼çš„è¾“å
¥ã€‚

å®‰è£

çœŸçš„åªæœ‰ä¸€è¡Œï¼š

npx skills add tanis90/pdf-converter-mineru

è£
å®Œä¹‹åŽï¼Œå¦‚æžœä½ æœ¬åœ°è¿˜æ²¡æœ‰ mineru-open-api CLIï¼ŒCode Agent ä¼šè‡ªåŠ¨æ£€æµ‹å¹¶å¼•å¯¼ä½ å®‰è£
â€”â€”ä¸éœ€è¦ä½ è‡ªå·±åŽ»æŸ¥æ–‡æ¡£ã€‚flash-extract æ¨¡å¼å
ç™»å½•å¯ä»¥ç›´æŽ¥ç”¨ï¼›å¦‚æžœéœ€è¦é«˜ç²¾åº¦æ¨¡å¼ï¼ˆå¤§æ–‡ä»¶ã€å¯¼å‡º Wordã€æ‰¹é‡å¤„ç†ï¼‰ï¼ŒCode Agent ä¹Ÿä¼šæç¤ºä½ åšè®¤è¯ã€‚

å¸¸è§é—®é¢˜

æ–‡ä»¶å¤§å°æœ‰é™åˆ¶å—ï¼Ÿ

flash-extract æ¨¡å¼é™åˆ¶ 10 MB / 20 é¡µã€‚extract æ¨¡å¼æ”¯æŒ 200 MB / 600 é¡µï¼Œè¦†ç›–ç»å¤§å¤šæ•°æ–‡æ¡£ã€‚

æ”¯æŒä¸æ–‡æ–‡æ¡£å—ï¼Ÿ

é»˜è®¤å°±æ”¯æŒä¸è‹±æ··æŽ’ã€‚MinerU çš„ OCR è¦†ç›– 80+ ç§è¯è¨€ï¼Œä¸æ—¥éŸ©ã€é˜¿æ‹‰ä¼¯è¯ã€æ³°è¯ç‰éƒ½æ²¡é—®é¢˜ã€‚

å’Œç›´æŽ¥ç”¨ MinerU CLI æœ‰ä»€ä¹ˆåŒºåˆ«ï¼Ÿ

ç›´æŽ¥ç”¨ CLI ä½ éœ€è¦è‡ªå·±æ•²å‘½ä»¤ã€ç®¡ç†è¾“å‡ºæ–‡ä»¶ã€å†æŠŠç»“æžœè´´ç»™ AIã€‚è£
äº† Skill ä¹‹åŽï¼ŒCode Agent è‡ªå·±å®Œæˆæ•´ä¸ªæµç¨‹â€”â€”ä½ åªéœ€è¦ç”¨è‡ªç„¶è¯è¨€æè¿°ä½ æƒ³åšä»€ä¹ˆã€‚

å’Œ MCP server æ–¹æ¡ˆæ€Žä¹ˆé€‰ï¼Ÿ

å¦‚æžœä½ å·²ç»æœ‰åœ¨è·‘çš„ MCP server ç”Ÿæ€ï¼Œå¯ä»¥ç»§ç»ç”¨ã€‚å¦‚æžœä½ åªæ˜¯æƒ³è®© Code Agent èƒ½è¯» PDFï¼ŒSkill æ˜¯æ›´è½»é‡çš„æ–¹æ¡ˆâ€”â€”ä¸€è¡Œå‘½ä»¤æžå®šï¼Œä¸éœ€è¦é¢å¤–çš„è¿›ç¨‹å’Œé
ç½®ã€‚

æ€»ç»“

npx skills add tanis90/pdf-converter-mineru

æ— è®ºä½ ç”¨çš„æ˜¯ Claude Codeã€Cursorã€Kimi Code è¿˜æ˜¯ Clineï¼ŒåŒä¸€ä¸ª Skillï¼ŒåŒä¸€è¡Œå‘½ä»¤ã€‚

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

GLM全自动开发企业知识库--对接第三方OA数据

2048 AI社区

彻底搞懂Agent记忆压缩（附腾讯面经），看这一篇就够了！

2048 AI社区

论文重复率30%时，aibiye的AI改写功能能提供五项指导。利用语境分析、术语替换等方法，高效优化文本，实现快速过审，节省人工修改时间。

2048 AI社区

所有评论(0)

查看更多评论

lingxie2512

@lingxie2512

已为社区贡献2条内容

һ���������� Code Agent ����ĵ�

lingxie2512

è¿™è¡Œå‘½ä»¤åšäº†ä»€ä¹ˆ

å“ªäº› Code Agent æ”¯æŒ

å®ƒèƒ½åšä»€ä¹ˆ

ä¸ºä»€ä¹ˆä¸ç”¨ MCP server

åº•å±‚çš„æ–‡æ¡£è§£æžèƒ½åŠ›åˆ°åº•æ€Žä¹ˆæ ·

å®žé™

åœºæ™¯ä¸€ï¼šè¯»æŠ€æœ¯æ–‡æ¡£å†™ä»£ç 

åœºæ™¯äºŒï¼šè®ºæ–‡è°ƒç ”

åœºæ™¯ä¸‰ï¼šå¤„ç†æ‰«ææ–‡æ¡£

åœºæ™¯å››ï¼šæ–‡æ¡£æ ¼å¼è½¬æ¢

å®‰è£

å¸¸è§é—®é¢˜

æ–‡ä»¶å¤§å°æœ‰é™åˆ¶å—ï¼Ÿ

æ”¯æŒä¸­æ–‡æ–‡æ¡£å—ï¼Ÿ

å’Œç›´æŽ¥ç”¨ MinerU CLI æœ‰ä»€ä¹ˆåŒºåˆ«ï¼Ÿ

å’Œ MCP server æ–¹æ¡ˆæ€Žä¹ˆé€‰ï¼Ÿ

æ€»ç»“

所有评论(0)

lingxie2512

һ���� Code Agent ��ĵ�

è¿™è¡Œå‘½ä»¤åšäº†ä»€ä¹ˆ

å“ªäº› Code Agent æ”¯æŒ

å®ƒèƒ½åšä»€ä¹ˆ

ä¸ºä»€ä¹ˆä¸ç”¨ MCP server

åº•å±‚çš„æ–‡æ¡£è§£æžèƒ½åŠ›åˆ°åº•æ€Žä¹ˆæ ·

åœºæ™¯ä¸€ï¼šè¯»æŠ€æœ¯æ–‡æ¡£å†™ä»£ç

åœºæ™¯ä¸‰ï¼šå¤„ç†æ‰«ææ–‡æ¡£

åœºæ™¯å››ï¼šæ–‡æ¡£æ ¼å¼è½¬æ¢

å¸¸è§é—®é¢˜

æ–‡ä»¶å¤§å°æœ‰é™åˆ¶å—ï¼Ÿ

æ”¯æŒä¸æ–‡æ–‡æ¡£å—ï¼Ÿ