大家好,我是顾北,专注于 AI 应用探索与副业实践,长期关注 AI 技术趋势、实用工具以及Github线索探索

Github 开源项目第一期推荐。2025.9.15-2025.9.21

本期分享我觉得对大家有用的七个开源项目(MarkItDown、opencode、CopilotKit、opcode、deep-chat、DeepMCPAgent、ai-coding-playbook)。老样子,我将以下面几个方面来介绍本周的开源项目,包含保姆级教程。

1.它是什么

2.有哪些功能

3.安装教程

一、MarkItDown(79.5k✨)

它是什么?

MarkItDown微软开源文档转换工具,用于将各种常见格式的文档转换为 Markdown 格式,包括 PDF、PPT、Word、Excel、图片、音频、HTML、JSON等,甚至还能处理 ZIP 压缩包内的多个文件、YouTube 视频转录文本以及电子书 EPub 等。

开源地址:https://github.com/microsoft/markitdown

有哪些功能?

  • 支持多种文件格式转换:PDF、PPT、Word、Excel、图片、音频、HTML、文本格式(CSV、JSON、XML)、ZIP、EPUB、YouTube视频等。

  • 保留重要文档结构和元素,生成结构化的Markdown。

  • 支持使用微软Azure文档智能进行高级文档转换。

  • 支持第三方插件扩展。

  • 支持利用大型语言模型对图片等进行自动描述生成。

  • 命令行和Python API两种使用方式。

  • 提供Docker镜像方便容器化使用。

安装教程

  • Python版本必须是3.10版本及以上

  • 官方建议使用虚拟环境以避免依赖冲突

  • 通过pip安装全部依赖

pip install 'markitdown[all]'
  • 也可以单独安装特定功能依赖,例如:
pip install 'markitdown[pdf, docx, pptx]'
  • 当然也支持从源码安装:
git clone git@github.com:microsoft/markitdown.git
cd markitdown
pip install -e 'packages/markitdown[all]'

使用示例

命令行形式:

markitdown path-to-file.pdf -o document.md

Python代码形式:

from markitdown import MarkItDown
md = MarkItDown()
result = md.convert("test.xlsx")
print(result.text_content)

二、opencode(24.5k✨)

它是什么?

opencode是一款开源的 AI 编程助手,采用CLI的形式,类似于Claude Code CLI、Code Buddy CLI、Codex CLI等,以命令行的形式使用。

开源地址:https://github.com/sst/opencode

官方描述它为AI编码代理,为终端打造。它和Claude Code 这些终端工具的区别在于它可以支持调用OpenAI、Anthropic、Google 或本地模型,对于 Windows 用户来说暂时需要 WSL。

有哪些功能?

  • TUI 交互:终端界面,Vim 式操作,生成代码、调试 bug。

  • 模型自由:支持 Claude、OpenAI、Ollama,可以随便换。

  • 远程控制:客户端/服务器架构,未来可用手机驱动。

  • 开源透明:MIT 许可,代码随便改。

  • 跨平台:macOS/Linux 流畅,Windows 用 WSL(修复中)。

安装教程

  1. 准备:装 Bun、Go 1.24.x,macOS/Linux 最佳。

  2. 安装curl -fsSL https://opencode.ai/install | bash 或 npm i -g opencode-ai@latest

  3. 配置:设置 API 密钥(opencode.ai 文档有)。

  4. 启动:跑 opencode,TUI 弹出,输入任务。

  5. 开发

git clone https://github.com/sst/opencode.git
cd opencode
bun install
bun run packages/opencode/src/index.ts

排查:如果在 Windows 中卡,请检查是否用了WSL。如果API调用失败,检查密钥是否合适。

三、CopilotKit(23.6k✨)

它是什么?

CopilotKit 其实它是一个开源工具包,简单点来说,它可以帮助你在自己的应用中快速加入 AI 助手、聊天机器人或者只能代理的功能。说白了,你可以想象一下,CopilotKit 的核心目标就是在你的应用里面可以构建一个类似于 Siri 或 Chat GPT 一样的智能助手,可以和你进行互动、回答你的问题等。

开源地址:https://github.com/CopilotKit/CopilotKit?tab=readme-ov-file

有哪些功能?

  • 快速嵌入:几行代码加个 AI 聊天框,CLI 一键初始化。

  • 灵活 UI:提供现成组件(像弹出窗口)或无头 API,随你定制。

  • 框架兼容:React、Next.js、AGUI 都能用,适配性强。

  • 安全透明:有防注入保护,代码开源,想改啥都行。

  • 高级玩法:支持 LangGraph 集成,动态生成 UI,比如显示表格或天气。

安装教程

  1. 准备:确保 Node.js 装好,项目里能跑 npm。

  2. 安装:终端输入 npx copilotkit@latest init,自动配置环境。咖啡杯放一边,盯着终端几秒就搞定。

  3. 加组件:在 React 项目里加:

import { CopilotPopup } from 'copilotkit';
<CopilotPopup instructions="Help users with tasks." labels={{ title: "AI Helper", initial: "Need a hand?" }} />
  1. 连后端:用 useCopilotAction 定义动作,比如:
useCopilotAction({
  name: "addToList",
  description: "Add items to a list",
  parameters: [{ name: "items", type: "string[]" }],
  handler: ({ items }) => updateList(items),
});
  1. 部署:跑 npm run build,上线!文档(CopilotKit GitHub)有更多例子。

  2. 问题排查:卡住了?加 --verbose 看日志,或上 Discord 问社区。

四、opcode(16.9k✨)

它是什么?

opcode 它是一款开源桌面应用,专门为 Anthropic 的 Claude Code 打造,你可以理解为给命令行工具装了一个直观的GUI(图形化界面)。想象你在用 Claude Code 写代码的时候,原本需要敲一堆命令,现在有了 opcode,就像打开一个控制台,项目、会话、代理等,一目了然,点几下就可以搞定复杂操作了。它基于 Tauri 2 构建,运行轻快,数据全存在本地,安全透明。

开源地址:https://github.com/winfunc/opcode

有哪些功能?

  • 项目管理:浏览 Claude 项目,查看历史会话,像 Git 一样回溯检查点。

  • AI 代理:创建自定义代理,跑后台任务,比如自动生成代码。还能设权限,限制文件访问。

  • 成本监控:仪表盘显示 API 花销,图表清楚,数据可导出。

  • Markdown 编辑:内置编辑器改 CLAUDE.md,实时预览,语法高亮。

  • MCP 支持:管理服务器,导入 Claude Desktop 配置。

安装教程

进入对应的GitHub仓库里面,点击右上方的 opcode.sh,进入官网

点击 Download opcode 进行下载即可

需要注意的不支持 Windows 系统,支持macOS 11+ 或 Linux

五、deep-chat(3k✨)

它是什么?

deep-chat 是一个开源的 AI 聊天组件,专为网站设计,能用一行代码就嵌入到你的页面里。想想看,假如说你想给博客或电商系统加个智能客户聊天框,用户问问题,它可以直接连 ChatGPT 或者你自己的后端服务进行回应,而且还能发文件、拍照片、录音,甚至语音对话。

开源地址:https://github.com/OvidijusParsiunas/deep-chat

有哪些功能?

  • 可以连接到任何 API

  • 可以发送/接收文件、通过网络摄像头拍摄照片,通过麦克风录制音频等

  • 支持 MarkDown 和自定义元素,以帮助构建文本和呈现代码

  • 可以直接从浏览器连接到流行的 AI API,例如 OpenAI、HuggingFace、Cohere

  • 支持所有主要的 UI 框架/库

  • 可以在浏览器上托管模型,并且一切都是可定制的!

安装教程

使用 npm install 进行安装

npm install deep-chat

如果你使用 React,则需要将安装方式更改为以下内容:

npm install deep-chat-react

如何使用(简单示例)

只需将以下内容添加到标记中:

<deep-chat></deep-chat>

如何连接服务器

连接到服务很简单,需要做的就是使用 request 属性定义其 API 详细信息:

<deep-chat request='{"url":"https://service.com/chat"}'/>

六、DeepMCPAgent(599✨)

它是什么?

DeepMCPAgent 是一个用户快速搭建「智能代理程序」的工具包。你可以理解成一个能自动完成任务的小助手。例如说你让它算个复杂的数学题、查个数据,它会自己想办法调用工具(比如计算器、数据接口)来解决,最后给你结果。

开源地址:https://github.com/cryxnet/deepmcpagent

有哪些功能?

  • 动态工具:从 MCP 服务器拉工具(JSON-Schema 转 LangChain BaseTool)。

  • 模型自由:支持 OpenAI、Claude、Ollama 等,随你挑。

  • 远程调用:连 HTTP/SSE 服务器,支持认证,跑搜索或 GitHub 操作。

  • CLI 交互:列工具或跑聊天,简单命令搞定。

  • 生产级:类型检查、测试完备,DeepAgents 增强循环。

安装教程

使用 pip 进行安装

pip install "deepmcpagent[deep]"

推荐安装DeepAgents 的 DeepMCPAgent,以获得最佳代理循环

# install with deepagents + dev tooling
pip install "deepmcpagent[deep,dev]"

如果你使用的是 zsh,记得引用附加内容:

pip install "deepmcpagent[deep,dev]"

快速开始

启动示例 MCP 服务器 (HTTP)

python examples/servers/math_server.py

MCP 端点提供服务的地址:http://127.0.0.1:8000/mcp

运行示例代理(带有精美的控制台输出)

python examples/use_agent.py

你将会看到下图内容,则表示安装成功

七、ai-coding-playbook

它是什么?

ai-coding-playbook收录了一些精选的 AI 编码框架、工作流程、模式、工具等列表,可增强 AI 开发体验。

打开地址里面就一个md文件,这个文件中收录了许多编码规范。

开源地址:https://github.com/AnswerZhao/ai-coding-playbook

好了,今天的分享就到这里结束了,如果大家觉得有用,希望一键三连,制作不易,谢谢大家!

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐