XivMind开源项目操作手册
XivMind 是一款开源的现代化 arXiv 论文管理应用,旨在帮助研究人员、学生和学术爱好者更高效地发现、管理和分析学术论文。📚论文浏览:卡片式布局,支持分类和日期筛选🔖📥下载管理:批量下载,实时进度跟踪🕸️知识图谱:可视化论文关系,发现研究趋势🤖AI 助手:智能问答、语义搜索、技能执行🤖SubAgents:AI 代理执行复杂研究任务📊数据管理:按年历、月历组织数据,灵活管理论文
XivMind开源项目操作手册
目录
1. 产品简介
1.1 什么是 XivMind?
XivMind 是一款开源的现代化 arXiv 论文管理应用,旨在帮助研究人员、学生和学术爱好者更高效地发现、管理和分析学术论文。项目地址:https://github.com/uwjia/XivMind
核心特性:
- 📚 论文浏览:卡片式布局,支持分类和日期筛选
- 🔖 收藏管理:一键收藏,随时回顾
- 📥 下载管理:批量下载,实时进度跟踪
- 🕸️ 知识图谱:可视化论文关系,发现研究趋势
- 🤖 AI 助手:智能问答、语义搜索、技能执行
- 🤖 SubAgents:AI 代理执行复杂研究任务
- 📊 数据管理:按年历、月历组织数据,灵活管理论文存储
- 🌙 主题切换:深色/浅色模式自由切换
1.2 技术架构
┌─────────────────────────────────────────────────┐
│ 前端 (Vue 3) │
│ ┌─────────┐ ┌─────────┐ ┌─────────┐ ┌─────────┐ │
│ │ 首页 │ │ 收藏页 │ │ AI助手 │ │SubAgents │ ... │
│ └─────────┘ └─────────┘ └─────────┘ └─────────┘ │
└─────────────────────────────────────────────────┘
│
▼
┌─────────────────────────────────────────────────┐
│ 后端 (FastAPI) │
│ ┌─────────┐ ┌─────────┐ ┌─────────┐ ┌─────────┐ │
│ │ arXiv │ │ 书签 │ │ 下载 │ │ LLM │ ... │
│ │ API │ │ 服务 │ │ 服务 │ │ 服务 │ │
│ └─────────┘ └─────────┘ └─────────┘ │
└─────────────────────────────────────────────────┘
│
▼
┌─────────────────────────────────────────────────┐
│ 数据存储层 │
│ ┌─────────────────┐ ┌─────────────────┐ │
│ │ SQLite (开发) │ │ Milvus (生产) │ │
│ └─────────────────┘ └─────────────────┘ │
└─────────────────────────────────────────────────┘
2. 快速开始
2.1 环境要求
| 组件 | 最低版本 | 说明 |
|---|---|---|
| Node.js | 18+ | 前端运行环境 |
| Python | 3.10+ | 后端运行环境 |
| Docker | 最新版 | Milvus 模式需要(可选) |
2.2 安装步骤
步骤一:获取代码
git clone https://github.com/uwjia/XivMind.git
cd XivMind
步骤二:配置后端
cd backend
cp .env.example .env
编辑 .env 文件:
# 数据库配置
DATABASE_TYPE=sqlite # 开发模式使用 SQLite
SQLITE_DB_PATH=./data/xivmind.db
DOWNLOAD_DIR=./downloads
# LLM 配置(可选,也可在界面中配置)
LLM_PROVIDER=openai
LLM_MODEL=gpt-4o-mini
OPENAI_API_KEY=your-api-key
步骤三:启动后端
Windows:
start.bat install # 首次运行,安装依赖
start.bat dev # 开发模式启动
Linux/Mac:
chmod +x start.sh
./start.sh install # 首次运行,安装依赖
./start.sh dev # 开发模式启动
备注:
需要用GPU加速时使用项目根目录下的 requirements-gpu.txt 安装依赖,强烈建议安装,因为在生成嵌入向量时GPU运算相对CPU有很大的提升。
步骤四:启动前端
cd ..
npm install
npm run dev
步骤五:访问应用
打开浏览器访问:http://localhost:5173

3. 界面导航
3.1 侧边栏导航
应用左侧设有固定导航栏,包含以下入口:
| 图标 | 名称 | 功能描述 |
|---|---|---|
| 🏠 | 首页 | 浏览最新 arXiv 论文 |
| 🔖 | 收藏 | 管理收藏的论文 |
| 📥 | 下载 | 查看下载任务状态 |
| 🤖 | AI 助手 | 智能问答与技能执行 |
| 🎯 | SubAgents | AI 代理任务管理 |
| 📊 | 数据管理 | 论文数据管理 |
| ⚙️ | 设置 | 系统配置 |
单击左上角的按钮可以收缩或展开
3.2 顶部工具栏
顶部工具栏根据当前页面动态显示相关操作按钮:
- 日期选择器:选择要查看的论文日期
- 分类选择器:按学科分类过滤论文
- 类别统计与过滤:按学科分类统计论文(按天或分页统计)
- 视图切换:卡片视图 / 简单视图
- 知识图谱视图:显示某一天论文的知识图谱
- 刷新按钮:重新获取论文数据

4. 功能详解
4.1 首页
首页是论文浏览的主界面,展示指定日期的 arXiv 论文列表。
4.1.1 日期选择
点击顶部日期按钮,弹出日期选择器:

- 选择日期后双击或者单击“Confirm”按钮会自动加载该日论文
- 支持快速跳转到今天、昨天、前7天
- 支持选择从1991年-2026年的任何一天
- 绿色勾勾表示该天的论文已经存储
- 紫色波浪线表示该天的论文已经生成嵌入向量
4.1.2 分类筛选
点击分类按钮,弹出分类选择面板:

- 选择分类后自动加载该日论文
- 左边文本是学科的全称,右边文本是学科的简称
支持的学科分类:
- cs.AI (人工智能)
- cs.CL (计算与语言)
- cs.CV (计算机视觉)
- cs.LG (机器学习)
- cs.RO (机器人)
- … 更多分类
4.1.3 论文卡片
每篇论文以卡片形式展示:

卡片信息:
- 论文标题
- 作者列表
- 摘要预览
- 作者备注(页数、会议等)(如有)
- 期刊引用(如有)
- 论文id、学科分类标签、发布日期、更新日期(如有)
卡片操作:
- doi 链接:打开论文的唯一标识地址(如有)
- arxiv 链接:打开arxiv链接地址
- pdf 链接:打开arxiv的PDF论文下载地址
- 📥 下载:下载论文 PDF(下载完成后可以单击此处直接打开论文)
- 🔖 收藏:将论文添加到收藏夹
4.1.4 视图切换
首页支持两种视图模式:
- 详细卡片:显示完整摘要
- 简洁卡片:仅显示标题和类别

4.2 学科过滤
在工具条单击“Show Categories”按钮之后,在页面右侧显示出一个学科简写的侧边栏,学科过滤可以将每天的论文按照类别进行统计与过滤。
- 单击CS:显示该日期全部的论文
- 单击各个学科的简写:论文列表只会显示该日期和该学科的论文
- 每个学科旁边的数字统计了该天发表该学科的论文数量
4.3 知识图谱
知识图谱可视化展示论文之间的语义关系,帮助发现研究趋势和关联。知识图谱依赖于论文的嵌入向量数据,只在数据库为Milvus生产模式时启用,而在数据库为SQLite开发模式时不可用。
4.3.1 图谱界面

界面组成:
- 节点:代表一篇论文
- 边:表示论文间的语义相似度
- 颜色:不同颜色代表不同学科分类
4.3.2 交互操作
| 操作 | 方式 | 效果 |
|---|---|---|
| 查看详情 | 点击节点 | 显示论文基本信息 |
| 拖拽节点 | 鼠标拖拽 | 调整节点位置 |
| 缩放 | 滚轮 | 放大/缩小图谱 |
| 平移 | 拖拽空白区域 | 移动视图 |
4.3.3 布局算法
支持三种布局模式:
- 力导向布局:节点间相互排斥,相似节点靠近
- 圆形布局:节点按相似度排列成圆形
- 层级布局:按层级结构排列节点
4.3.4 相似度过滤
调节相似度阈值滑块,过滤低相似度的边:
- 阈值越高,显示的连接越少
- 阈值越低,显示的连接越多
4.4 论文详情
点击论文卡片的标题栏,进入论文详情页。
4.4.1 详情界面

展示信息:
- 论文标题
- 作者列表(带机构信息)
- 完整摘要
- 期刊引用(如有)
- 学科分类
- 发布日期
- arXiv 链接
- PDF 链接
- DOI 链接(如有)
4.4.2 操作按钮
- 收藏/取消收藏:管理收藏状态
- 下载 PDF:启动下载任务
- 查看原文:跳转到 arXiv 原页面
- 相关论文:查看相似论文推荐
4.5 收藏管理
收藏页面管理所有已收藏的论文。
4.5.1 收藏列表

功能特性:
- 按收藏时间排序
- 支持关键词搜索
- 直接下载,显示下载状态
- 可以直接取消收藏
4.5.2 批量操作
- 批量下载:选中多篇论文批量下载
- 批量删除:取消收藏选中的论文
4.6 下载管理
下载页面展示所有下载任务的状态。
4.6.1 任务列表

任务状态:
- ⏳ 等待中:任务排队等待
- 🔄 下载中:正在下载,显示进度
- ✅ 已完成:下载成功
- ❌ 失败:下载失败,显示错误信息
4.6.2 任务操作
| 操作 | 说明 |
|---|---|
| 打开文件 | 打开已下载的 PDF |
| 重试 | 重新下载失败的任务 |
| 取消 | 取消正在进行的任务 |
| 删除 | 删除任务记录 |
4.7 AI 助手
AI 助手提供智能问答、语义搜索和技能执行功能。
4.7.1 模式切换
AI 助手支持三种模式:

搜索模式:
- 在论文库中进行语义搜索
- 输入自然语言查询,返回相关论文
问答模式:
- 基于论文内容回答问题
- 支持多轮对话
技能模式:
- 执行预定义的技能任务
- 支持自定义技能
4.7.2 搜索模式

使用方法:
- 选择"搜索"模式
- 输入搜索关键词或问题
- 系统返回语义相关的论文列表
- 在返回结果的底部有复制按钮、重新生成按钮
示例查询:
- “transformer attention mechanism”
- “图像分割最新进展”
- “reinforcement learning for robotics”

4.7.3 问答模式

使用方法:
- 选择"问答"模式
- 输入问题
- 系统基于论文库内容生成回答
示例问题:
- “这篇论文的主要贡献是什么?”
- “总结一下这篇论文的方法论”
- “这篇论文与之前工作的区别是什么?”
4.7.4 技能模式

内置技能:
- 论文摘要:生成论文摘要
- 论文翻译:翻译论文内容
- 引用生成:生成引用格式
- 相关论文:查找相似论文
使用方法:
- 选择"技能"模式
- 选择要执行的技能
- 输入论文 ID 或从收藏中选择
- 点击执行
4.8 技能系统
技能系统允许用户创建和执行自定义任务。
4.8.1 技能管理页面

功能:
- 查看所有可用技能
- 执行技能任务
- 创建自定义技能
4.8.2 内置技能
| 技能 | 功能 | 输入 |
|---|---|---|
| 论文摘要 | 生成论文摘要 | 论文 ID |
| 论文翻译 | 翻译论文内容 | 论文 ID、目标语言 |
| 引用生成 | 生成引用格式 | 论文 ID、引用格式 |
| 相关论文 | 查找相似论文 | 论文 ID |
4.8.3 创建自定义技能
在 backend/skills/ 目录下创建 SKILL.md 文件:
---
name: my-custom-skill
description: 我的自定义技能
icon: file-text
category: analysis
requires_paper: true
---
# 我的自定义技能
请分析以下论文的 {paper.title}:
{paper.abstract}
请从以下几个方面进行分析:
1. 研究背景
2. 主要贡献
3. 方法论
4. 实验结果
4.9 SubAgents
SubAgents 是 AI 代理系统,可以执行复杂的研究任务。
4.9.1 SubAgents 页面

4.9.2 内置代理
研究助手 (Research Assistant):
- 文献搜索和分析
- 获取论文详情
- 执行技能分析
分析助手 (Analysis Assistant):
- 深度论文分析
- 方法论评估
- 趋势发现
写作助手 (Writing Assistant):
- 文献综述写作
- 摘要生成
- 翻译润色
4.9.3 执行任务

操作步骤:
- 选择一个代理
- 输入任务指令
- 可选:添加论文 ID
- 点击"执行"
示例指令:
- “搜索关于 transformer 的最新论文”
- “分析这篇论文的方法论”
- “写一篇关于机器学习的文献综述”
4.9.4 查看结果

结果展示:
- 任务状态
- 执行轮次
- 输出内容
- 消息历史
4.9.5 创建自定义代理
在 backend/subagents/ 目录下创建 AGENT.md 文件:
---
id: my-agent
name: 我的代理
description: 自定义代理描述
icon: search
skills:
- summary
tools:
- search_papers
- get_paper_details
max_turns: 15
temperature: 0.3
---
# 我的代理
你是一个专业的助手,专门...
## 工具调用格式
[TOOL: tool_name({"arg1": "value1"})]
## 可用工具
- search_papers: 搜索论文
- get_paper_details: 获取论文详情
4.10 数据管理
数据管理页面用于管理论文数据存储。
4.10.1 年度视图

功能:
- 查看全年数据存储情况
- 按月统计论文数量
- 快速导航到特定月份
- 可以选择从1991年-2026年期间的任何一年
4.10.2 月度视图

功能:
- 查看每日论文数量
- 获取特定日期的论文
- 对特定日期的论文生成嵌入向量(应用于智能检索与知识图谱)
- 清除缓存数据
- 绿色勾勾表示该天论文已经存储
- 紫色波浪线表示该天论文已经生成嵌入向量
4.10.3 数据操作
| 操作 | 说明 |
|---|---|
| 获取论文 | 从 arXiv 获取指定日期的论文 |
| 嵌入向量 | 对指定日期的论文生成嵌入向量 |
| 清除缓存 | 删除指定日期的缓存数据 |
| 查看论文 | 跳转到该日期的论文列表 |
4.11 系统设置
设置页面用于配置系统参数。
4.11.1 主题设置

- 浅色模式:适合白天使用
- 深色模式:适合夜间使用
4.11.2 LLM 配置

支持的 LLM 提供商:
| 提供商 | 模型示例 | 说明 |
|---|---|---|
| OpenAI | gpt-4o-mini | 需要 API Key |
| Anthropic | claude-4.6 | 需要 API Key |
| GLM (智谱) | glm-5 | 需要API Key |
| Ollama | llama3 | 本地运行 |
配置步骤:
- 选择 LLM 提供商
- 选择模型
- 输入 API Key(如需要)
- 点击"测试连接"验证配置
4.11.3 Ollama 本地配置
安装 Ollama:
# macOS/Linux
curl -fsSL https://ollama.ai/install.sh | sh
# Windows
# 从 https://ollama.ai 下载安装包
下载模型:
ollama pull llama3
ollama pull mistral
ollama pull qwen2
启动 Ollama:
ollama serve
5. 高级配置
5.1 环境变量
完整的 .env 配置:
# 数据库SQLite配置(开发模式)
DATABASE_TYPE=sqlite
SQLITE_DB_PATH=./data/xivmind.db
DOWNLOAD_DIR=./downloads
# Milvus 配置(生产模式)
MILVUS_HOST=localhost
MILVUS_PORT=19530
DATABASE_NAME=xivmind
# LLM 配置
LLM_PROVIDER=openai
LLM_MODEL=gpt-4o-mini
OPENAI_API_KEY=sk-xxx
# Anthropic 配置
# LLM_PROVIDER=anthropic
# LLM_MODEL=claude-4.6
# ANTHROPIC_API_KEY=sk-xxx
# GLM 配置
# LLM_PROVIDER=glm
# LLM_MODEL=glm-5
# GLM_API_KEY=xxx
# GLM_BASE_URL=https://open.bigmodel.cn/api/paas/v4
# Ollama 配置
# LLM_PROVIDER=ollama
# OLLAMA_BASE_URL=http://localhost:11434
# OLLAMA_MODEL=llama3
5.2 Milvus 生产部署
启动 Milvus:
cd backend
# 标准模式(推荐生产)
./milvus.sh start
# 精简模式(开发测试)
./milvus.sh start lite
服务端口:
- Milvus: 19530
- Attu (GUI): 3000
- MinIO: 9000/9001
- etcd: 2379
5.3 Docker 部署
# 构建镜像
docker build -t xivmind-backend ./backend
docker build -t xivmind-frontend ./frontend
# 运行容器
docker run -d -p 8000:8000 xivmind-backend
docker run -d -p 5173:5173 xivmind-frontend
6. 常见问题
6.1 安装问题
Q: npm install 失败?
A: 尝试清除缓存后重新安装:
npm cache clean --force
rm -rf node_modules
npm install
Q: Python 依赖安装失败?
A: 确保使用 Python 3.10+,并安装构建工具:
pip install --upgrade pip
pip install -r requirements.txt
6.2 运行问题
Q: 后端启动失败?
A: 检查以下项目:
1. 端口 8000 是否被占用
2. .env 文件是否正确配置
3. 数据库目录是否有写入权限
Q: 前端无法连接后端?
A: 确认:
1. 后端服务正在运行
2. 后端端口配置正确(默认 8000)
3. 没有防火墙阻止连接
6.3 AI 功能问题
Q: AI 助手无响应?
A: 检查 LLM 配置:
1. API Key 是否正确
2. 模型名称是否正确
3. 网络是否可以访问 API
Q: Ollama 连接失败?
A: 确认:
1. Ollama 服务正在运行 (ollama serve)
2. 模型已下载 (ollama list)
3. 端口 11434 可访问
6.4 下载问题
Q: 论文下载失败?
A: 可能原因:
1. 网络连接问题
2. arXiv 服务暂时不可用
3. 下载目录没有写入权限
解决方法:
1. 检查网络连接
2. 稍后重试
3. 检查 DOWNLOAD_DIR 配置
6.5 数据问题
Q: 论文数据为空?
A: 尝试:
1. 点击"刷新"按钮重新获取
2. 检查日期是否有论文发布
3. 在数据管理页面获取指定日期数据
附录
A. API 端点
完整 API 文档请访问:
- Swagger UI: http://localhost:8000/docs
- ReDoc: http://localhost:8000/redoc
B. 技术支持
- GitHub Issues: https://github.com/uwjia/XivMind
- Document: https://github.com/uwjia/XivMind
文档版本:0.2.0
最后更新:2026-02-26
更多推荐



所有评论(0)