XivMind开源项目操作手册

目录

  1. 产品简介
  2. 快速开始
  3. 界面导航
  4. 功能详解
  5. 高级配置
  6. 常见问题

1. 产品简介

1.1 什么是 XivMind?

XivMind 是一款开源的现代化 arXiv 论文管理应用,旨在帮助研究人员、学生和学术爱好者更高效地发现、管理和分析学术论文。项目地址:https://github.com/uwjia/XivMind

核心特性:

  • 📚 论文浏览:卡片式布局,支持分类和日期筛选
  • 🔖 收藏管理:一键收藏,随时回顾
  • 📥 下载管理:批量下载,实时进度跟踪
  • 🕸️ 知识图谱:可视化论文关系,发现研究趋势
  • 🤖 AI 助手:智能问答、语义搜索、技能执行
  • 🤖 SubAgents:AI 代理执行复杂研究任务
  • 📊 数据管理:按年历、月历组织数据,灵活管理论文存储
  • 🌙 主题切换:深色/浅色模式自由切换

1.2 技术架构

┌─────────────────────────────────────────────────┐
│                      前端 (Vue 3)                        │
│  ┌─────────┐ ┌─────────┐ ┌─────────┐ ┌─────────┐       │
│  │  首页    │ │ 收藏页  │  │ AI助手  │ │SubAgents │ ...   │
│  └─────────┘ └─────────┘ └─────────┘ └─────────┘       │
└─────────────────────────────────────────────────┘
                           │
                           ▼
┌─────────────────────────────────────────────────┐
│                   后端 (FastAPI)                         │
│  ┌─────────┐ ┌─────────┐ ┌─────────┐ ┌─────────┐       │
│  │ arXiv   │ │ 书签    │ │ 下载    │ │ LLM     │ ...   │
│  │ API     │ │ 服务    │ │ 服务    │ │ 服务    │       │
│  └─────────┘ └─────────┘ └─────────┘       │
└─────────────────────────────────────────────────┘
                           │
                           ▼
┌─────────────────────────────────────────────────┐
│                   数据存储层                             │
│  ┌─────────────────┐    ┌─────────────────┐            │
│  │ SQLite (开发)   │    │ Milvus (生产)   │            │
│  └─────────────────┘    └─────────────────┘            │
└─────────────────────────────────────────────────┘

2. 快速开始

2.1 环境要求

组件 最低版本 说明
Node.js 18+ 前端运行环境
Python 3.10+ 后端运行环境
Docker 最新版 Milvus 模式需要(可选)

2.2 安装步骤

步骤一:获取代码
git clone https://github.com/uwjia/XivMind.git
cd XivMind
步骤二:配置后端
cd backend
cp .env.example .env

编辑 .env 文件:

# 数据库配置
DATABASE_TYPE=sqlite          # 开发模式使用 SQLite
SQLITE_DB_PATH=./data/xivmind.db
DOWNLOAD_DIR=./downloads

# LLM 配置(可选,也可在界面中配置)
LLM_PROVIDER=openai
LLM_MODEL=gpt-4o-mini
OPENAI_API_KEY=your-api-key
步骤三:启动后端

Windows:

start.bat install    # 首次运行,安装依赖
start.bat dev        # 开发模式启动

Linux/Mac:

chmod +x start.sh
./start.sh install   # 首次运行,安装依赖
./start.sh dev       # 开发模式启动

备注:
需要用GPU加速时使用项目根目录下的 requirements-gpu.txt 安装依赖,强烈建议安装,因为在生成嵌入向量时GPU运算相对CPU有很大的提升。

步骤四:启动前端
cd ..
npm install
npm run dev
步骤五:访问应用

打开浏览器访问:http://localhost:5173

首页


3. 界面导航

3.1 侧边栏导航

应用左侧设有固定导航栏,包含以下入口:

图标 名称 功能描述
🏠 首页 浏览最新 arXiv 论文
🔖 收藏 管理收藏的论文
📥 下载 查看下载任务状态
🤖 AI 助手 智能问答与技能执行
🎯 SubAgents AI 代理任务管理
📊 数据管理 论文数据管理
⚙️ 设置 系统配置

单击左上角的按钮可以收缩或展开
侧边栏

3.2 顶部工具栏

顶部工具栏根据当前页面动态显示相关操作按钮:

  • 日期选择器:选择要查看的论文日期
  • 分类选择器:按学科分类过滤论文
  • 类别统计与过滤:按学科分类统计论文(按天或分页统计)
  • 视图切换:卡片视图 / 简单视图
  • 知识图谱视图:显示某一天论文的知识图谱
  • 刷新按钮:重新获取论文数据

顶部工具栏


4. 功能详解

4.1 首页

首页是论文浏览的主界面,展示指定日期的 arXiv 论文列表。

4.1.1 日期选择

点击顶部日期按钮,弹出日期选择器:

在这里插入图片描述

  • 选择日期后双击或者单击“Confirm”按钮会自动加载该日论文
  • 支持快速跳转到今天、昨天、前7天
  • 支持选择从1991年-2026年的任何一天
  • 绿色勾勾表示该天的论文已经存储
  • 紫色波浪线表示该天的论文已经生成嵌入向量
4.1.2 分类筛选

点击分类按钮,弹出分类选择面板:

在这里插入图片描述

  • 选择分类后自动加载该日论文
  • 左边文本是学科的全称,右边文本是学科的简称

支持的学科分类:

  • cs.AI (人工智能)
  • cs.CL (计算与语言)
  • cs.CV (计算机视觉)
  • cs.LG (机器学习)
  • cs.RO (机器人)
  • … 更多分类
4.1.3 论文卡片

每篇论文以卡片形式展示:

在这里插入图片描述

卡片信息:

  • 论文标题
  • 作者列表
  • 摘要预览
  • 作者备注(页数、会议等)(如有)
  • 期刊引用(如有)
  • 论文id、学科分类标签、发布日期、更新日期(如有)

卡片操作:

  • doi 链接:打开论文的唯一标识地址(如有)
  • arxiv 链接:打开arxiv链接地址
  • pdf 链接:打开arxiv的PDF论文下载地址
  • 📥 下载:下载论文 PDF(下载完成后可以单击此处直接打开论文)
  • 🔖 收藏:将论文添加到收藏夹
4.1.4 视图切换

首页支持两种视图模式:

  • 详细卡片:显示完整摘要
  • 简洁卡片:仅显示标题和类别
    在这里插入图片描述

4.2 学科过滤

在工具条单击“Show Categories”按钮之后,在页面右侧显示出一个学科简写的侧边栏,学科过滤可以将每天的论文按照类别进行统计与过滤。
在这里插入图片描述

  • 单击CS:显示该日期全部的论文
  • 单击各个学科的简写:论文列表只会显示该日期和该学科的论文
  • 每个学科旁边的数字统计了该天发表该学科的论文数量

4.3 知识图谱

知识图谱可视化展示论文之间的语义关系,帮助发现研究趋势和关联。知识图谱依赖于论文的嵌入向量数据,只在数据库为Milvus生产模式时启用,而在数据库为SQLite开发模式时不可用。

4.3.1 图谱界面

在这里插入图片描述

界面组成:

  • 节点:代表一篇论文
  • :表示论文间的语义相似度
  • 颜色:不同颜色代表不同学科分类
4.3.2 交互操作
操作 方式 效果
查看详情 点击节点 显示论文基本信息
拖拽节点 鼠标拖拽 调整节点位置
缩放 滚轮 放大/缩小图谱
平移 拖拽空白区域 移动视图
4.3.3 布局算法

支持三种布局模式:

  1. 力导向布局:节点间相互排斥,相似节点靠近
  2. 圆形布局:节点按相似度排列成圆形
  3. 层级布局:按层级结构排列节点
4.3.4 相似度过滤

调节相似度阈值滑块,过滤低相似度的边:

  • 阈值越高,显示的连接越少
  • 阈值越低,显示的连接越多

4.4 论文详情

点击论文卡片的标题栏,进入论文详情页。

4.4.1 详情界面

在这里插入图片描述

展示信息:

  • 论文标题
  • 作者列表(带机构信息)
  • 完整摘要
  • 期刊引用(如有)
  • 学科分类
  • 发布日期
  • arXiv 链接
  • PDF 链接
  • DOI 链接(如有)
4.4.2 操作按钮
  • 收藏/取消收藏:管理收藏状态
  • 下载 PDF:启动下载任务
  • 查看原文:跳转到 arXiv 原页面
  • 相关论文:查看相似论文推荐

4.5 收藏管理

收藏页面管理所有已收藏的论文。

4.5.1 收藏列表

在这里插入图片描述

功能特性:

  • 按收藏时间排序
  • 支持关键词搜索
  • 直接下载,显示下载状态
  • 可以直接取消收藏
4.5.2 批量操作
  • 批量下载:选中多篇论文批量下载
  • 批量删除:取消收藏选中的论文

4.6 下载管理

下载页面展示所有下载任务的状态。

4.6.1 任务列表

在这里插入图片描述

任务状态:

  • 等待中:任务排队等待
  • 🔄 下载中:正在下载,显示进度
  • 已完成:下载成功
  • 失败:下载失败,显示错误信息
4.6.2 任务操作
操作 说明
打开文件 打开已下载的 PDF
重试 重新下载失败的任务
取消 取消正在进行的任务
删除 删除任务记录

4.7 AI 助手

AI 助手提供智能问答、语义搜索和技能执行功能。

4.7.1 模式切换

AI 助手支持三种模式:

在这里插入图片描述

搜索模式:

  • 在论文库中进行语义搜索
  • 输入自然语言查询,返回相关论文

问答模式:

  • 基于论文内容回答问题
  • 支持多轮对话

技能模式:

  • 执行预定义的技能任务
  • 支持自定义技能
4.7.2 搜索模式

在这里插入图片描述

使用方法:

  1. 选择"搜索"模式
  2. 输入搜索关键词或问题
  3. 系统返回语义相关的论文列表
  4. 在返回结果的底部有复制按钮、重新生成按钮

示例查询:

  • “transformer attention mechanism”
  • “图像分割最新进展”
  • “reinforcement learning for robotics”
    在这里插入图片描述
4.7.3 问答模式

在这里插入图片描述

使用方法:

  1. 选择"问答"模式
  2. 输入问题
  3. 系统基于论文库内容生成回答

示例问题:

  • “这篇论文的主要贡献是什么?”
  • “总结一下这篇论文的方法论”
  • “这篇论文与之前工作的区别是什么?”
4.7.4 技能模式

在这里插入图片描述

内置技能:

  • 论文摘要:生成论文摘要
  • 论文翻译:翻译论文内容
  • 引用生成:生成引用格式
  • 相关论文:查找相似论文

使用方法:

  1. 选择"技能"模式
  2. 选择要执行的技能
  3. 输入论文 ID 或从收藏中选择
  4. 点击执行

4.8 技能系统

技能系统允许用户创建和执行自定义任务。

4.8.1 技能管理页面

在这里插入图片描述

功能:

  • 查看所有可用技能
  • 执行技能任务
  • 创建自定义技能
4.8.2 内置技能
技能 功能 输入
论文摘要 生成论文摘要 论文 ID
论文翻译 翻译论文内容 论文 ID、目标语言
引用生成 生成引用格式 论文 ID、引用格式
相关论文 查找相似论文 论文 ID
4.8.3 创建自定义技能

backend/skills/ 目录下创建 SKILL.md 文件:

---
name: my-custom-skill
description: 我的自定义技能
icon: file-text
category: analysis
requires_paper: true
---

# 我的自定义技能

请分析以下论文的 {paper.title}:

{paper.abstract}

请从以下几个方面进行分析:
1. 研究背景
2. 主要贡献
3. 方法论
4. 实验结果

4.9 SubAgents

SubAgents 是 AI 代理系统,可以执行复杂的研究任务。

4.9.1 SubAgents 页面

在这里插入图片描述

4.9.2 内置代理

研究助手 (Research Assistant):

  • 文献搜索和分析
  • 获取论文详情
  • 执行技能分析

分析助手 (Analysis Assistant):

  • 深度论文分析
  • 方法论评估
  • 趋势发现

写作助手 (Writing Assistant):

  • 文献综述写作
  • 摘要生成
  • 翻译润色
4.9.3 执行任务

在这里插入图片描述

操作步骤:

  1. 选择一个代理
  2. 输入任务指令
  3. 可选:添加论文 ID
  4. 点击"执行"

示例指令:

  • “搜索关于 transformer 的最新论文”
  • “分析这篇论文的方法论”
  • “写一篇关于机器学习的文献综述”
4.9.4 查看结果

在这里插入图片描述

结果展示:

  • 任务状态
  • 执行轮次
  • 输出内容
  • 消息历史
4.9.5 创建自定义代理

backend/subagents/ 目录下创建 AGENT.md 文件:

---
id: my-agent
name: 我的代理
description: 自定义代理描述
icon: search
skills:
  - summary
tools:
  - search_papers
  - get_paper_details
max_turns: 15
temperature: 0.3
---

# 我的代理

你是一个专业的助手,专门...

## 工具调用格式

[TOOL: tool_name({"arg1": "value1"})]

## 可用工具

- search_papers: 搜索论文
- get_paper_details: 获取论文详情

4.10 数据管理

数据管理页面用于管理论文数据存储。

4.10.1 年度视图

在这里插入图片描述

功能:

  • 查看全年数据存储情况
  • 按月统计论文数量
  • 快速导航到特定月份
  • 可以选择从1991年-2026年期间的任何一年
4.10.2 月度视图

在这里插入图片描述

功能:

  • 查看每日论文数量
  • 获取特定日期的论文
  • 对特定日期的论文生成嵌入向量(应用于智能检索与知识图谱
  • 清除缓存数据
  • 绿色勾勾表示该天论文已经存储
  • 紫色波浪线表示该天论文已经生成嵌入向量
4.10.3 数据操作
操作 说明
获取论文 从 arXiv 获取指定日期的论文
嵌入向量 对指定日期的论文生成嵌入向量
清除缓存 删除指定日期的缓存数据
查看论文 跳转到该日期的论文列表

4.11 系统设置

设置页面用于配置系统参数。

4.11.1 主题设置

在这里插入图片描述

  • 浅色模式:适合白天使用
  • 深色模式:适合夜间使用
4.11.2 LLM 配置

在这里插入图片描述

支持的 LLM 提供商:

提供商 模型示例 说明
OpenAI gpt-4o-mini 需要 API Key
Anthropic claude-4.6 需要 API Key
GLM (智谱) glm-5 需要API Key
Ollama llama3 本地运行

配置步骤:

  1. 选择 LLM 提供商
  2. 选择模型
  3. 输入 API Key(如需要)
  4. 点击"测试连接"验证配置
4.11.3 Ollama 本地配置

安装 Ollama:

# macOS/Linux
curl -fsSL https://ollama.ai/install.sh | sh

# Windows
# 从 https://ollama.ai 下载安装包

下载模型:

ollama pull llama3
ollama pull mistral
ollama pull qwen2

启动 Ollama:

ollama serve

5. 高级配置

5.1 环境变量

完整的 .env 配置:

# 数据库SQLite配置(开发模式)
DATABASE_TYPE=sqlite
SQLITE_DB_PATH=./data/xivmind.db
DOWNLOAD_DIR=./downloads

# Milvus 配置(生产模式)
MILVUS_HOST=localhost
MILVUS_PORT=19530
DATABASE_NAME=xivmind

# LLM 配置
LLM_PROVIDER=openai
LLM_MODEL=gpt-4o-mini
OPENAI_API_KEY=sk-xxx

# Anthropic 配置
# LLM_PROVIDER=anthropic
# LLM_MODEL=claude-4.6
# ANTHROPIC_API_KEY=sk-xxx

# GLM 配置
# LLM_PROVIDER=glm
# LLM_MODEL=glm-5
# GLM_API_KEY=xxx
# GLM_BASE_URL=https://open.bigmodel.cn/api/paas/v4

# Ollama 配置
# LLM_PROVIDER=ollama
# OLLAMA_BASE_URL=http://localhost:11434
# OLLAMA_MODEL=llama3

5.2 Milvus 生产部署

启动 Milvus:

cd backend

# 标准模式(推荐生产)
./milvus.sh start

# 精简模式(开发测试)
./milvus.sh start lite

服务端口:

  • Milvus: 19530
  • Attu (GUI): 3000
  • MinIO: 9000/9001
  • etcd: 2379

5.3 Docker 部署

# 构建镜像
docker build -t xivmind-backend ./backend
docker build -t xivmind-frontend ./frontend

# 运行容器
docker run -d -p 8000:8000 xivmind-backend
docker run -d -p 5173:5173 xivmind-frontend

6. 常见问题

6.1 安装问题

Q: npm install 失败?

A: 尝试清除缓存后重新安装:
npm cache clean --force
rm -rf node_modules
npm install

Q: Python 依赖安装失败?

A: 确保使用 Python 3.10+,并安装构建工具:
pip install --upgrade pip
pip install -r requirements.txt

6.2 运行问题

Q: 后端启动失败?

A: 检查以下项目:
1. 端口 8000 是否被占用
2. .env 文件是否正确配置
3. 数据库目录是否有写入权限

Q: 前端无法连接后端?

A: 确认:
1. 后端服务正在运行
2. 后端端口配置正确(默认 8000)
3. 没有防火墙阻止连接

6.3 AI 功能问题

Q: AI 助手无响应?

A: 检查 LLM 配置:
1. API Key 是否正确
2. 模型名称是否正确
3. 网络是否可以访问 API

Q: Ollama 连接失败?

A: 确认:
1. Ollama 服务正在运行 (ollama serve)
2. 模型已下载 (ollama list)
3. 端口 11434 可访问

6.4 下载问题

Q: 论文下载失败?

A: 可能原因:
1. 网络连接问题
2. arXiv 服务暂时不可用
3. 下载目录没有写入权限

解决方法:
1. 检查网络连接
2. 稍后重试
3. 检查 DOWNLOAD_DIR 配置

6.5 数据问题

Q: 论文数据为空?

A: 尝试:
1. 点击"刷新"按钮重新获取
2. 检查日期是否有论文发布
3. 在数据管理页面获取指定日期数据

附录

A. API 端点

完整 API 文档请访问:

  • Swagger UI: http://localhost:8000/docs
  • ReDoc: http://localhost:8000/redoc

B. 技术支持


文档版本:0.2.0
最后更新:2026-02-26

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐