CVAT 详细安装与使用手册

1. CVAT 简介

CVAT (Computer Vision Annotation Tool) 是一个功能强大的开源计算机视觉标注平台,由OpenCV团队开发。它支持多种标注类型,包括目标检测、图像分割、姿态估计等,特别适合大规模数据集的标注工作。

主要特点:

  • 支持多种标注任务:矩形框、多边形、折线、点、体积、图像分类等

  • 团队协作功能,支持多用户标注

  • 自动标注和半自动化标注功能

  • 支持多种数据格式导入导出,包括YOLO、COCO、PASCAL VOC等

  • 直观的Web界面操作

2. 安装前准备

2.1 安装 Docker Desktop

CVAT主要通过Docker进行部署,因此首先需要安装Docker Desktop:

  1. 1.

    访问Docker官网下载页面:Docker Desktop for Windows

  2. 2.

    下载并安装Docker Desktop

  3. 3.

    安装完成后,启动Docker Desktop并确保它在后台运行

  4. 4.

    注意:Windows系统需要开启WSL2(Windows Subsystem for Linux 2)支持

2.2 配置Docker镜像加速(针对国内用户)

为了解决国内下载Docker镜像慢的问题,建议配置镜像加速器:

  1. 1.

    右键点击任务栏中的Docker图标,选择"Settings"或"设置"

  2. 2.

    选择"Docker Engine"或"Docker引擎"

  3. 3.

    在配置JSON中添加国内镜像源:

​{
  "registry-mirrors": [
    "https://docker.mirrors.ustc.edu.cn",
    "https://hub-mirror.c.163.com",
    "https://mirror.baidubce.com"
  ]
}
  1. 1.

    点击"Apply & Restart"应用并重启Docker

3. CVAT 安装步骤

3.1 克隆CVAT仓库

  1. 1.

    打开命令提示符(CMD)或PowerShell

  2. 2.

    克隆CVAT仓库(建议使用国内镜像):

Bash
# 使用GitHub官方仓库
git clone https://github.com/opencv/cvat.
git
​
# 或者使用Gitee镜像(国内访问更快)
git clone https://gitee.com/opencv/cvat.
git
  1. 1.

    进入CVAT目录:

cd cvat

3.2 使用Docker Compose部署CVAT

  1. 1.

    对于普通用户安装(基本功能):

docker compose up -d
  1. 1.

    对于需要自动标注功能的用户:

docker compose -f docker-compose.yml -f 
components/serverless/docker-compose.
serverless.yml up -d
  1. 1.

    等待安装完成,这个过程可能需要一些时间,因为需要下载多个Docker镜像

3.3 创建管理员账户

  1. 1.

    安装完成后,创建一个管理员账户:

docker exec -it cvat_server bash -ic 
'python3 ~/manage.py createsuperuser'
  1. 1.

    按照提示输入用户名、电子邮件和密码

4. 访问与登录CVAT

  1. 1.

    打开浏览器,访问:http://localhost:8080

  2. 2.

    使用刚才创建的管理员账户登录

5. CVAT 基本使用流程

5.1 创建新项目

  1. 1.

    登录后,点击左侧菜单栏的"Projects"(项目)

  2. 2.

    点击右上角的"+"按钮创建新项目

  3. 3.

    填写项目信息:

    • 名称:项目的名称

    • 标签:可以添加标签方便管理

    • 描述:项目的描述信息

    • 选择标注类型:根据需要选择(目标检测、图像分割等)

  4. 4.

    点击"Submit"(提交)创建项目

5.2 定义标签(Classes)

  1. 1.

    创建项目后,点击进入项目详情页

  2. 2.

    点击"Labels"(标签)选项卡

  3. 3.

    点击"+ Add Label"添加标签

  4. 4.

    输入标签名称,如"person"、"car"等

  5. 5.

    可以选择添加属性(Attributes)来丰富标注信息

  6. 6.

    点击"Submit"保存标签

5.3 上传数据集

  1. 1.

    在项目详情页,点击"Tasks"(任务)选项卡

  2. 2.

    点击右上角的"+"按钮创建新任务

  3. 3.

    填写任务信息:

    • 名称:任务名称

    • 标签:选择之前定义的标签

    • 选择数据上传方式:

      • 上传文件:直接上传图像文件

      • 链接:通过URL上传

      • 共享目录:使用Docker挂载的共享目录

  4. 4.

    上传完成后,点击"Submit"创建任务

5.4 开始标注

  1. 1.

    进入任务详情页,点击"Job #1"开始标注

  2. 2.

    使用工具栏的工具进行标注:

    • 矩形框工具:用于目标检测标注

    • 多边形工具:用于图像分割标注

    • 点工具:用于关键点标注

    • 折线工具:用于线段标注

  3. 3.

    选择目标,绘制标注框,然后选择对应的类别

  4. 4.

    使用快捷键提高标注效率:

    • N:下一张图片

    • P:上一张图片

    • Ctrl+S:保存当前标注

    • 空格键:切换绘制模式

5.5 导出标注数据为YOLOv5格式

  1. 1.

    在任务详情页,点击右上角的"Actions"按钮

  2. 2.

    选择"Export dataset"

  3. 3.

    在格式选择中,选择"YOLO 1.1"

  4. 4.

    点击"Export"开始导出

  5. 5.

    导出完成后,下载ZIP文件

  6. 6.

    ZIP文件包含:

    • obj.names:类别名称文件

    • obj.data:数据集配置文件

    • labels/:包含所有标注的txt文件

    • images/:原始图像文件(如果选择了导出图像)

6. 与YOLOv5集成使用

6.1 准备YOLOv5格式的数据集

  1. 1.

    解压从CVAT导出的ZIP文件

  2. 2.

    按照YOLOv5的标准目录结构组织数据:

my_dataset/
├── images/
│   ├── train/
│   │   └── *.jpg  # 训练图像
│   └── val/
│       └── *.jpg  # 验证图像
└── labels/
    ├── train/
    │   └── *.txt  # 训练标注
    └── val/
        └── *.txt  # 验证标注
  1. 1.

    创建数据集配置文件(如my_dataset.yaml):

YAML
# YOLOv5 数据集配置
path: ../my_dataset  # 数据集路径
train: images/train  # 训练集
val: images/val      # 验证集
​
# 类别名称
names:
  0: person
  1: car
  2: bicycle
  # 添加所有类别...

6.2 使用YOLOv5进行预标注

CVAT支持使用预训练模型进行自动标注,大大提高标注效率:

  1. 1.

    在创建任务时,选择"Enable automatic annotation"选项

  2. 2.

    选择YOLOv5模型(如果已配置)

  3. 3.

    上传预训练的YOLOv5模型文件(.pt格式)

  4. 4.

    设置置信度阈值

  5. 5.

    任务创建后,系统会自动进行预标注

  6. 6.

    标注人员只需要检查和修正自动标注的结果即可

7. 团队协作功能

7.1 添加用户

  1. 1.

    管理员登录后,点击右上角的用户名,选择"Administration"

  2. 2.

    选择"Users"选项卡

  3. 3.

    点击"Add user"添加新用户

  4. 4.

    设置用户名、电子邮件、密码和用户角色

7.2 分配任务

  1. 1.

    创建任务时,可以指定任务的执行者

  2. 2.

    也可以在任务详情页,点击"Actions" > "Assign to"

  3. 3.

    选择要分配的用户

8. 常见问题与解决方案

8.1 安装问题

问题:Docker镜像下载失败

  • 解决方案:配置Docker镜像加速器,参考第2.2节

问题:端口冲突

  • 解决方案:修改docker-compose.yml中的端口映射,将默认的8080端口改为其他端口

8.2 使用问题

问题:上传大文件失败

  • 解决方案:修改Docker配置,增加上传文件大小限制

问题:自动标注不工作

  • 解决方案:确保使用了包含serverless组件的安装命令,参考第3.2节

8.3 性能优化

问题:标注界面响应缓慢

  • 解决方案:关闭浏览器中的其他标签页,减少同时打开的图像数量

问题:Docker占用资源过高

  • 解决方案:在Docker Desktop设置中限制CPU和内存使用

9. 高级功能

9.1 数据增强

CVAT支持在导出数据集时应用数据增强,生成更多的训练样本。

9.2 API接口

CVAT提供RESTful API,可以通过编程方式自动化标注流程。详细API文档可在CVAT界面中访问。

9.3 导入已有标注

支持从其他格式(如COCO、VOC)导入已有标注,方便迁移现有数据集。

10. 总结

CVAT是一个功能强大的标注工具,特别适合YOLOv5等目标检测模型的数据集准备。通过Docker部署,安装过程相对简单,而丰富的功能和良好的用户体验使其成为计算机视觉项目中不可或缺的工具。

部分内容ai生成,请注意甄别借用,笔者不负相关责任。

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐