一、环境准备

1. 安装 Anaconda

  • 访问 Anaconda 官网 下载对应系统的安装包(Windows/macOS/Linux);
  • 安装时勾选「Add Anaconda to my PATH environment variable」(可选,方便终端调用),完成安装后重启终端。

2. 安装 VS Code

  • 访问 VS Code 官网 下载安装;
  • 打开 VS Code,在左侧扩展商店搜索并安装「Python」扩展(Microsoft 官方出品)。

二、创建并配置 Anaconda 环境

1. 创建独立 Python 环境

打开 Anaconda Prompt(Windows)或终端(macOS/Linux),执行以下命令创建名为 modelscope-env 的环境(Python 3.10 兼容性最佳):

bash

运行

conda create -n modelscope-env python=3.10 -y

2. 激活环境

bash

运行

conda activate modelscope-env

成功标志:终端前缀从 (base) 变为 (modelscope-env)

3. 安装 ModelScope SDK

使用阿里云镜像加速安装,避免网络问题:

bash

运行

pip install modelscope --no-cache-dir -i https://mirrors.aliyun.com/pypi/simple/

成功标志:终端输出 Successfully installed modelscope-x.x.x


三、在 VS Code 中编写并运行代码

1. 配置 VS Code 解释器

  • 打开 VS Code,点击「文件」→「打开文件夹」,选择一个空文件夹(如 D:\modelscope-demo)作为工作目录;
  • 在工作目录中新建文件 test_dataset.py
  • 按下 Ctrl+Shift+P(Windows)或 Cmd+Shift+P(macOS),输入「Python: Select Interpreter」,选择 modelscope-env 环境的 Python 解释器。

2. 编写数据集加载代码

以车型分类.数据集为例将以下代码复制到 test_dataset.py 中:

python

运行

from modelscope.msdatasets import MsDataset

def load_car_brands_dataset():
    try:
        # 加载汽车品牌数据集
        print("正在加载数据集...")
        ds = MsDataset.load(
            'tany0699/carBrands50', 
            subset_name='default', 
            split='train'
        )
        
        # 遍历前3条数据验证
        print("\n✅ 数据集加载成功!前3条数据如下:")
        for idx, data in enumerate(ds):
            print(f"\n第 {idx+1} 条数据:")
            print(f"图片路径:{data.get('image')}")
            print(f"品牌标签:{data.get('label')}")
            if idx >= 2:
                break
        
        return ds
    
    except Exception as e:
        print(f"\n❌ 加载失败,错误信息:{e}")
        import traceback
        traceback.print_exc()
        return None

if __name__ == "__main__":
    load_car_brands_dataset()

3. 运行代码

  • 点击 VS Code 右上角的「运行」按钮(三角形图标),或在终端执行:

    bash

    运行

    python test_dataset.py
    
  • 成功输出示例:

    plaintext

    正在加载数据集...
    
    ✅ 数据集加载成功!前3条数据如下:
    
    第 1 条数据:
    图片路径:C:\Users\zhangye\.cache\modelscope\datasets\tany0699___car_brands50\default\images\0001.jpg
    品牌标签:audi
    
    第 2 条数据:
    图片路径:C:\Users\zhangye\.cache\modelscope\datasets\tany0699___car_brands50\default\images\0002.jpg
    品牌标签:bmw
    ...
    

四、常见问题解决方案

1. 报错 EnvironmentNameNotFound: Could not find conda environment: modelscope-env

  • 原因:未创建目标环境;
  • 解决:先执行「二、1」的 conda create 命令创建环境。

2. 报错 No module named 'modelscope'

  • 原因:VS Code 解释器未选择 modelscope-env 环境;
  • 解决:重新执行「三、1」的解释器选择步骤。

3. 安装依赖慢或超时

  • 解决:使用阿里云镜像(见「二、3」),或配置 conda 镜像:

    bash

    运行

    conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
    conda config --set show_channel_urls yes
    

4. 加载数据集提示「找不到数据集」

  • 原因:数据集需要授权或网络问题;
  • 解决:在代码开头添加魔搭登录逻辑:

    python

    运行

    from modelscope.hub import login
    # 登录魔搭(Token 从 https://www.modelscope.cn/usercenter/tokens 获取)
    login()
    

五、总结

  1. 核心流程:用 Anaconda 创建独立环境 → 安装 ModelScope SDK → VS Code 配置解释器 → 编写并运行数据集加载代码;
  2. 关键要点:使用独立 conda 环境避免依赖冲突,选择正确的 VS Code 解释器,用镜像源加速安装;
  3. 验证标准:成功加载并打印数据集的图片路径和标签。

按照本教程操作,你将能快速上手 ModelScope SDK 的基础使用,后续可在此基础上探索模型训练、推理等更多功能。

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐