PaddleOCR使用笔记

Linux环境下

文字方向分类训练

数据集准备

在这里插入图片描述

  • 训练集标签如下:

注意: 默认请将图片路径和图片标签用 \t 分割,如用其他方式分割将造成训练报错

0和180分别表示图片的角度为0度和180度

train/r180_color_20190605_D2C9041012BZ_Z_crop_3.jpg	180
train/r0_zoom_20170412_110947_XI24924702BZ_Z_crop_2.jpg	0
train/r180_impulse_noise_20190808_VG68436921BZ_Z_crop_3.jpg	180
train/r0_gaussian_blur_20190808_DE83845691BZ_Z_crop_0.jpg	0
train/r0_impulse_noise_20190920_CS45256769BZ_B_crop_0.jpg	0
train/r180_motion_blur_20190808_DE83845691BZ_Z_crop_1.jpg	180
...
  • 测试集标签如下:
test/r0_color_20190919_F7X0047480BZ_B_crop_0.jpg	0
test/r0_contrast_20190605_S69W977254BZ_B_crop_2.jpg	0
test/r180_translate_x_20190920_45828688BZ_B_crop_2.jpg	180
test/r0_equalize_20170412_110205_XM85857111BZ_Z_crop_2.jpg	0
test/r0_motion_blur_20190919_SB38152105BZ_B_crop_2.jpg	0
test/r180_motion_blur_20190920_F8C5520243BZ_B_crop_2.jpg	180
...
预训练模型下载

在这里插入图片描述

  • 下载下来后解压到本地,并将ch_ppocr_mobile_v1.1_cls_train目录上传到服务器上的项目中的pretrain_models目录

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

启动训练
# GPU训练,通过CUDA_VISIBLE_DEVICES指定卡号
export CUDA_VISIBLE_DEVICES=2
# 启动训练
python3 tools/train.py -c configs/cls/cls_mv3.yml  2>&1 | tee train_cls.log

在这里插入图片描述

评估训练
export CUDA_VISIBLE_DEVICES=0
# GPU 评估, Global.checkpoints 为待测权重
python3 tools/eval.py -c configs/cls/cls_mv3.yml -o Global.checkpoints=output/cls_mv3/best_accuracy

在这里插入图片描述

测试
python3 tools/infer_cls.py -c configs/cls/cls_mv3.yml -o Global.checkpoints=output/cls_mv3/best_accuracy Global.infer_img=doc/cls_crown_test/

在这里插入图片描述

在这里插入图片描述

创作不易,喜欢的话加个关注点个赞,❤谢谢谢谢❤

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐