PaddleOCR使用笔记-文字方向分类训练

PaddleOCR使用笔记Linux环境下文字方向分类训练数据集准备训练集标签如下：注意：默认请将图片路径和图片标签用 \t 分割，如用其他方式分割将造成训练报错0和180分别表示图片的角度为0度和180度train/r180_color_20190605_D2C9041012BZ_Z_crop_3.jpg180train/r0_zoom_20170412_110947_XI24924702BZ

快乐的小小程序猿

2205人浏览 · 2021-09-04 13:05:19

快乐的小小程序猿 · 2021-09-04 13:05:19 发布

PaddleOCR使用笔记

Linux环境下

文字方向分类训练

数据集准备

在这里插入图片描述

训练集标签如下：

注意： 默认请将图片路径和图片标签用 \t 分割，如用其他方式分割将造成训练报错

0和180分别表示图片的角度为0度和180度

train/r180_color_20190605_D2C9041012BZ_Z_crop_3.jpg	180
train/r0_zoom_20170412_110947_XI24924702BZ_Z_crop_2.jpg	0
train/r180_impulse_noise_20190808_VG68436921BZ_Z_crop_3.jpg	180
train/r0_gaussian_blur_20190808_DE83845691BZ_Z_crop_0.jpg	0
train/r0_impulse_noise_20190920_CS45256769BZ_B_crop_0.jpg	0
train/r180_motion_blur_20190808_DE83845691BZ_Z_crop_1.jpg	180
...

测试集标签如下：

test/r0_color_20190919_F7X0047480BZ_B_crop_0.jpg	0
test/r0_contrast_20190605_S69W977254BZ_B_crop_2.jpg	0
test/r180_translate_x_20190920_45828688BZ_B_crop_2.jpg	180
test/r0_equalize_20170412_110205_XM85857111BZ_Z_crop_2.jpg	0
test/r0_motion_blur_20190919_SB38152105BZ_B_crop_2.jpg	0
test/r180_motion_blur_20190920_F8C5520243BZ_B_crop_2.jpg	180
...

预训练模型下载

在PaddleOCR/quickstart.md at develop · PaddlePaddle/PaddleOCR (github.com)中下载方向分类器的预训练模型

在这里插入图片描述

下载下来后解压到本地，并将ch_ppocr_mobile_v1.1_cls_train目录上传到服务器上的项目中的pretrain_models目录

在这里插入图片描述

启动训练

# GPU训练，通过CUDA_VISIBLE_DEVICES指定卡号
export CUDA_VISIBLE_DEVICES=2
# 启动训练
python3 tools/train.py -c configs/cls/cls_mv3.yml  2>&1 | tee train_cls.log

在这里插入图片描述

评估训练

export CUDA_VISIBLE_DEVICES=0
# GPU 评估， Global.checkpoints 为待测权重
python3 tools/eval.py -c configs/cls/cls_mv3.yml -o Global.checkpoints=output/cls_mv3/best_accuracy

在这里插入图片描述

测试

python3 tools/infer_cls.py -c configs/cls/cls_mv3.yml -o Global.checkpoints=output/cls_mv3/best_accuracy Global.infer_img=doc/cls_crown_test/

在这里插入图片描述

创作不易，喜欢的话加个关注点个赞，❤谢谢谢谢❤

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

解密AI库存预测：架构师的完整技术路线图

本文将以架构师视角，提供一套从需求分析到系统落地的完整AI库存预测技术路线图。我们将拆解库存预测系统的核心架构模块，详解数据层、特征层、模型层、服务层的设计要点，结合实战案例分析技术选型（如数据存储用Hudi还是Delta Lake？模型训练选XGBoost还是Transformer？），并提供可复用的架构设计模板与代码示例。——从业务目标反推技术边界技术指标目标值（参考）实现思路预测准确率MAP