OCR训练

2025-05-09

第一步 转换成Ai可以识别的数据集:


1、切换目录 C:\testsoft\test_ocr\PPOCRLabel


2、执行命令 python gen_ocr_train_val_test.py




第二步 进行Ai训练


1、切换目录 cd C:\testsoft\test_ocr\PaddleOCR


2、开始训练 python tools\train.py -c ch_PP-OCRv4_det_teacher.yml


3、导出模型 python tools/export_model.py -c "./ch_PP-OCRv4_det_teacher.yml" -o Global.pretrained_model="./output/ch_PP-OCRv4/latest.pdparams" Global.save_inference_dir="./inference_model/det/"


4、拷贝验证 C:\testsoft\test_ocr\PaddleOCR\inference_model 中的文件夹 拷贝到 C:\testsoft\test_ocr\ai\model\ppocr中,重新命名


5、切换模型 cd C:\testsoft\test_ocr修改里面的config文件OCR_MODEL_DET_PATH,可以前面#[空格] 让其失效



python tools/export_model.py -c "./ch_PP-OCRv4_rec_hgnet.yml" -o Global.pretrained_model=".\output\rec_ppocr_v4_hgnet\latest.pdparams" Global.save_inference_dir="./inference_model/rec/"