update doc

4 years ago · 8c000977dd
parent aad3093a91
commit 8c000977dd
70 changed files with 2401 additions and 966 deletions
--- a/README.md
+++ b/README.md
--- a/README_ch.md
+++ b/README_ch.md
@ -0,0 +1,150 @@
+[English](README.md) | 简体中文
+
+## 简介
+PaddleOCR旨在打造一套丰富、领先、且实用的OCR工具库，助力使用者训练出更好的模型，并应用落地。
+
+**近期更新**
+- 2020.9.22 更新PP-OCR技术文章，https://arxiv.org/abs/2009.09941
+- 2020.9.19 更新超轻量压缩ppocr_mobile_slim系列模型，整体模型3.5M(详见[PP-OCR Pipline](#PP-OCR))，适合在移动端部署使用。[模型下载](#模型下载)
+- 2020.9.17 更新超轻量ppocr_mobile系列和通用ppocr_server系列中英文ocr模型，媲美商业效果。[模型下载](#模型下载)
+- 2020.9.17 更新[英文识别模型](./doc/doc_ch/models_list.md#英文识别模型)和[多语言识别模型](doc/doc_ch/models_list.md#多语言识别模型)，已支持`德语、法语、日语、韩语`，更多语种识别模型将持续更新。
+- 2020.8.26 更新OCR相关的84个常见问题及解答，具体参考[FAQ](./doc/doc_ch/FAQ.md)
+- 2020.8.24 支持通过whl包安装使用PaddleOCR，具体参考[Paddleocr Package使用说明](./doc/doc_ch/whl.md)
+- 2020.8.21 更新8月18日B站直播课回放和PPT，课节2，易学易用的OCR工具大礼包，[获取地址](https://aistudio.baidu.com/aistudio/education/group/info/1519)
+- [More](./doc/doc_ch/update.md)
+
+
+## 特性
+
+- PPOCR系列高质量预训练模型，准确的识别效果
+    - 超轻量ppocr_mobile移动端系列：检测（2.6M）+方向分类器（0.9M）+ 识别（4.6M）= 8.1M
+    - 通用ppocr_server系列：检测（47.2M）+方向分类器（0.9M）+ 识别（107M）= 155.1M
+    - 超轻量压缩ppocr_mobile_slim系列：检测（1.4M）+方向分类器（0.5M）+ 识别（1.6M）= 3.5M  
+- 支持中英文数字组合识别、竖排文本识别、长文本识别
+- 支持多语言识别：韩语、日语、德语、法语
+- 支持用户自定义训练，提供丰富的预测推理部署方案
+- 支持PIP快速安装使用
+- 可运行于Linux、Windows、MacOS等多种系统
+
+## 效果展示
+
+<div align="center">
+    <img src="doc/imgs_results/1101.jpg" width="800">
+    <img src="doc/imgs_results/1103.jpg" width="800">
+</div>
+
+上图是通用ppocr_server模型效果展示，更多效果图请见[效果展示页面](./doc/doc_ch/visualization.md)。
+
+## 快速体验
+- PC端：超轻量级中文OCR在线体验地址：https://www.paddlepaddle.org.cn/hub/scene/ocr
+
+- 移动端：[安装包DEMO下载地址](https://ai.baidu.com/easyedge/app/openSource?from=paddlelite)(基于EasyEdge和Paddle-Lite, 支持iOS和Android系统)，Android手机也可以直接扫描下面二维码安装体验。
+
+
+<div align="center">
+<img src="./doc/ocr-android-easyedge.png"  width = "200" height = "200" />
+</div>
+
+- 代码体验：从[快速安装](./doc/doc_ch/installation.md) 开始
+
+<a name="模型下载"></a>
+## PP-OCR 1.1系列模型列表（9月17日更新）
+
+| 模型简介     | 模型名称     |推荐场景          | 检测模型 | 方向分类器 | 识别模型 |
+| ------------ | --------------- | ----------------|---- | ---------- | -------- |
+| 中英文超轻量OCR模型（8.1M） | ch_ppocr_mobile_v1.1_xx |移动端&服务器端|[推理模型](https://paddleocr.bj.bcebos.com/20-09-22/mobile/det/ch_ppocr_mobile_v1.1_det_infer.tar) / [预训练模型](https://paddleocr.bj.bcebos.com/20-09-22/mobile/det/ch_ppocr_mobile_v1.1_det_train.tar)|[推理模型](https://paddleocr.bj.bcebos.com/20-09-22/cls/ch_ppocr_mobile_v1.1_cls_infer.tar) / [预训练模型](https://paddleocr.bj.bcebos.com/20-09-22/cls/ch_ppocr_mobile_v1.1_cls_train.tar) |[推理模型](https://paddleocr.bj.bcebos.com/20-09-22/mobile/rec/ch_ppocr_mobile_v1.1_rec_infer.tar) / [预训练模型](https://paddleocr.bj.bcebos.com/20-09-22/mobile/rec/ch_ppocr_mobile_v1.1_rec_pre.tar)      |
+| 中英文通用OCR模型（155.1M）   |ch_ppocr_server_v1.1_xx|服务器端 |[推理模型](https://paddleocr.bj.bcebos.com/20-09-22/server/det/ch_ppocr_server_v1.1_det_infer.tar) / [预训练模型](https://paddleocr.bj.bcebos.com/20-09-22/server/det/ch_ppocr_server_v1.1_det_train.tar)          |[推理模型](https://paddleocr.bj.bcebos.com/20-09-22/cls/ch_ppocr_mobile_v1.1_cls_infer.tar) / [预训练模型](https://paddleocr.bj.bcebos.com/20-09-22/cls/ch_ppocr_mobile_v1.1_cls_train.tar)    |[推理模型](https://paddleocr.bj.bcebos.com/20-09-22/server/rec/ch_ppocr_server_v1.1_rec_infer.tar) / [预训练模型](https://paddleocr.bj.bcebos.com/20-09-22/server/rec/ch_ppocr_server_v1.1_rec_pre.tar)  |  
+| 中英文超轻量压缩OCR模型（3.5M） | ch_ppocr_mobile_slim_v1.1_xx| 移动端 |[推理模型](https://paddleocr.bj.bcebos.com/20-09-22/mobile-slim/det/ch_ppocr_mobile_v1.1_det_prune_infer.tar) / [slim模型](https://paddleocr.bj.bcebos.com/20-09-22/mobile/lite/ch_ppocr_mobile_v1.1_det_prune_opt.nb) |[推理模型](https://paddleocr.bj.bcebos.com/20-09-22/cls/ch_ppocr_mobile_v1.1_cls_quant_infer.tar) / [slim模型](https://paddleocr.bj.bcebos.com/20-09-22/mobile/lite/ch_ppocr_mobile_v1.1_cls_quant_opt.nb)| [推理模型](https://paddleocr.bj.bcebos.com/20-09-22/mobile-slim/rec/ch_ppocr_mobile_v1.1_rec_quant_infer.tar) / [slim模型](https://paddleocr.bj.bcebos.com/20-09-22/mobile/lite/ch_ppocr_mobile_v1.1_rec_quant_opt.nb)|  
+
+更多模型下载（包括多语言），可以参考[PP-OCR v1.1 系列模型下载](./doc/doc_ch/models_list.md)
+
+## 文档教程
+- [快速安装](./doc/doc_ch/installation.md)
+- [中文OCR模型快速使用](./doc/doc_ch/quickstart.md)
+- [代码组织结构](./doc/doc_ch/tree.md)
+- 算法介绍
+    - [文本检测](./doc/doc_ch/algorithm_overview.md)
+    - [文本识别](./doc/doc_ch/algorithm_overview.md)
+    - [PP-OCR Pipline](#PP-OCR)
+- 模型训练/评估
+    - [文本检测](./doc/doc_ch/detection.md)
+    - [文本识别](./doc/doc_ch/recognition.md)
+    - [方向分类器](./doc/doc_ch/angle_class.md)
+    - [yml参数配置文件介绍](./doc/doc_ch/config.md)
+- 预测部署
+    - [基于pip安装whl包快速推理](./doc/doc_ch/whl.md)
+    - [基于Python脚本预测引擎推理](./doc/doc_ch/inference.md)
+    - [基于C++预测引擎推理](./deploy/cpp_infer/readme.md)
+    - [服务化部署](./deploy/hubserving/readme.md)
+    - [端侧部署](./deploy/lite/readme.md)
+    - [模型量化](./deploy/slim/quantization/README.md)
+    - [模型裁剪](./deploy/slim/prune/README.md)
+    - [Benchmark](./doc/doc_ch/benchmark.md)
+- 数据集
+    - [通用中英文OCR数据集](./doc/doc_ch/datasets.md)
+    - [手写中文OCR数据集](./doc/doc_ch/handwritten_datasets.md)
+    - [垂类多语言OCR数据集](./doc/doc_ch/vertical_and_multilingual_datasets.md)
+    - [常用数据标注工具](./doc/doc_ch/data_annotation.md)
+    - [常用数据合成工具](./doc/doc_ch/data_synthesis.md)
+- [效果展示](#效果展示)
+- FAQ
+    - [【精选】OCR精选10个问题](./doc/doc_ch/FAQ.md)
+    - [【理论篇】OCR通用21个问题](./doc/doc_ch/FAQ.md)
+    - [【实战篇】PaddleOCR实战53个问题](./doc/doc_ch/FAQ.md)
+- [技术交流群](#欢迎加入PaddleOCR技术交流群)
+- [参考文献](./doc/doc_ch/reference.md)
+- [许可证书](#许可证书)
+- [贡献代码](#贡献代码)
+
+<a name="PP-OCR"></a>
+## PP-OCR Pipline
+<div align="center">
+    <img src="./doc/ppocr_framework.png" width="800">
+</div>
+
+PP-OCR是一个实用的超轻量OCR系统。主要由DB文本检测、检测框矫正和CRNN文本识别三部分组成。该系统从骨干网络选择和调整、预测头部的设计、数据增强、学习率变换策略、正则化参数选择、预训练模型使用以及模型自动裁剪量化8个方面，采用19个有效策略，对各个模块的模型进行效果调优和瘦身，最终得到整体大小为3.5M的超轻量中英文OCR和2.8M的英文数字OCR。更多细节请参考PP-OCR技术方案 https://arxiv.org/abs/2009.09941 。其中FPGM裁剪器和PACT量化的实现可以参考[PaddleSlim](https://github.com/PaddlePaddle/PaddleSlim)。
+
+<a name="效果展示"></a>
+## 效果展示 [more](./doc/doc_ch/visualization.md)
+- 中文模型
+<div align="center">
+    <img src="./doc/imgs_results/1102.jpg" width="800">
+    <img src="./doc/imgs_results/1104.jpg" width="800">
+    <img src="./doc/imgs_results/1106.jpg" width="800">
+    <img src="./doc/imgs_results/1105.jpg" width="800">
+</div>
+
+- 英文模型
+<div align="center">
+    <img src="./doc/imgs_results/img_12.jpg" width="800">
+</div>
+
+- 其他语言模型
+<div align="center">
+    <img src="./doc/imgs_results/1110.jpg" width="800">
+    <img src="./doc/imgs_results/1112.jpg" width="800">
+</div>
+
+<a name="欢迎加入PaddleOCR技术交流群"></a>
+## 欢迎加入PaddleOCR技术交流群
+请扫描下面二维码，完成问卷填写，获取加群二维码和OCR方向的炼丹秘籍
+
+<div align="center">
+<img src="./doc/joinus.PNG"  width = "200" height = "200" />
+</div>
+
+<a name="许可证书"></a>
+## 许可证书
+本项目的发布受<a href="https://github.com/PaddlePaddle/PaddleOCR/blob/master/LICENSE">Apache 2.0 license</a>许可认证。
+
+<a name="贡献代码"></a>
+## 贡献代码
+我们非常欢迎你为PaddleOCR贡献代码，也十分感谢你的反馈。
+
+- 非常感谢 [Khanh Tran](https://github.com/xxxpsyduck) 和 [Karl Horky](https://github.com/karlhorky) 贡献修改英文文档
+- 非常感谢 [zhangxin](https://github.com/ZhangXinNan)([Blog](https://blog.csdn.net/sdlypyzq)) 贡献新的可视化方式、添加.gitgnore、处理手动设置PYTHONPATH环境变量的问题
+- 非常感谢 [lyl120117](https://github.com/lyl120117) 贡献打印网络结构的代码
+- 非常感谢 [xiangyubo](https://github.com/xiangyubo) 贡献手写中文OCR数据集
+- 非常感谢 [authorfu](https://github.com/authorfu) 贡献Android和[xiadeye](https://github.com/xiadeye) 贡献IOS的demo代码
+- 非常感谢 [BeyondYourself](https://github.com/BeyondYourself) 给PaddleOCR提了很多非常棒的建议，并简化了PaddleOCR的部分代码风格。
+- 非常感谢 [tangmq](https://gitee.com/tangmq) 给PaddleOCR增加Docker化部署服务，支持快速发布可调用的Restful API服务。
--- a/doc/PPOCR.pdf
+++ b/doc/PPOCR.pdf
--- a/doc/datasets/VoTT.jpg
+++ b/doc/datasets/VoTT.jpg
--- a/doc/datasets/doc.jpg
+++ b/doc/datasets/doc.jpg
--- a/doc/doc_ch/FAQ.md
+++ b/doc/doc_ch/FAQ.md
@ -406,7 +406,7 @@ return paddle.reader.multiprocess_reader(readers, False, queue_size=320)

 #### Q3.3.8：如何进行模型微调？

-**A**：注意配置好匹配的数据集合适，然后在finetune训练时，可以加载我们提供的预训练模型，设置配置文件中Global.pretrain_weights 参数为要加载的预训练模型路径。
+**A**：注意配置好合适的数据集，对齐数据格式，然后在finetune训练时，可以加载我们提供的预训练模型，设置配置文件中Global.pretrain_weights 参数为要加载的预训练模型路径。

 #### Q3.3.9：文本检测换成自己的数据没法训练，有一些”###”是什么意思？

@ -418,7 +418,7 @@ return paddle.reader.multiprocess_reader(readers, False, queue_size=320)

 #### Q3.3.11：自己训练出来的未inference转换的模型 可以当作预训练模型吗？

-**A**：可以的，但是如果训练数据两量少的话，可能会过拟合到少量数据上，泛化性能不佳。
+**A**：可以的，但是如果训练数据量少的话，可能会过拟合到少量数据上，泛化性能不佳。

 #### Q3.3.12：使用带TPS的识别模型预测报错

--- a/doc/doc_ch/algorithm_overview.md
+++ b/doc/doc_ch/algorithm_overview.md
@ -0,0 +1,64 @@
+<a name="算法介绍"></a>
+## 算法介绍
+本文给出了PaddleOCR已支持的文本检测算法和文本识别算法列表，以及每个算法在**英文公开数据集**上的模型和指标，主要用于算法简介和算法性能对比，更多包括中文在内的其他数据集上的模型请参考[PP-OCR v1.1 系列模型下载](./models_list.md)。
+
+- [1.文本检测算法](#文本检测算法)
+- [2.文本识别算法](#文本识别算法)
+
+<a name="文本检测算法"></a>
+### 1.文本检测算法
+
+PaddleOCR开源的文本检测算法列表：
+- [x]  DB([paper](https://arxiv.org/abs/1911.08947))（ppocr推荐）
+- [x]  EAST([paper](https://arxiv.org/abs/1704.03155))
+- [x]  SAST([paper](https://arxiv.org/abs/1908.05498))
+
+在ICDAR2015文本检测公开数据集上，算法效果如下：
+
+|模型|骨干网络|precision|recall|Hmean|下载链接|
+|-|-|-|-|-|-|
+|EAST|ResNet50_vd|88.18%|85.51%|86.82%|[下载链接](https://paddleocr.bj.bcebos.com/det_r50_vd_east.tar)|
+|EAST|MobileNetV3|81.67%|79.83%|80.74%|[下载链接](https://paddleocr.bj.bcebos.com/det_mv3_east.tar)|
+|DB|ResNet50_vd|83.79%|80.65%|82.19%|[下载链接](https://paddleocr.bj.bcebos.com/det_r50_vd_db.tar)|
+|DB|MobileNetV3|75.92%|73.18%|74.53%|[下载链接](https://paddleocr.bj.bcebos.com/det_mv3_db.tar)|
+|SAST|ResNet50_vd|92.18%|82.96%|87.33%|[下载链接](https://paddleocr.bj.bcebos.com/SAST/sast_r50_vd_icdar2015.tar)|
+
+在Total-text文本检测公开数据集上，算法效果如下：
+
+|模型|骨干网络|precision|recall|Hmean|下载链接|
+|-|-|-|-|-|-|
+|SAST|ResNet50_vd|88.74%|79.80%|84.03%|[下载链接](https://paddleocr.bj.bcebos.com/SAST/sast_r50_vd_total_text.tar)|
+
+**说明：** SAST模型训练额外加入了icdar2013、icdar2017、COCO-Text、ArT等公开数据集进行调优。PaddleOCR用到的经过整理格式的英文公开数据集下载：[百度云地址](https://pan.baidu.com/s/12cPnZcVuV1zn5DOd4mqjVw) (提取码: 2bpi)
+
+PaddleOCR文本检测算法的训练和使用请参考文档教程中[模型训练/评估中的文本检测部分](./detection.md)。
+
+
+<a name="文本识别算法"></a>
+### 2.文本识别算法
+
+PaddleOCR开源的文本识别算法列表：
+- [x]  CRNN([paper](https://arxiv.org/abs/1507.05717))（ppocr推荐）
+- [x]  Rosetta([paper](https://arxiv.org/abs/1910.05085))
+- [x]  STAR-Net([paper](http://www.bmva.org/bmvc/2016/papers/paper043/index.html))
+- [x]  RARE([paper](https://arxiv.org/abs/1603.03915v1))
+- [x]  SRN([paper](https://arxiv.org/abs/2003.12294))
+
+参考[DTRB](https://arxiv.org/abs/1904.01906)文字识别训练和评估流程，使用MJSynth和SynthText两个文字识别数据集训练，在IIIT, SVT, IC03, IC13, IC15, SVTP, CUTE数据集上进行评估，算法效果如下：
+
+|模型|骨干网络|Avg Accuracy|模型存储命名|下载链接|
+|-|-|-|-|-|
+|Rosetta|Resnet34_vd|80.24%|rec_r34_vd_none_none_ctc|[下载链接](https://paddleocr.bj.bcebos.com/rec_r34_vd_none_none_ctc.tar)|
+|Rosetta|MobileNetV3|78.16%|rec_mv3_none_none_ctc|[下载链接](https://paddleocr.bj.bcebos.com/rec_mv3_none_none_ctc.tar)|
+|CRNN|Resnet34_vd|82.20%|rec_r34_vd_none_bilstm_ctc|[下载链接](https://paddleocr.bj.bcebos.com/rec_r34_vd_none_bilstm_ctc.tar)|
+|CRNN|MobileNetV3|79.37%|rec_mv3_none_bilstm_ctc|[下载链接](https://paddleocr.bj.bcebos.com/rec_mv3_none_bilstm_ctc.tar)|
+|STAR-Net|Resnet34_vd|83.93%|rec_r34_vd_tps_bilstm_ctc|[下载链接](https://paddleocr.bj.bcebos.com/rec_r34_vd_tps_bilstm_ctc.tar)|
+|STAR-Net|MobileNetV3|81.56%|rec_mv3_tps_bilstm_ctc|[下载链接](https://paddleocr.bj.bcebos.com/rec_mv3_tps_bilstm_ctc.tar)|
+|RARE|Resnet34_vd|84.90%|rec_r34_vd_tps_bilstm_attn|[下载链接](https://paddleocr.bj.bcebos.com/rec_r34_vd_tps_bilstm_attn.tar)|
+|RARE|MobileNetV3|83.32%|rec_mv3_tps_bilstm_attn|[下载链接](https://paddleocr.bj.bcebos.com/rec_mv3_tps_bilstm_attn.tar)|
+|SRN|Resnet50_vd_fpn|88.33%|rec_r50fpn_vd_none_srn|[下载链接](https://paddleocr.bj.bcebos.com/SRN/rec_r50fpn_vd_none_srn.tar)|
+
+**说明：** SRN模型使用了数据扰动方法对上述提到对两个训练集进行增广，增广后的数据可以在[百度网盘](https://pan.baidu.com/s/1-HSZ-ZVdqBF2HaBZ5pRAKA)上下载，提取码: y3ry。
+原始论文使用两阶段训练平均精度为89.74%，PaddleOCR中使用one-stage训练，平均精度为88.33%。两种预训练权重均在[下载链接](https://paddleocr.bj.bcebos.com/SRN/rec_r50fpn_vd_none_srn.tar)中。
+
+PaddleOCR文本识别算法的训练和使用请参考文档教程中[模型训练/评估中的文本识别部分](./recognition.md)。
--- a/doc/doc_ch/angle_class.md
+++ b/doc/doc_ch/angle_class.md
@ -0,0 +1,127 @@
+## 文字角度分类
+
+### 数据准备
+
+请按如下步骤设置数据集：
+
+训练数据的默认存储路径是 `PaddleOCR/train_data/cls`,如果您的磁盘上已有数据集，只需创建软链接至数据集目录：
+
+```
+ln -sf <path/to/dataset> <path/to/paddle_ocr>/train_data/cls/dataset
+```
+
+请参考下文组织您的数据。
+- 训练集
+
+首先请将训练图片放入同一个文件夹（train_images），并用一个txt文件（cls_gt_train.txt）记录图片路径和标签。
+
+**注意：** 默认请将图片路径和图片标签用 `\t` 分割，如用其他方式分割将造成训练报错
+
+0和180分别表示图片的角度为0度和180度
+
+```
+" 图像文件名                 图像标注信息 "
+
+train_data/cls/word_001.jpg   0
+train_data/cls/word_002.jpg   180
+```
+
+最终训练集应有如下文件结构：
+```
+|-train_data
+    |-cls
+        |- cls_gt_train.txt
+        |- train
+            |- word_001.png
+            |- word_002.jpg
+            |- word_003.jpg
+            | ...
+```
+
+- 测试集
+
+同训练集类似，测试集也需要提供一个包含所有图片的文件夹（test）和一个cls_gt_test.txt，测试集的结构如下所示：
+
+```
+|-train_data
+    |-cls
+        |- 和一个cls_gt_test.txt
+        |- test
+            |- word_001.jpg
+            |- word_002.jpg
+            |- word_003.jpg
+            | ...
+```
+
+### 启动训练
+
+PaddleOCR提供了训练脚本、评估脚本和预测脚本。
+
+开始训练:
+
+*如果您安装的是cpu版本，请将配置文件中的 `use_gpu` 字段修改为false*
+
+```
+# 设置PYTHONPATH路径
+export PYTHONPATH=$PYTHONPATH:.
+# GPU训练 支持单卡，多卡训练，通过CUDA_VISIBLE_DEVICES指定卡号
+export CUDA_VISIBLE_DEVICES=0,1,2,3
+# 启动训练
+python3 tools/train.py -c configs/cls/cls_mv3.yml
+```
+
+- 数据增强
+
+PaddleOCR提供了多种数据增强方式，如果您希望在训练时加入扰动，请在配置文件中设置 `distort: true`。
+
+默认的扰动方式有：颜色空间转换(cvtColor)、模糊(blur)、抖动(jitter)、噪声(Gasuss noise)、随机切割(random crop)、透视(perspective)、颜色反转(reverse),随机数据增强(RandAugment)。
+
+训练过程中除随机数据增强外每种扰动方式以50%的概率被选择，具体代码实现请参考：
+[randaugment.py](https://github.com/PaddlePaddle/PaddleOCR/blob/develop/ppocr/data/cls/randaugment.py)
+[img_tools.py](https://github.com/PaddlePaddle/PaddleOCR/blob/develop/ppocr/data/rec/img_tools.py)
+
+*由于OpenCV的兼容性问题，扰动操作暂时只支持linux*
+
+### 训练
+
+PaddleOCR支持训练和评估交替进行, 可以在 `configs/cls/cls_mv3.yml` 中修改 `eval_batch_step` 设置评估频率，默认每500个iter评估一次。评估过程中默认将最佳acc模型，保存为 `output/cls_mv3/best_accuracy` 。
+
+如果验证集很大，测试将会比较耗时，建议减少评估次数，或训练完再进行评估。
+
+**注意，预测/评估时的配置文件请务必与训练一致。**
+
+### 评估
+
+评估数据集可以通过`configs/cls/cls_reader.yml`  修改EvalReader中的 `label_file_path` 设置。
+
+*注意* 评估时必须确保配置文件中 infer_img 字段为空
+```
+export CUDA_VISIBLE_DEVICES=0
+# GPU 评估， Global.checkpoints 为待测权重
+python3 tools/eval.py -c configs/cls/cls_mv3.yml -o Global.checkpoints={path/to/weights}/best_accuracy
+```
+
+### 预测
+
+* 训练引擎的预测
+
+使用 PaddleOCR 训练好的模型，可以通过以下脚本进行快速预测。
+
+默认预测图片存储在 `infer_img` 里，通过 `-o Global.checkpoints` 指定权重：
+
+```
+# 预测分类结果
+python3 tools/infer_cls.py -c configs/cls/cls_mv3.yml -o Global.checkpoints={path/to/weights}/best_accuracy Global.infer_img=doc/imgs_words/en/word_1.png
+```
+
+预测图片：
+
+![](../imgs_words/en/word_1.png)
+
+得到输入图像的预测结果：
+
+```
+infer_img: doc/imgs_words/en/word_1.png
+    scores: [[0.93161047 0.06838956]]
+    label: [0]
+```
--- a/doc/doc_ch/benchmark.md
+++ b/doc/doc_ch/benchmark.md
@ -1,29 +1,51 @@
 # Benchmark

-本文给出了PaddleOCR超轻量中文模型（8.6M）在各平台的预测耗时benchmark。
+本文给出了中英文OCR系列模型精度指标和在各平台预测耗时的benchmark。

 ## 测试数据  
- 从中文公开数据集[ICDAR2017-RCTW](https://github.com/PaddlePaddle/PaddleOCR/blob/develop/doc/doc_ch/datasets.md#ICDAR2017-RCTW-17)中随机采样**500**张图像。  
-该集合大部分图片是通过手机摄像头在野外采集的。有些是截图。这些图片展示了各种各样的场景，包括街景、海报、菜单、室内场景和手机应用程序的截图。
+针对OCR实际应用场景，包括合同，车牌，铭牌，火车票，化验单，表格，证书，街景文字，名片，数码显示屏等，收集的300张图像，每张图平均有17个文本框，下图给出了一些图像示例。

-## 评估指标  
-在四种平台上的预测耗时指标如下：  
+<div align="center">
+<img src="../datasets/doc.jpg"  width = "1000" height = "500" />
+</div>

-|长边尺寸(px)|T4(s)|V100(s)|Intel至强6148(s)|骁龙855(s)|
-|-|-|-|-|-|
-|960|0.092|0.057|0.319|0.354|
-|640|0.067|0.045|0.198|0.236|
-|480|0.057|0.043|0.151|0.175| 
+## 评估指标  

 说明：
+- v1.0是未添加优化策略的DB+CRNN模型，v1.1是添加多种优化策略和方向分类器的PP-OCR模型。slim_v1.1是使用裁剪或量化的模型。
+- 检测输入图像的的长边尺寸是960。
 - 评估耗时阶段为图像输入到结果输出的完整阶段，包括了图像的预处理和后处理。  
- `Intel至强6148`为服务器端CPU型号，测试中使用Intel MKL-DNN 加速CPU预测速度，使用该操作需要：  
-    - 更新到飞桨latest版本：https://www.paddlepaddle.org.cn/documentation/docs/zh/install/Tables.html#whl-dev ，请根据自己环境的CUDA版本和Python版本选择相应的mkl版wheel包，如，CUDA10、Python3.7环境，应操作：
-    ```shell
-    # 获取安装包
-    wget https://paddle-wheel.bj.bcebos.com/0.0.0-gpu-cuda10-cudnn7-mkl/paddlepaddle_gpu-0.0.0-cp37-cp37m-linux_x86_64.whl
-    # 安装
-    pip3.7 install paddlepaddle_gpu-0.0.0-cp37-cp37m-linux_x86_64.whl
-    ```
-    - 预测时使用参数打开加速开关： `--enable_mkldnn True`  
+- `Intel至强6148`为服务器端CPU型号，测试中使用Intel MKL-DNN 加速。
 - `骁龙855`为移动端处理平台型号。  
+
+不同预测模型大小和整体识别精度对比
+
+| 模型名称                     | 整体模型<br>大小\(M\) | 检测模型<br>大小\(M\) | 方向分类器<br>模型大小\(M\) | 识别模型<br>大小\(M\) | 整体识别<br>F\-score |
+|:-:|:-:|:-:|:-:|:-:|:-:|
+| ch\_ppocr\_mobile\_v1\.1 | 8\.1        | 2\.6        | 0\.9           | 4\.6        | 0\.5193      |
+| ch\_ppocr\_server\_v1\.1 | 155\.1      | 47\.2       | 0\.9           | 107         | 0\.5414      |
+| ch\_ppocr\_mobile\_v1\.0 | 8\.6        | 4\.1        | \-             | 4\.5        | 0\.393       |
+| ch\_ppocr\_server\_v1\.0 | 203\.8      | 98\.5       | \-             | 105\.3      | 0\.4436      |
+
+不同预测模型在T4 GPU上预测速度对比，单位ms
+
+| 模型名称                     | 整体  | 检测 | 方向分类器 | 识别  |
+|:-:|:-:|:-:|:-:|:-:|
+| ch\_ppocr\_mobile\_v1\.1 | 137 | 35 | 24    | 78  |
+| ch\_ppocr\_server\_v1\.1 | 204 | 39 | 25    | 140 |
+| ch\_ppocr\_mobile\_v1\.0 | 117 | 41 | \-    | 76  |
+| ch\_ppocr\_server\_v1\.0 | 199 | 52 | \-    | 147 |
+
+不同预测模型在CPU上预测速度对比，单位ms
+
+| 模型名称                     | 整体   | 检测  | 方向分类器 | 识别  |
+|:-:|:-:|:-:|:-:|:-:|
+| ch\_ppocr\_mobile\_v1\.1 | 421  | 164 | 51    | 206 |
+| ch\_ppocr\_mobile\_v1\.0 | 398  | 219 | \-    | 179 |
+
+裁剪量化模型和原始模型模型大小，整体识别精度和在SD 855上预测速度对比
+
+| 模型名称                           | 整体模型<br>大小\(M\) | 检测模型<br>大小\(M\) | 方向分类器<br>模型大小\(M\) | 识别模型<br>大小\(M\) | 整体识别<br>F\-score | SD 855<br>\(ms\) |
+|:-:|:-:|:-:|:-:|:-:|:-:|:-:|
+| ch\_ppocr\_mobile\_v1\.1       | 8\.1        | 2\.6        | 0\.9           | 4\.6        | 0\.5193      | 306          |
+| ch\_ppocr\_mobile\_slim\_v1\.1 | 3\.5        | 1\.4        | 0\.5           | 1\.6        | 0\.521       | 268          |
--- a/doc/doc_ch/config.md
+++ b/doc/doc_ch/config.md
@ -10,7 +10,7 @@

 ## 配置文件 Global 参数介绍

-以 `rec_chinese_lite_train.yml` 为例
+以 `rec_chinese_lite_train_v1.1.yml ` 为例


 |         字段             |            用途                |      默认值       |            备注            |
@ -32,6 +32,7 @@
 |      loss_type           |    设置 loss 类型              |       ctc         |    支持两种loss： ctc / attention |
 |       distort            |    设置是否使用数据增强          |       false       |  设置为true时，将在训练时随机进行扰动，支持的扰动操作可阅读[img_tools.py](https://github.com/PaddlePaddle/PaddleOCR/blob/develop/ppocr/data/rec/img_tools.py)                 |
 |       use_space_char     |    设置是否识别空格             |        false      |          仅在 character_type=ch 时支持空格                 |
+|      label_list          |    设置方向分类器支持的角度       |    ['0','180']    |     仅在方向分类器中生效 |
 |      average_window      |    ModelAverage优化器中的窗口长度计算比例 |  0.15       |       目前仅应用与SRN |
 |      max_average_window  |    平均值计算窗口长度的最大值   |   15625              | 推荐设置为一轮训练中mini-batchs的数目|
 |      min_average_window  |    平均值计算窗口长度的最小值  |    10000              |      \          |
--- a/doc/doc_ch/customize.md
+++ b/doc/doc_ch/customize.md
@ -6,7 +6,7 @@

 PaddleOCR提供了EAST、DB两种文本检测算法，均支持MobileNetV3、ResNet50_vd两种骨干网络，根据需要选择相应的配置文件，启动训练。例如，训练使用MobileNetV3作为骨干网络的DB检测模型（即超轻量模型使用的配置）：
 ```
-python3 tools/train.py -c configs/det/det_mv3_db.yml
+python3 tools/train.py -c configs/det/det_mv3_db.yml 2>&1 | tee det_db.log
 ```
 更详细的数据准备和训练教程参考文档教程中[文本检测模型训练/评估/预测](./detection.md)。

@ -14,7 +14,7 @@ python3 tools/train.py -c configs/det/det_mv3_db.yml

 PaddleOCR提供了CRNN、Rosetta、STAR-Net、RARE四种文本识别算法，均支持MobileNetV3、ResNet34_vd两种骨干网络，根据需要选择相应的配置文件，启动训练。例如，训练使用MobileNetV3作为骨干网络的CRNN识别模型（即超轻量模型使用的配置）：
 ```
-python3 tools/train.py -c configs/rec/rec_chinese_lite_train.yml
+python3 tools/train.py -c configs/rec/rec_chinese_lite_train.yml 2>&1 | tee rec_ch_lite.log
 ```
 更详细的数据准备和训练教程参考文档教程中[文本识别模型训练/评估/预测](./recognition.md)。

--- a/doc/doc_ch/data_annotation.md
+++ b/doc/doc_ch/data_annotation.md
@ -19,3 +19,9 @@
 - 工具地址：https://github.com/wkentaro/labelme
 - 示意图：  
    ![](../datasets/labelme.jpg)  
+
+### 4. Vott
+- 工具描述：支持矩形,多边形等图片标注.支持视频标注.方便使用的快捷键以及比较好看的界面.同时支持导出多种标签格式.
+- 工具地址：https://github.com/microsoft/VoTT
+- 示意图：  
+    ![](../datasets/VoTT.jpg)  
--- a/doc/doc_ch/detection.md
+++ b/doc/doc_ch/detection.md
@ -14,6 +14,15 @@ wget -P ./train_data/  https://paddleocr.bj.bcebos.com/dataset/train_icdar2015_l
 wget -P ./train_data/  https://paddleocr.bj.bcebos.com/dataset/test_icdar2015_label.txt
 ```

+PaddleOCR 也提供了数据格式转换脚本，可以将官网 label 转换支持的数据格式。 数据转换工具在 `train_data/gen_label.py`, 这里以训练集为例：
+
+```
+# 将官网下载的标签文件转换为 train_icdar2015_label.txt
+python gen_label.py --mode="det" --root_path="icdar_c4_train_imgs/"  \
+                    --input_path="ch4_training_localization_transcription_gt" \
+                    --output_label="train_icdar2015_label.txt"
+```
+
 解压数据集和下载标注文件后，PaddleOCR/train_data/ 有两个文件夹和两个文件，分别是：
 ```
 /PaddleOCR/train_data/icdar2015/text_localization/
@ -35,13 +44,15 @@ json.dumps编码前的图像标注信息是包含多个字典的list，字典中

 ## 快速启动训练

-首先下载模型backbone的pretrain model，PaddleOCR的检测模型目前支持两种backbone，分别是MobileNetV3、ResNet50_vd，
+首先下载模型backbone的pretrain model，PaddleOCR的检测模型目前支持两种backbone，分别是MobileNetV3、ResNet_vd系列，
 您可以根据需求使用[PaddleClas](https://github.com/PaddlePaddle/PaddleClas/tree/master/ppcls/modeling/architectures)中的模型更换backbone。
 ```shell
 cd PaddleOCR/
 # 下载MobileNetV3的预训练模型
 wget -P ./pretrain_models/ https://paddle-imagenet-models-name.bj.bcebos.com/MobileNetV3_large_x0_5_pretrained.tar
-# 下载ResNet50的预训练模型
+# 或，下载ResNet18_vd的预训练模型
+wget -P ./pretrain_models/ https://paddle-imagenet-models-name.bj.bcebos.com/ResNet18_vd_pretrained.tar
+# 或，下载ResNet50_vd的预训练模型
 wget -P ./pretrain_models/ https://paddle-imagenet-models-name.bj.bcebos.com/ResNet50_vd_ssld_pretrained.tar

 # 解压预训练模型文件，以MobileNetV3为例
@ -62,22 +73,25 @@ tar -xf ./pretrain_models/MobileNetV3_large_x0_5_pretrained.tar ./pretrain_model
 *如果您安装的是cpu版本，请将配置文件中的 `use_gpu` 字段修改为false*

 ```shell
-python3 tools/train.py -c configs/det/det_mv3_db.yml -o Global.pretrain_weights=./pretrain_models/MobileNetV3_large_x0_5_pretrained/
+# 训练 mv3_db 模型，并将训练日志保存为 tain_det.log
+python3 tools/train.py -c configs/det/det_mv3_db_v1.1.yml \
+     -o Global.pretrain_weights=./pretrain_models/MobileNetV3_large_x0_5_pretrained/ \
+     2>&1 | tee train_det.log
 ```

-上述指令中，通过-c 选择训练使用configs/det/det_db_mv3.yml配置文件。
+上述指令中，通过-c 选择训练使用configs/det/det_db_mv3_v1.1.yml配置文件。
 有关配置文件的详细解释，请参考[链接](./config.md)。

 您也可以通过-o参数在不需要修改yml文件的情况下，改变训练的参数，比如，调整训练的学习率为0.0001
 ```shell
-python3 tools/train.py -c configs/det/det_mv3_db.yml -o Optimizer.base_lr=0.0001
+python3 tools/train.py -c configs/det/det_mv3_db_v1.1.yml -o Optimizer.base_lr=0.0001
 ```

 #### 断点训练

 如果训练程序中断，如果希望加载训练中断的模型从而恢复训练，可以通过指定Global.checkpoints指定要加载的模型路径：
 ```shell
-python3 tools/train.py -c configs/det/det_mv3_db.yml -o Global.checkpoints=./your/trained/model
+python3 tools/train.py -c configs/det/det_mv3_db_v1.1.yml -o Global.checkpoints=./your/trained/model
 ```

 **注意**：`Global.checkpoints`的优先级高于`Global.pretrain_weights`的优先级，即同时指定两个参数时，优先加载`Global.checkpoints`指定的模型，如果`Global.checkpoints`指定的模型路径有误，会加载`Global.pretrain_weights`指定的模型。
@ -86,17 +100,17 @@ python3 tools/train.py -c configs/det/det_mv3_db.yml -o Global.checkpoints=./you

 PaddleOCR计算三个OCR检测相关的指标，分别是：Precision、Recall、Hmean。

-运行如下代码，根据配置文件`det_db_mv3.yml`中`save_res_path`指定的测试集检测结果文件，计算评估指标。
+运行如下代码，根据配置文件`det_db_mv3_v1.1.yml`中`save_res_path`指定的测试集检测结果文件，计算评估指标。

 评估时设置后处理参数`box_thresh=0.6`，`unclip_ratio=1.5`，使用不同数据集、不同模型训练，可调整这两个参数进行优化
 ```shell
-python3 tools/eval.py -c configs/det/det_mv3_db.yml  -o Global.checkpoints="{path/to/weights}/best_accuracy" PostProcess.box_thresh=0.6 PostProcess.unclip_ratio=1.5
+python3 tools/eval.py -c configs/det/det_mv3_db_v1.1.yml  -o Global.checkpoints="{path/to/weights}/best_accuracy" PostProcess.box_thresh=0.6 PostProcess.unclip_ratio=1.5
 ```
 训练中模型参数默认保存在`Global.save_model_dir`目录下。在评估指标时，需要设置`Global.checkpoints`指向保存的参数文件。

 比如：
 ```shell
-python3 tools/eval.py -c configs/det/det_mv3_db.yml  -o Global.checkpoints="./output/det_db/best_accuracy" PostProcess.box_thresh=0.6 PostProcess.unclip_ratio=1.5
+python3 tools/eval.py -c configs/det/det_mv3_db_v1.1.yml  -o Global.checkpoints="./output/det_db/best_accuracy" PostProcess.box_thresh=0.6 PostProcess.unclip_ratio=1.5
 ```

 * 注：`box_thresh`、`unclip_ratio`是DB后处理所需要的参数，在评估EAST模型时不需要设置
@ -105,16 +119,16 @@ python3 tools/eval.py -c configs/det/det_mv3_db.yml  -o Global.checkpoints="./ou

 测试单张图像的检测效果
 ```shell
-python3 tools/infer_det.py -c configs/det/det_mv3_db.yml -o TestReader.infer_img="./doc/imgs_en/img_10.jpg" Global.checkpoints="./output/det_db/best_accuracy"
+python3 tools/infer_det.py -c configs/det/det_mv3_db_v1.1.yml -o TestReader.infer_img="./doc/imgs_en/img_10.jpg" Global.checkpoints="./output/det_db/best_accuracy"
 ```

 测试DB模型时，调整后处理阈值，
 ```shell
-python3 tools/infer_det.py -c configs/det/det_mv3_db.yml -o TestReader.infer_img="./doc/imgs_en/img_10.jpg" Global.checkpoints="./output/det_db/best_accuracy" PostProcess.box_thresh=0.6 PostProcess.unclip_ratio=1.5
+python3 tools/infer_det.py -c configs/det/det_mv3_db_v1.1.yml -o TestReader.infer_img="./doc/imgs_en/img_10.jpg" Global.checkpoints="./output/det_db/best_accuracy" PostProcess.box_thresh=0.6 PostProcess.unclip_ratio=1.5
 ```


 测试文件夹下所有图像的检测效果
 ```shell
-python3 tools/infer_det.py -c configs/det/det_mv3_db.yml -o TestReader.infer_img="./doc/imgs_en/" Global.checkpoints="./output/det_db/best_accuracy"
+python3 tools/infer_det.py -c configs/det/det_mv3_db_v1.1.yml -o TestReader.infer_img="./doc/imgs_en/" Global.checkpoints="./output/det_db/best_accuracy"
 ```
--- a/doc/doc_ch/framework.png
+++ b/doc/doc_ch/framework.png
--- a/doc/doc_ch/inference.md
+++ b/doc/doc_ch/inference.md
@ -3,7 +3,7 @@

 inference 模型（`fluid.io.save_inference_model`保存的模型）
 一般是模型训练完成后保存的固化模型，多用于预测部署。训练过程中保存的模型是checkpoints模型，保存的是模型的参数，多用于恢复训练等。
-与checkpoints模型相比，inference 模型会额外保存模型的结构信息，在预测部署、加速推理上性能优越，灵活方便，适合与实际系统集成。更详细的介绍请参考文档[分类预测框架](https://paddleclas.readthedocs.io/zh_CN/latest/extension/paddle_inference.html).
+与checkpoints模型相比，inference 模型会额外保存模型的结构信息，在预测部署、加速推理上性能优越，灵活方便，适合与实际系统集成。更详细的介绍请参考文档[分类预测框架](https://github.com/PaddlePaddle/PaddleClas/blob/master/docs/zh_CN/extension/paddle_inference.md).

 接下来首先介绍如何将训练的模型转换成inference模型，然后将依次介绍文本检测、文本识别以及两者串联基于预测引擎推理。

@ -11,6 +11,7 @@ inference 模型（`fluid.io.save_inference_model`保存的模型）
 - [一、训练模型转inference模型](#训练模型转inference模型)
    - [检测模型转inference模型](#检测模型转inference模型)
    - [识别模型转inference模型](#识别模型转inference模型)  
+    - [方向分类模型转inference模型](#方向分类模型转inference模型)  

 - [二、文本检测模型推理](#文本检测模型推理)
    - [1. 超轻量中文检测模型推理](#超轻量中文检测模型推理)
@ -22,9 +23,14 @@ inference 模型（`fluid.io.save_inference_model`保存的模型）
    - [1. 超轻量中文识别模型推理](#超轻量中文识别模型推理)
    - [2. 基于CTC损失的识别模型推理](#基于CTC损失的识别模型推理)
    - [3. 基于Attention损失的识别模型推理](#基于Attention损失的识别模型推理)
-    - [4. 自定义文本识别字典的推理](#自定义文本识别字典的推理)  
+    - [4. 基于SRN损失的识别模型推理](#基于SRN损失的识别模型推理)
+    - [5. 自定义文本识别字典的推理](#自定义文本识别字典的推理)
+    - [6. 多语言模型的推理](#多语言模型的推理)

- [四、文本检测、识别串联推理](#文本检测、识别串联推理)
+- [四、方向分类模型推理](#方向识别模型推理)
+    - [1. 方向分类模型推理](#方向分类模型推理)
+
+- [五、文本检测、方向分类和文字识别串联推理](#文本检测、方向分类和文字识别串联推理)
    - [1. 超轻量中文OCR模型推理](#超轻量中文OCR模型推理)
    - [2. 其他模型推理](#其他模型推理)

@ -36,7 +42,7 @@ inference 模型（`fluid.io.save_inference_model`保存的模型）

 下载超轻量级中文检测模型：
 ```
-wget -P ./ch_lite/ https://paddleocr.bj.bcebos.com/ch_models/ch_det_mv3_db.tar && tar xf ./ch_lite/ch_det_mv3_db.tar -C ./ch_lite/
+wget -P ./ch_lite/ https://paddleocr.bj.bcebos.com/20-09-22/mobile/det/ch_ppocr_mobile_v1.1_det_train.tar && tar xf ./ch_lite/ch_ppocr_mobile_v1.1_det_train.tar -C ./ch_lite/
 ```
 上述模型是以MobileNetV3为backbone训练的DB算法，将训练好的模型转换成inference模型只需要运行如下命令：
 ```
@ -45,7 +51,7 @@ wget -P ./ch_lite/ https://paddleocr.bj.bcebos.com/ch_models/ch_det_mv3_db.tar &
 # Global.checkpoints参数设置待转换的训练模型地址，不用添加文件后缀.pdmodel，.pdopt或.pdparams。
 # Global.save_inference_dir参数设置转换的模型将保存的地址。

-python3 tools/export_model.py -c configs/det/det_mv3_db.yml -o Global.checkpoints=./ch_lite/det_mv3_db/best_accuracy Global.save_inference_dir=./inference/det_db/
+python3 tools/export_model.py -c configs/det/det_mv3_db_v1.1.yml -o Global.checkpoints=./ch_lite/ch_ppocr_mobile_v1.1_det_train/best_accuracy Global.save_inference_dir=./inference/det_db/
 ```
 转inference模型时，使用的配置文件和训练时使用的配置文件相同。另外，还需要设置配置文件中的`Global.checkpoints`、`Global.save_inference_dir`参数。
 其中`Global.checkpoints`指向训练中保存的模型参数文件，`Global.save_inference_dir`是生成的inference模型要保存的目录。
@ -61,7 +67,7 @@ inference/det_db/

 下载超轻量中文识别模型：
 ```
-wget -P ./ch_lite/ https://paddleocr.bj.bcebos.com/ch_models/ch_rec_mv3_crnn.tar && tar xf ./ch_lite/ch_rec_mv3_crnn.tar -C ./ch_lite/
+wget -P ./ch_lite/ https://paddleocr.bj.bcebos.com/20-09-22/mobile/rec/ch_ppocr_mobile_v1.1_rec_train.tar && tar xf ./ch_lite/ch_ppocr_mobile_v1.1_rec_train.tar -C ./ch_lite/
 ```

 识别模型转inference模型与检测的方式相同，如下：
@ -71,7 +77,7 @@ wget -P ./ch_lite/ https://paddleocr.bj.bcebos.com/ch_models/ch_rec_mv3_crnn.tar
 # Global.checkpoints参数设置待转换的训练模型地址，不用添加文件后缀.pdmodel，.pdopt或.pdparams。
 # Global.save_inference_dir参数设置转换的模型将保存的地址。

-python3 tools/export_model.py -c configs/rec/rec_chinese_lite_train.yml -o Global.checkpoints=./ch_lite/rec_mv3_crnn/best_accuracy \
+python3 tools/export_model.py -c configs/rec/ch_ppocr_v1.1/rec_chinese_lite_train_v1.1.yml -o Global.checkpoints=./ch_lite/ch_ppocr_mobile_v1.1_rec_train/best_accuracy \
        Global.save_inference_dir=./inference/rec_crnn/
 ```

@ -84,6 +90,32 @@ python3 tools/export_model.py -c configs/rec/rec_chinese_lite_train.yml -o Globa
  └─  params    识别inference模型的参数文件
 ```

+<a name="方向分类模型转inference模型"></a>
+### 方向分类模型转inference模型
+
+下载方向分类模型：
+```
+wget -P ./ch_lite/ https://paddleocr.bj.bcebos.com/20-09-22/cls/ch_ppocr_mobile_v1.1_cls_train.tar && tar xf ./ch_lite/ch_ppocr_mobile_v1.1_cls_train.tar -C ./ch_lite/
+```
+
+方向分类模型转inference模型与检测的方式相同，如下：
+```
+# -c后面设置训练算法的yml配置文件
+# -o配置可选参数
+# Global.checkpoints参数设置待转换的训练模型地址，不用添加文件后缀.pdmodel，.pdopt或.pdparams。
+# Global.save_inference_dir参数设置转换的模型将保存的地址。
+
+python3 tools/export_model.py -c configs/cls/cls_mv3.yml -o Global.checkpoints=./ch_lite/ch_ppocr_mobile_v1.1_cls_train/best_accuracy \
+        Global.save_inference_dir=./inference/cls/
+```
+
+转换成功后，在目录下有两个文件：
+```
+/inference/cls/
+  └─  model     识别inference模型的program文件
+  └─  params    识别inference模型的参数文件
+```
+
 <a name="文本检测模型推理"></a>
 ## 二、文本检测模型推理

@ -266,26 +298,83 @@ Predicts of ./doc/imgs_words_en/word_336.png:['super', 0.9999555]
 self.character_str = "0123456789abcdefghijklmnopqrstuvwxyz"
 dict_character = list(self.character_str)
 ```
+<a name="基于SRN损失的识别模型推理"></a>
+### 4. 基于SRN损失的识别模型推理
+
+基于SRN损失的识别模型，需要额外设置识别算法参数 --rec_algorithm="SRN"。 同时需要保证预测shape与训练时一致，如： --rec_image_shape="1, 64, 256"
+
+```
+python3 tools/infer/predict_rec.py --image_dir="./doc/imgs_words_en/word_336.png" \
+                                   --rec_model_dir="./inference/srn/" \
+                                   --rec_image_shape="1, 64, 256" \
+                                   --rec_char_type="en" \
+                                   --rec_algorithm="SRN"
+```

 <a name="自定义文本识别字典的推理"></a>
-### 4. 自定义文本识别字典的推理
+### 5. 自定义文本识别字典的推理
 如果训练时修改了文本的字典，在使用inference模型预测时，需要通过`--rec_char_dict_path`指定使用的字典路径

 ```
 python3 tools/infer/predict_rec.py --image_dir="./doc/imgs_words_en/word_336.png" --rec_model_dir="./your inference model" --rec_image_shape="3, 32, 100" --rec_char_type="en" --rec_char_dict_path="your text dict path"
 ```

-<a name="文本检测、识别串联推理"></a>
-## 四、文本检测、识别串联推理
+<a name="多语言模型的推理"></a>
+### 6. 多语言模型的推理
+如果您需要预测的是其他语言模型，在使用inference模型预测时，需要通过`--rec_char_dict_path`指定使用的字典路径, 同时为了得到正确的可视化结果，
+需要通过 `--vis_font_path` 指定可视化的字体路径，`doc/` 路径下有默认提供的小语种字体，例如韩文识别：
+
+```
+python3 tools/infer/predict_rec.py --image_dir="./doc/imgs_words/korean/1.jpg" --rec_model_dir="./your inference model" --rec_char_type="korean" --rec_char_dict_path="ppocr/utils/dict/korean_dict.txt" --vis_font_path="doc/korean.ttf"
+```
+![](../imgs_words/korean/1.jpg)
+
+执行命令后，上图的预测结果为：
+``` text
+2020-09-19 16:15:05,076-INFO: 	 index: [205 206  38  39]
+2020-09-19 16:15:05,077-INFO: 	 word : 바탕으로
+2020-09-19 16:15:05,077-INFO: 	 score: 0.9171358942985535
+```
+
+<a name="方向分类模型推理"></a>
+## 四、方向分类模型推理
+
+下面将介绍方向分类模型推理。
+
+<a name="方向分类模型推理"></a>
+### 1. 方向分类模型推理
+
+方向分类模型推理，可以执行如下命令：
+
+```
+python3 tools/infer/predict_cls.py --image_dir="./doc/imgs_words/ch/word_4.jpg" --cls_model_dir="./inference/cls/"
+```
+
+![](../imgs_words/ch/word_4.jpg)
+
+执行命令后，上面图像的预测结果（分类的方向和得分）会打印到屏幕上，示例如下：
+
+Predicts of ./doc/imgs_words/ch/word_4.jpg:['0', 0.9999963]
+
+<a name="文本检测、方向分类和文字识别串联推理"></a>
+## 五、文本检测、方向分类和文字识别串联推理
 <a name="超轻量中文OCR模型推理"></a>
 ### 1. 超轻量中文OCR模型推理

-在执行预测时，需要通过参数image_dir指定单张图像或者图像集合的路径、参数det_model_dir指定检测inference模型的路径和参数rec_model_dir指定识别inference模型的路径。可视化识别结果默认保存到 ./inference_results 文件夹里面。
+在执行预测时，需要通过参数`image_dir`指定单张图像或者图像集合的路径、参数`det_model_dir`,`cls_model_dir`和`rec_model_dir`分别指定检测，方向分类和识别的inference模型路径。参数`use_angle_cls`用于控制是否启用方向分类模型。可视化识别结果默认保存到 ./inference_results 文件夹里面。

 ```
-python3 tools/infer/predict_system.py --image_dir="./doc/imgs/2.jpg" --det_model_dir="./inference/det_db/"  --rec_model_dir="./inference/rec_crnn/"
+# 使用方向分类器
+python3 tools/infer/predict_system.py --image_dir="./doc/imgs/2.jpg" --det_model_dir="./inference/det_db/" --cls_model_dir="./inference/cls/" --rec_model_dir="./inference/rec_crnn/" --use_angle_cls=true
+
+# 不使用方向分类器
+python3 tools/infer/predict_system.py --image_dir="./doc/imgs/2.jpg" --det_model_dir="./inference/det_db/" --rec_model_dir="./inference/rec_crnn/" --use_angle_cls=false
 ```

+
+
+
+
 执行命令后，识别结果图像如下：

 ![](../imgs_results/2.jpg)
--- a/doc/doc_ch/installation.md
+++ b/doc/doc_ch/installation.md
@ -2,12 +2,12 @@

 经测试PaddleOCR可在glibc 2.23上运行，您也可以测试其他glibc版本或安装glic 2.23
 PaddleOCR 工作环境
- PaddlePaddle 1.7+
+- PaddlePaddle 1.8+ ，推荐使用 PaddlePaddle 2.0.0.beta
 - python3.7
 - glibc 2.23
 - cuDNN 7.6+ (GPU)

-建议使用我们提供的docker运行PaddleOCR，有关docker、nvidia-docker使用请参考[链接](https://docs.docker.com/get-started/)。
+建议使用我们提供的docker运行PaddleOCR，有关docker、nvidia-docker使用请参考[链接](https://www.runoob.com/docker/docker-tutorial.html/)。

 *如您希望使用 mac 或 windows直接运行预测代码，可以从第2步开始执行。*

@ -47,19 +47,16 @@ docker images
 hub.baidubce.com/paddlepaddle/paddle   latest-gpu-cuda9.0-cudnn7-dev    f56310dcc829
 ```

-**2. 安装PaddlePaddle Fluid v1.7**
+**2. 安装PaddlePaddle Fluid v2.0**
 ```
 pip3 install --upgrade pip

-如果您的机器安装的是CUDA9，请运行以下命令安装
-python3 -m pip install paddlepaddle-gpu==1.7.2.post97 -i https://pypi.tuna.tsinghua.edu.cn/simple
-
-如果您的机器安装的是CUDA10，请运行以下命令安装
-python3 -m pip install paddlepaddle-gpu==1.7.2.post107 -i https://pypi.tuna.tsinghua.edu.cn/simple
+如果您的机器安装的是CUDA9或CUDA10，请运行以下命令安装
+python3 -m pip install paddlepaddle-gpu==2.0.0b0 -i https://mirror.baidu.com/pypi/simple

 如果您的机器是CPU，请运行以下命令安装

-python3 -m pip install paddlepaddle==1.7.2 -i https://pypi.tuna.tsinghua.edu.cn/simple
+python3 -m pip install paddlepaddle==2.0.0b0 -i https://mirror.baidu.com/pypi/simple

 更多的版本需求，请参照[安装文档](https://www.paddlepaddle.org.cn/install/quick)中的说明进行操作。
 ```
--- a/doc/doc_ch/models_list.md
+++ b/doc/doc_ch/models_list.md
@ -0,0 +1,71 @@
+## OCR模型列表（V1.1，9月22日更新）
+
+- [一、文本检测模型](#文本检测模型)
+- [二、文本识别模型](#文本识别模型)
+    - [1. 中文识别模型](#中文识别模型)
+    - [2. 英文识别模型](#英文识别模型)
+    - [3. 多语言识别模型](#多语言识别模型)
+- [三、文本方向分类模型](#文本方向分类模型)
+
+PaddleOCR提供的可下载模型包括`推理模型`、`训练模型`、`预训练模型`、`slim模型`，模型区别说明如下：
+
+|模型类型|模型格式|简介|
+|-|-|-|
+|推理模型|model、params|用于python预测引擎推理，[详情](./inference.md)|
+|训练模型、预训练模型|\*.pdmodel、\*.pdopt、\*.pdparams|训练过程中保存的checkpoints模型，保存的是模型的参数，多用于模型指标评估和恢复训练|
+|slim模型|\*.nb|用于lite部署|
+
+
+<a name="文本检测模型"></a>
+### 一、文本检测模型
+|模型名称|模型简介|配置文件|推理模型大小|下载地址|
+|-|-|-|-|-|
+|ch_ppocr_mobile_slim_v1.1_det|slim裁剪版超轻量模型，支持中英文、多语种文本检测|[det_mv3_db_v1.1.yml](../../configs/det/det_mv3_db_v1.1.yml)|1.4M|[推理模型](https://paddleocr.bj.bcebos.com/20-09-22/mobile-slim/det/ch_ppocr_mobile_v1.1_det_prune_infer.tar) / [slim模型](https://paddleocr.bj.bcebos.com/20-09-22/mobile/lite/ch_ppocr_mobile_v1.1_det_prune_opt.nb)|
+|ch_ppocr_mobile_v1.1_det|原始超轻量模型，支持中英文、多语种文本检测|[det_mv3_db_v1.1.yml](../../configs/det/det_mv3_db_v1.1.yml)|2.6M|[推理模型](https://paddleocr.bj.bcebos.com/20-09-22/mobile/det/ch_ppocr_mobile_v1.1_det_infer.tar) / [训练模型](https://paddleocr.bj.bcebos.com/20-09-22/mobile/det/ch_ppocr_mobile_v1.1_det_train.tar)|
+|ch_ppocr_server_v1.1_det|通用模型，支持中英文、多语种文本检测，比超轻量模型更大，但效果更好|[det_r18_vd_db_v1.1.yml](../../configs/det/det_r18_vd_db_v1.1.yml)|47.2M|[推理模型](https://paddleocr.bj.bcebos.com/20-09-22/server/det/ch_ppocr_server_v1.1_det_infer.tar) / [训练模型](https://paddleocr.bj.bcebos.com/20-09-22/server/det/ch_ppocr_server_v1.1_det_train.tar)|
+
+
+<a name="文本识别模型"></a>
+### 二、文本识别模型
+
+<a name="中文识别模型"></a>
+#### 1. 中文识别模型
+|模型名称|模型简介|配置文件|推理模型大小|下载地址|
+|-|-|-|-|-|
+|ch_ppocr_mobile_slim_v1.1_rec|slim裁剪量化版超轻量模型，支持中英文、数字识别|[rec_chinese_lite_train_v1.1.yml](../../configs/rec/ch_ppocr_v1.1/rec_chinese_lite_train_v1.1.yml)|1.6M|[推理模型](https://paddleocr.bj.bcebos.com/20-09-22/mobile-slim/rec/ch_ppocr_mobile_v1.1_rec_quant_infer.tar) / [slim模型](https://paddleocr.bj.bcebos.com/20-09-22/mobile/lite/ch_ppocr_mobile_v1.1_rec_quant_opt.nb) |
+|ch_ppocr_mobile_v1.1_rec|原始超轻量模型，支持中英文、数字识别|[rec_chinese_lite_train_v1.1.yml](../../configs/rec/ch_ppocr_v1.1/rec_chinese_lite_train_v1.1.yml)|4.6M|[推理模型](https://paddleocr.bj.bcebos.com/20-09-22/mobile/rec/ch_ppocr_mobile_v1.1_rec_infer.tar) / [训练模型](https://paddleocr.bj.bcebos.com/20-09-22/mobile/rec/ch_ppocr_mobile_v1.1_rec_train.tar) / [预训练模型](https://paddleocr.bj.bcebos.com/20-09-22/mobile/rec/ch_ppocr_mobile_v1.1_rec_pre.tar) |
+|ch_ppocr_server_v1.1_rec|通用模型，支持中英文、数字识别|[rec_chinese_common_train_v1.1.yml](../../configs/rec/ch_ppocr_v1.1/rec_chinese_common_train_v1.1.yml)|105M|[推理模型](https://paddleocr.bj.bcebos.com/20-09-22/server/rec/ch_ppocr_server_v1.1_rec_infer.tar) / [训练模型](https://paddleocr.bj.bcebos.com/20-09-22/server/rec/ch_ppocr_server_v1.1_rec_train.tar) / [预训练模型](https://paddleocr.bj.bcebos.com/20-09-22/server/rec/ch_ppocr_server_v1.1_rec_pre.tar) |
+
+**说明：** `训练模型`是基于预训练模型在真实数据与竖排合成文本数据上finetune得到的模型，在真实应用场景中有着更好的表现，`预训练模型`则是直接基于全量真实数据与合成数据训练得到，更适合用于在自己的数据集上finetune。
+
+<a name="英文识别模型"></a>
+#### 2. 英文识别模型
+|模型名称|模型简介|配置文件|推理模型大小|下载地址|
+|-|-|-|-|-|
+|en_ppocr_mobile_slim_v1.1_rec|slim裁剪量化版超轻量模型，支持英文、数字识别|[rec_en_lite_train.yml](../../configs/rec/multi_languages/rec_en_lite_train.yml)|0.9M|[推理模型](https://paddleocr.bj.bcebos.com/20-09-22/mobile-slim/en/en_ppocr_mobile_v1.1_rec_quant_infer.tar) / [slim模型](https://paddleocr.bj.bcebos.com/20-09-22/mobile-slim/en/en_ppocr_mobile_v1.1_rec_quant_opt.nb) |
+|en_ppocr_mobile_v1.1_rec|原始超轻量模型，支持英文、数字识别|[rec_en_lite_train.yml](../../configs/rec/multi_languages/rec_en_lite_train.yml)|2.0M|[推理模型](https://paddleocr.bj.bcebos.com/20-09-22/mobile/en/en_ppocr_mobile_v1.1_rec_infer.tar) / [训练模型](https://paddleocr.bj.bcebos.com/20-09-22/mobile/en/en_ppocr_mobile_v1.1_rec_train.tar) |
+
+<a name="多语言识别模型"></a>
+#### 3. 多语言识别模型（更多语言持续更新中...）
+|模型名称|模型简介|配置文件|推理模型大小|下载地址|
+|-|-|-|-|-|
+| french_ppocr_mobile_v1.1_rec |法文识别|[rec_french_lite_train.yml](../../configs/rec/multi_languages/rec_french_lite_train.yml)|2.1M|[推理模型](https://paddleocr.bj.bcebos.com/20-09-22/mobile/fr/french_ppocr_mobile_v1.1_rec_infer.tar) / [训练模型](https://paddleocr.bj.bcebos.com/20-09-22/mobile/fr/french_ppocr_mobile_v1.1_rec_train.tar) |
+| german_ppocr_mobile_v1.1_rec |德文识别|[rec_ger_lite_train.yml](../../configs/rec/multi_languages/rec_ger_lite_train.yml)|2.1M|[推理模型](https://paddleocr.bj.bcebos.com/20-09-22/mobile/ge/german_ppocr_mobile_v1.1_rec_infer.tar) / [训练模型](https://paddleocr.bj.bcebos.com/20-09-22/mobile/ge/german_ppocr_mobile_v1.1_rec_train.tar) |
+| korean_ppocr_mobile_v1.1_rec |韩文识别|[rec_korean_lite_train.yml](../../configs/rec/multi_languages/rec_korean_lite_train.yml)|3.4M|[推理模型](https://paddleocr.bj.bcebos.com/20-09-22/mobile/kr/korean_ppocr_mobile_v1.1_rec_infer.tar) / [训练模型](https://paddleocr.bj.bcebos.com/20-09-22/mobile/kr/korean_ppocr_mobile_v1.1_rec_train.tar) |
+| japan_ppocr_mobile_v1.1_rec |日文识别|[rec_japan_lite_train.yml](../../configs/rec/multi_languages/rec_japan_lite_train.yml)|3.7M|[推理模型](https://paddleocr.bj.bcebos.com/20-09-22/mobile/jp/japan_ppocr_mobile_v1.1_rec_infer.tar) / [训练模型](https://paddleocr.bj.bcebos.com/20-09-22/mobile/jp/japan_ppocr_mobile_v1.1_rec_train.tar) |
+
+
+<a name="文本方向分类模型"></a>
+### 三、文本方向分类模型
+|模型名称|模型简介|配置文件|推理模型大小|下载地址|
+|-|-|-|-|-|
+|ch_ppocr_mobile_v1.1_cls_quant|slim量化版模型|[cls_mv3.yml](../../configs/cls/cls_mv3.yml)|0.5M|[推理模型](https://paddleocr.bj.bcebos.com/20-09-22/cls/ch_ppocr_mobile_v1.1_cls_quant_infer.tar) / [训练模型](https://paddleocr.bj.bcebos.com/20-09-22/cls/ch_ppocr_mobile_v1.1_cls_quant_train.tar) / [slim模型](https://paddleocr.bj.bcebos.com/20-09-22/mobile/lite/ch_ppocr_mobile_v1.1_cls_quant_opt.nb) |
+|ch_ppocr_mobile_v1.1_cls|原始模型|[cls_mv3.yml](../../configs/cls/cls_mv3.yml)|850kb|[推理模型](https://paddleocr.bj.bcebos.com/20-09-22/cls/ch_ppocr_mobile_v1.1_cls_infer.tar) / [训练模型](https://paddleocr.bj.bcebos.com/20-09-22/cls/ch_ppocr_mobile_v1.1_cls_train.tar) |
+
+
+## OCR模型列表（V1.0，7月16日更新）
+
+|模型名称|模型简介|检测模型地址|识别模型地址|支持空格的识别模型地址|
+|-|-|-|-|-|
+|chinese_db_crnn_mobile|8.6M超轻量级中文OCR模型|[推理模型](https://paddleocr.bj.bcebos.com/ch_models/ch_det_mv3_db_infer.tar) / [预训练模型](https://paddleocr.bj.bcebos.com/ch_models/ch_det_mv3_db.tar) |[推理模型](https://paddleocr.bj.bcebos.com/ch_models/ch_rec_mv3_crnn_infer.tar) / [预训练模型](https://paddleocr.bj.bcebos.com/ch_models/ch_rec_mv3_crnn.tar) |[推理模型](https://paddleocr.bj.bcebos.com/ch_models/ch_rec_mv3_crnn_enhance_infer.tar) / [预训练模型](https://paddleocr.bj.bcebos.com/ch_models/ch_rec_mv3_crnn_enhance.tar)
+|chinese_db_crnn_server|通用中文OCR模型|[推理模型](https://paddleocr.bj.bcebos.com/ch_models/ch_det_r50_vd_db_infer.tar) / [预训练模型](https://paddleocr.bj.bcebos.com/ch_models/ch_det_r50_vd_db.tar) |[推理模型](https://paddleocr.bj.bcebos.com/ch_models/ch_rec_r34_vd_crnn_infer.tar) / [预训练模型](https://paddleocr.bj.bcebos.com/ch_models/ch_rec_r34_vd_crnn.tar) |[推理模型](https://paddleocr.bj.bcebos.com/ch_models/ch_rec_r34_vd_crnn_enhance_infer.tar) / [预训练模型](https://paddleocr.bj.bcebos.com/ch_models/ch_rec_r34_vd_crnn_enhance.tar)
--- a/doc/doc_ch/quickstart.md
+++ b/doc/doc_ch/quickstart.md
@ -9,12 +9,15 @@

 ## 2.inference模型下载

-|模型名称|模型简介|检测模型地址|识别模型地址|支持空格的识别模型地址|
-|-|-|-|-|-|
-|chinese_db_crnn_mobile|超轻量级中文OCR模型|[inference模型](https://paddleocr.bj.bcebos.com/ch_models/ch_det_mv3_db_infer.tar) / [预训练模型](https://paddleocr.bj.bcebos.com/ch_models/ch_det_mv3_db.tar)|[inference模型](https://paddleocr.bj.bcebos.com/ch_models/ch_rec_mv3_crnn_infer.tar) / [预训练模型](https://paddleocr.bj.bcebos.com/ch_models/ch_rec_mv3_crnn.tar)|[inference模型](https://paddleocr.bj.bcebos.com/ch_models/ch_rec_mv3_crnn_enhance_infer.tar) / [预训练模型](https://paddleocr.bj.bcebos.com/ch_models/ch_rec_mv3_crnn_enhance.tar)
-|chinese_db_crnn_server|通用中文OCR模型|[inference模型](https://paddleocr.bj.bcebos.com/ch_models/ch_det_r50_vd_db_infer.tar) / [预训练模型](https://paddleocr.bj.bcebos.com/ch_models/ch_det_r50_vd_db.tar)|[inference模型](https://paddleocr.bj.bcebos.com/ch_models/ch_rec_r34_vd_crnn_infer.tar) / [预训练模型](https://paddleocr.bj.bcebos.com/ch_models/ch_rec_r34_vd_crnn.tar)|[inference模型](https://paddleocr.bj.bcebos.com/ch_models/ch_rec_r34_vd_crnn_enhance_infer.tar) / [预训练模型](https://paddleocr.bj.bcebos.com/ch_models/ch_rec_r34_vd_crnn_enhance.tar)
+* 移动端和服务器端的检测与识别模型如下，更多模型下载（包括多语言），可以参考[PP-OCR v1.1 系列模型下载](../doc_ch/models_list.md)

-*windows 环境下如果没有安装wget,下载模型时可将链接复制到浏览器中下载，并解压放置在相应目录下*
+| 模型简介     | 模型名称     |推荐场景          | 检测模型 | 方向分类器 | 识别模型 |
+| ------------ | --------------- | ----------------|---- | ---------- | -------- |
+| 中英文超轻量OCR模型（8.1M） | ch_ppocr_mobile_v1.1_xx |移动端&服务器端|[推理模型](https://paddleocr.bj.bcebos.com/20-09-22/mobile/det/ch_ppocr_mobile_v1.1_det_infer.tar) / [预训练模型](https://paddleocr.bj.bcebos.com/20-09-22/mobile/det/ch_ppocr_mobile_v1.1_det_train.tar)|[推理模型](https://paddleocr.bj.bcebos.com/20-09-22/cls/ch_ppocr_mobile_v1.1_cls_infer.tar) / [预训练模型](https://paddleocr.bj.bcebos.com/20-09-22/cls/ch_ppocr_mobile_v1.1_cls_train.tar) |[推理模型](https://paddleocr.bj.bcebos.com/20-09-22/mobile/rec/ch_ppocr_mobile_v1.1_rec_infer.tar) / [预训练模型](https://paddleocr.bj.bcebos.com/20-09-22/mobile/rec/ch_ppocr_mobile_v1.1_rec_pre.tar)      |
+| 中英文通用OCR模型（155.1M）   |ch_ppocr_server_v1.1_xx|服务器端 |[推理模型](https://paddleocr.bj.bcebos.com/20-09-22/server/det/ch_ppocr_server_v1.1_det_infer.tar) / [预训练模型](https://paddleocr.bj.bcebos.com/20-09-22/server/det/ch_ppocr_server_v1.1_det_train.tar)          |[推理模型](https://paddleocr.bj.bcebos.com/20-09-22/cls/ch_ppocr_mobile_v1.1_cls_infer.tar) / [预训练模型](https://paddleocr.bj.bcebos.com/20-09-22/cls/ch_ppocr_mobile_v1.1_cls_train.tar)    |[推理模型](https://paddleocr.bj.bcebos.com/20-09-22/server/rec/ch_ppocr_server_v1.1_rec_infer.tar) / [预训练模型](https://paddleocr.bj.bcebos.com/20-09-22/server/rec/ch_ppocr_server_v1.1_rec_pre.tar)  |
+
+
+* windows 环境下如果没有安装wget,下载模型时可将链接复制到浏览器中下载，并解压放置在相应目录下

 复制上表中的检测和识别的`inference模型`下载地址，并解压

@ -24,6 +27,8 @@ mkdir inference && cd inference
 wget {url/of/detection/inference_model} && tar xf {name/of/detection/inference_model/package}
 # 下载识别模型并解压
 wget {url/of/recognition/inference_model} && tar xf {name/of/recognition/inference_model/package}
+# 下载方向分类器模型并解压
+wget {url/of/classification/inference_model} && tar xf {name/of/classification/inference_model/package}
 cd ..
 ```

@ -32,9 +37,11 @@ cd ..
 ```
 mkdir inference && cd inference
 # 下载超轻量级中文OCR模型的检测模型并解压
-wget https://paddleocr.bj.bcebos.com/ch_models/ch_det_mv3_db_infer.tar && tar xf ch_det_mv3_db_infer.tar
+wget https://paddleocr.bj.bcebos.com/20-09-22/mobile/det/ch_ppocr_mobile_v1.1_det_infer.tar && tar xf ch_ppocr_mobile_v1.1_det_infer.tar
 # 下载超轻量级中文OCR模型的识别模型并解压
-wget https://paddleocr.bj.bcebos.com/ch_models/ch_rec_mv3_crnn_infer.tar && tar xf ch_rec_mv3_crnn_infer.tar
+wget https://paddleocr.bj.bcebos.com/20-09-22/mobile/rec/ch_ppocr_mobile_v1.1_rec_infer.tar && tar xf ch_ppocr_mobile_v1.1_rec_infer.tar
+# 下载超轻量级中文OCR模型的文本方向分类器模型并解压
+wget https://paddleocr.bj.bcebos.com/20-09-22/cls/ch_ppocr_mobile_v1.1_cls_infer.tar && tar xf ch_ppocr_mobile_v1.1_cls_infer.tar
 cd ..
 ```

@ -42,10 +49,13 @@ cd ..

 ```
 |-inference
-    |-ch_rec_mv3_crnn
+    |-ch_ppocr_mobile_v1.1_det_infer
+        |- model
+        |- params
+    |-ch_ppocr_mobile_v1.1_rec_infer
        |- model
        |- params
-    |-ch_det_mv3_db
+    |-ch_ppocr_mobile-v1.1_cls_infer
        |- model
        |- params
    ...
@ -53,42 +63,37 @@ cd ..

 ## 3.单张图像或者图像集合预测

-以下代码实现了文本检测、识别串联推理，在执行预测时，需要通过参数image_dir指定单张图像或者图像集合的路径、参数det_model_dir指定检测inference模型的路径和参数rec_model_dir指定识别inference模型的路径。可视化识别结果默认保存到 ./inference_results 文件夹里面。
+以下代码实现了文本检测、识别串联推理，在执行预测时，需要通过参数image_dir指定单张图像或者图像集合的路径、参数`det_model_dir`指定检测inference模型的路径、参数`rec_model_dir`指定识别inference模型的路径、参数`use_angle_cls`指定是否使用方向分类器、参数`cls_model_dir`指定方向分类器inference模型的路径、参数`use_space_char`指定是否预测空格字符。可视化识别结果默认保存到`./inference_results`文件夹里面。

 ```bash

 # 预测image_dir指定的单张图像
-python3 tools/infer/predict_system.py --image_dir="./doc/imgs/11.jpg" --det_model_dir="./inference/ch_det_mv3_db/"  --rec_model_dir="./inference/ch_rec_mv3_crnn/"
+python3 tools/infer/predict_system.py --image_dir="./doc/imgs/11.jpg" --det_model_dir="./inference/ch_ppocr_mobile_v1.1_det_infer/"  --rec_model_dir="./inference/ch_ppocr_mobile_v1.1_rec_infer/" --cls_model_dir="./inference/ch_ppocr_mobile_v1.1_cls_infer/" --use_angle_cls=True --use_space_char=True

 # 预测image_dir指定的图像集合
-python3 tools/infer/predict_system.py --image_dir="./doc/imgs/" --det_model_dir="./inference/ch_det_mv3_db/"  --rec_model_dir="./inference/ch_rec_mv3_crnn/"
+python3 tools/infer/predict_system.py --image_dir="./doc/imgs/" --det_model_dir="./inference/ch_ppocr_mobile_v1.1_det_infer/"  --rec_model_dir="./inference/ch_ppocr_mobile_v1.1_rec_infer/" --cls_model_dir="./inference/ch_ppocr_mobile_v1.1_cls_infer/" --use_angle_cls=True --use_space_char=True

 # 如果想使用CPU进行预测，需设置use_gpu参数为False
-python3 tools/infer/predict_system.py --image_dir="./doc/imgs/11.jpg" --det_model_dir="./inference/ch_det_mv3_db/"  --rec_model_dir="./inference/ch_rec_mv3_crnn/" --use_gpu=False
+python3 tools/infer/predict_system.py --image_dir="./doc/imgs/11.jpg" --det_model_dir="./inference/ch_ppocr_mobile_v1.1_det_infer/"  --rec_model_dir="./inference/ch_ppocr_mobile_v1.1_rec_infer/" --cls_model_dir="./inference/ch_ppocr_mobile_v1.1_cls_infer/" --use_angle_cls=True --use_space_char=True --use_gpu=False
 ```

 - 通用中文OCR模型

 请按照上述步骤下载相应的模型，并且更新相关的参数，示例如下：
-```
+
+```bash
 # 预测image_dir指定的单张图像
-python3 tools/infer/predict_system.py --image_dir="./doc/imgs/11.jpg" --det_model_dir="./inference/ch_det_r50_vd_db/"  --rec_model_dir="./inference/ch_rec_r34_vd_crnn/"
+python3 tools/infer/predict_system.py --image_dir="./doc/imgs/11.jpg" --det_model_dir="./inference/ch_ppocr_server_v1.1_det_infer/"  --rec_model_dir="./inference/ch_ppocr_server_v1.1_rec_infer/" --cls_model_dir="./inference/ch_ppocr_mobile_v1.1_cls_infer/" --use_angle_cls=True --use_space_char=True
 ```

- 支持空格的通用中文OCR模型
+* 注意：
+    - 如果希望使用不支持空格的识别模型，在预测的时候需要注意：请将代码更新到最新版本，并添加参数 `--use_space_char=False`。
+    - 如果不希望使用方向分类器，在预测的时候需要注意：请将代码更新到最新版本，并添加参数 `--use_angle_cls=False`。

-请按照上述步骤下载相应的模型，并且更新相关的参数，示例如下：
-
-*注意：请将代码更新到最新版本，并添加参数 `--use_space_char=True` *
-
-```
-# 预测image_dir指定的单张图像
-python3 tools/infer/predict_system.py --image_dir="./doc/imgs_en/img_12.jpg" --det_model_dir="./inference/ch_det_r50_vd_db/"  --rec_model_dir="./inference/ch_rec_r34_vd_crnn_enhance/" --use_space_char=True
-```

 更多的文本检测、识别串联推理使用方式请参考文档教程中[基于Python预测引擎推理](./inference.md)。

 此外，文档教程中也提供了中文OCR模型的其他预测部署方式：
 - [基于C++预测引擎推理](../../deploy/cpp_infer/readme.md)
- [服务部署](./serving.md)
+- [服务部署](../../deploy/pdserving/readme.md)
 - [端侧部署](../../deploy/lite/readme.md)
--- a/doc/doc_ch/recognition.md
+++ b/doc/doc_ch/recognition.md
@ -1,5 +1,24 @@
 ## 文字识别

+
+- [一、数据准备](#数据准备)
+    - [数据下载](#数据下载)
+    - [自定义数据集](#自定义数据集)  
+    - [字典](#字典)  
+    - [支持空格](#支持空格)
+
+- [二、启动训练](#文本检测模型推理)
+    - [1. 数据增强](#数据增强)
+    - [2. 训练](#训练)
+    - [3. 小语种](#小语种)
+
+- [三、评估](#评估)
+
+- [四、预测](#预测)
+    - [1. 训练引擎预测](#训练引擎预测)
+
+
+<a name="数据准备"></a>
 ### 数据准备


@ -13,16 +32,18 @@ PaddleOCR 支持两种数据格式: `lmdb` 用于训练公开数据，调试算
 ln -sf <path/to/dataset> <path/to/paddle_ocr>/train_data/dataset
 ```

-
+<a name="数据下载"></a>
 * 数据下载

 若您本地没有数据集，可以在官网下载 [icdar2015](http://rrc.cvc.uab.es/?ch=4&com=downloads) 数据，用于快速验证。也可以参考[DTRB](https://github.com/clovaai/deep-text-recognition-benchmark#download-lmdb-dataset-for-traininig-and-evaluation-from-here)，下载 benchmark 所需的lmdb格式数据集。

 如果希望复现SRN的论文指标，需要下载离线[增广数据](https://pan.baidu.com/s/1-HSZ-ZVdqBF2HaBZ5pRAKA),提取码: y3ry。增广数据是由MJSynth和SynthText做旋转和扰动得到的。数据下载完成后请解压到 {your_path}/PaddleOCR/train_data/data_lmdb_release/training/ 路径下。

-* 使用自己数据集：
+<a name="自定义数据集"></a>
+* 使用自己数据集

 若您希望使用自己的数据进行训练，请参考下文组织您的数据。
+
 - 训练集

 首先请将训练图片放入同一个文件夹（train_images），并用一个txt文件（rec_gt_train.txt）记录图片路径和标签。
@ -44,6 +65,13 @@ wget -P ./train_data/ic15_data  https://paddleocr.bj.bcebos.com/dataset/rec_gt_t
 wget -P ./train_data/ic15_data  https://paddleocr.bj.bcebos.com/dataset/rec_gt_test.txt
 ```

+PaddleOCR 也提供了数据格式转换脚本，可以将官网 label 转换支持的数据格式。 数据转换工具在 `train_data/gen_label.py`, 这里以训练集为例：
+
+```
+# 将官网下载的标签文件转换为 rec_gt_label.txt
+python gen_label.py --mode="rec" --input_path="{path/of/origin/label}" --output_label="rec_gt_label.txt"
+```
+
 最终训练集应有如下文件结构：
 ```
 |-train_data
@ -70,7 +98,7 @@ wget -P ./train_data/ic15_data  https://paddleocr.bj.bcebos.com/dataset/rec_gt_t
            |- word_003.jpg
            | ...
 ```
-
+<a name="字典"></a>
 - 字典

 最后需要提供一个字典（{word_dict_name}.txt），使模型在训练时，可以将所有出现的字符映射为字典的索引。
@ -89,21 +117,36 @@ n
 word_dict.txt 每行有一个单字，将字符与数字索引映射在一起，“and” 将被映射成 [2 5 1]

 `ppocr/utils/ppocr_keys_v1.txt` 是一个包含6623个字符的中文字典，
+
 `ppocr/utils/ic15_dict.txt` 是一个包含36个字符的英文字典，
+
+`ppocr/utils/dict/french_dict.txt` 是一个包含118个字符的法文字典
+
+`ppocr/utils/dict/japan_dict.txt` 是一个包含4399个字符的法文字典
+
+`ppocr/utils/dict/korean_dict.txt` 是一个包含3636个字符的法文字典
+
+`ppocr/utils/dict/german_dict.txt` 是一个包含131个字符的法文字典
+
+
 您可以按需使用。

+目前的多语言模型仍处在demo阶段，会持续优化模型并补充语种，**非常欢迎您为我们提供其他语言的字典和字体**，
+如您愿意可将字典文件提交至 [dict](../../ppocr/utils/dict) 将语料文件提交至[corpus](../../ppocr/utils/corpus)，我们会在Repo中感谢您。
+
 - 自定义字典

 如需自定义dic文件，请在 `configs/rec/rec_icdar15_train.yml` 中添加 `character_dict_path` 字段, 指向您的字典路径。
 并将 `character_type` 设置为 `ch`。

+<a name="支持空格"></a>
 - 添加空格类别

 如果希望支持识别"空格"类别, 请将yml文件中的 `use_space_char` 字段设置为 `true`。

 **注意：`use_space_char` 仅在 `character_type=ch` 时生效**

-
+<a name="启动训练"></a>
 ### 启动训练

 PaddleOCR提供了训练脚本、评估脚本和预测脚本，本节将以 CRNN 识别模型为例：
@ -124,14 +167,12 @@ tar -xf rec_mv3_none_bilstm_ctc.tar && rm -rf rec_mv3_none_bilstm_ctc.tar
 *如果您安装的是cpu版本，请将配置文件中的 `use_gpu` 字段修改为false*

 ```
-# 设置PYTHONPATH路径
-export PYTHONPATH=$PYTHONPATH:.
 # GPU训练 支持单卡，多卡训练，通过CUDA_VISIBLE_DEVICES指定卡号
 export CUDA_VISIBLE_DEVICES=0,1,2,3
-# 训练icdar15英文数据
-python3 tools/train.py -c configs/rec/rec_icdar15_train.yml
+# 训练icdar15英文数据 并将训练日志保存为 tain_rec.log
+python3 tools/train.py -c configs/rec/rec_icdar15_train.yml 2>&1 | tee train_rec.log
 ```
-
+<a name="数据增强"></a>
 - 数据增强

 PaddleOCR提供了多种数据增强方式，如果您希望在训练时加入扰动，请在配置文件中设置 `distort: true`。
@ -140,8 +181,9 @@ PaddleOCR提供了多种数据增强方式，如果您希望在训练时加入

 训练过程中每种扰动方式以50%的概率被选择，具体代码实现请参考：[img_tools.py](https://github.com/PaddlePaddle/PaddleOCR/blob/develop/ppocr/data/rec/img_tools.py)

-*由于OpenCV的兼容性问题，扰动操作暂时只支持GPU*
+*由于OpenCV的兼容性问题，扰动操作暂时只支持Linux*

+<a name="训练"></a>
 - 训练

 PaddleOCR支持训练和评估交替进行, 可以在 `configs/rec/rec_icdar15_train.yml` 中修改 `eval_batch_step` 设置评估频率，默认每500个iter评估一次。评估过程中默认将最佳acc模型，保存为 `output/rec_CRNN/best_accuracy` 。
@ -153,7 +195,10 @@ PaddleOCR支持训练和评估交替进行, 可以在 `configs/rec/rec_icdar15_t

 | 配置文件 |  算法名称 |   backbone |   trans   |   seq      |     pred     |
 | :--------: |  :-------:   | :-------:  |   :-------:   |   :-----:   |  :-----:   |
+| [rec_chinese_lite_train_v1.1.yml](../../configs/rec/ch_ppocr_v1.1/rec_chinese_lite_train_v1.1.yml) |  CRNN |   Mobilenet_v3 small 0.5 |  None   |  BiLSTM |  ctc  |
+| [rec_chinese_common_train_v1.1.yml](../../configs/rec/ch_ppocr_v1.1/rec_chinese_common_train_v1.1.yml) |  CRNN | ResNet34_vd |  None   |  BiLSTM |  ctc  |
 | rec_chinese_lite_train.yml |  CRNN |   Mobilenet_v3 small 0.5 |  None   |  BiLSTM |  ctc  |
+| rec_chinese_common_train.yml |  CRNN |   ResNet34_vd |  None   |  BiLSTM |  ctc  |
 | rec_icdar15_train.yml |  CRNN |   Mobilenet_v3 large 0.5 |  None   |  BiLSTM |  ctc  |
 | rec_mv3_none_bilstm_ctc.yml |  CRNN |   Mobilenet_v3 large 0.5 |  None   |  BiLSTM |  ctc  |
 | rec_mv3_none_none_ctc.yml |  Rosetta |   Mobilenet_v3 large 0.5 |  None   |  None |  ctc  |
@ -165,7 +210,7 @@ PaddleOCR支持训练和评估交替进行, 可以在 `configs/rec/rec_icdar15_t
 | rec_r34_vd_tps_bilstm_ctc.yml | STARNet | Resnet34_vd | tps | BiLSTM | ctc |
 | rec_r50fpn_vd_none_srn.yml | SRN | Resnet50_fpn_vd | None | rnn | srn |

-训练中文数据，推荐使用`rec_chinese_lite_train.yml`，如您希望尝试其他算法在中文数据集上的效果，请参考下列说明修改配置文件：
+训练中文数据，推荐使用[rec_chinese_lite_train_v1.1.yml](../../configs/rec/ch_ppocr_v1.1/rec_chinese_lite_train_v1.1.yml)，如您希望尝试其他算法在中文数据集上的效果，请参考下列说明修改配置文件：

 以 `rec_mv3_none_none_ctc.yml` 为例：
 ```
@ -201,8 +246,54 @@ Optimizer:
 ```
 **注意，预测/评估时的配置文件请务必与训练一致。**

+<a name="小语种"></a>
+- 小语种
+
+PaddleOCR也提供了多语言的， `configs/rec/multi_languages` 路径下的提供了多语言的配置文件，目前PaddleOCR支持的多语言算法有：

+| 配置文件 |  算法名称 |   backbone |   trans   |   seq      |     pred     |  language |
+| :--------: |  :-------:   | :-------:  |   :-------:   |   :-----:   |  :-----:   | :-----:  |
+| rec_en_lite_train.yml |  CRNN |   Mobilenet_v3 small 0.5 |  None   |  BiLSTM |  ctc  | 英语   |
+| rec_french_lite_train.yml |  CRNN |   Mobilenet_v3 small 0.5 |  None   |  BiLSTM |  ctc  | 法语 |  
+| rec_ger_lite_train.yml |  CRNN |   Mobilenet_v3 small 0.5 |  None   |  BiLSTM |  ctc  | 德语   |
+| rec_japan_lite_train.yml |  CRNN |   Mobilenet_v3 small 0.5 |  None   |  BiLSTM |  ctc  | 日语  |
+| rec_korean_lite_train.yml |  CRNN |   Mobilenet_v3 small 0.5 |  None   |  BiLSTM |  ctc  | 韩语  |

+
+多语言模型训练方式与中文模型一致，训练数据集均为100w的合成数据，少量的字体可以在 [百度网盘](https://pan.baidu.com/s/1bS_u207Rm7YbY33wOECKDA) 上下载，提取码：frgi。
+
+如您希望在现有模型效果的基础上调优，请参考下列说明修改配置文件：
+
+以 `rec_french_lite_train` 为例：
+```
+Global:
+  ...
+  # 添加自定义字典，如修改字典请将路径指向新字典
+  character_dict_path: ./ppocr/utils/dict/french_dict.txt
+  # 训练时添加数据增强
+  distort: true
+  # 识别空格
+  use_space_char: true
+  ...
+  # 修改reader类型
+  reader_yml: ./configs/rec/multi_languages/rec_french_reader.yml
+  ...
+...
+```
+
+同时需要修改数据读取文件 `rec_french_reader.yml`：
+
+```
+TrainReader:
+  ...
+  # 修改训练数据存放的目录名
+  img_set_dir: ./train_data
+  # 修改 label 文件名称
+  label_file_path: ./train_data/french_train.txt
+
+...
+```
+<a name="评估"></a>
 ### 评估

 评估数据集可以通过 `configs/rec/rec_icdar15_reader.yml`  修改EvalReader中的 `label_file_path` 设置。
@ -214,8 +305,10 @@ export CUDA_VISIBLE_DEVICES=0
 python3 tools/eval.py -c configs/rec/rec_icdar15_train.yml -o Global.checkpoints={path/to/weights}/best_accuracy
 ```

+<a name="预测"></a>
 ### 预测

+<a name="训练引擎预测"></a>
 * 训练引擎的预测

 使用 PaddleOCR 训练好的模型，可以通过以下脚本进行快速预测。
@ -239,12 +332,12 @@ infer_img: doc/imgs_words/en/word_1.png
     word : joint
 ```

-预测使用的配置文件必须与训练一致，如您通过 `python3 tools/train.py -c configs/rec/rec_chinese_lite_train.yml` 完成了中文模型的训练，
+预测使用的配置文件必须与训练一致，如您通过 `python3 tools/train.py -c configs/rec/ch_ppocr_v1.1/rec_chinese_lite_train_v1.1.yml` 完成了中文模型的训练，
 您可以使用如下命令进行中文模型预测。

 ```
 # 预测中文结果
-python3 tools/infer_rec.py -c configs/rec/rec_chinese_lite_train.yml -o Global.checkpoints={path/to/weights}/best_accuracy Global.infer_img=doc/imgs_words/ch/word_1.jpg
+python3 tools/infer_rec.py -c configs/rec/ch_ppocr_v1.1/rec_chinese_lite_train_v1.1.yml -o Global.checkpoints={path/to/weights}/best_accuracy Global.infer_img=doc/imgs_words/ch/word_1.jpg
 ```

 预测图片：
--- a/doc/doc_ch/serving.md
+++ b/doc/doc_ch/serving.md
@ -1,176 +0,0 @@
-# 服务部署
-
-PaddleOCR提供2种服务部署方式：
- 基于HubServing的部署：已集成到PaddleOCR中（[code](https://github.com/PaddlePaddle/PaddleOCR/tree/develop/deploy/hubserving)），按照本教程使用；
- 基于PaddleServing的部署：详见PaddleServing官网[demo](https://github.com/PaddlePaddle/Serving/tree/develop/python/examples/ocr)，后续也将集成到PaddleOCR。  
-
-服务部署目录下包括检测、识别、2阶段串联三种服务包，根据需求选择相应的服务包进行安装和启动。目录如下：
-```
-deploy/hubserving/
-  └─  ocr_det     检测模块服务包
-  └─  ocr_rec     识别模块服务包
-  └─  ocr_system  检测+识别串联服务包
-```
-
-每个服务包下包含3个文件。以2阶段串联服务包为例，目录如下：
-```
-deploy/hubserving/ocr_system/
-  └─  __init__.py    空文件，必选
-  └─  config.json    配置文件，可选，使用配置启动服务时作为参数传入
-  └─  module.py      主模块，必选，包含服务的完整逻辑
-  └─  params.py      参数文件，必选，包含模型路径、前后处理参数等参数
-```
-
-## 快速启动服务
-以下步骤以检测+识别2阶段串联服务为例，如果只需要检测服务或识别服务，替换相应文件路径即可。
-### 1. 准备环境
-```shell
-# 安装paddlehub  
-pip3 install paddlehub --upgrade -i https://pypi.tuna.tsinghua.edu.cn/simple
-
-# 在Linux下设置环境变量
-export PYTHONPATH=.
-# 在Windows下设置环境变量
-SET PYTHONPATH=.
-```
-
-### 2. 安装服务模块
-PaddleOCR提供3种服务模块，根据需要安装所需模块。
-
-* 在Linux环境下，安装示例如下：
-```shell
-# 安装检测服务模块：  
-hub install deploy/hubserving/ocr_det/
-
-# 或，安装识别服务模块：  
-hub install deploy/hubserving/ocr_rec/
-
-# 或，安装检测+识别串联服务模块：  
-hub install deploy/hubserving/ocr_system/
-```
-
-* 在Windows环境下(文件夹的分隔符为`\`)，安装示例如下：
-```shell
-# 安装检测服务模块：  
-hub install deploy\hubserving\ocr_det\
-
-# 或，安装识别服务模块：  
-hub install deploy\hubserving\ocr_rec\
-
-# 或，安装检测+识别串联服务模块：
-hub install deploy\hubserving\ocr_system\
-```
-
-### 3. 启动服务
-#### 方式1. 命令行命令启动（仅支持CPU）
-**启动命令：**  
-```shell
-$ hub serving start --modules [Module1==Version1, Module2==Version2, ...] \
-                    --port XXXX \
-                    --use_multiprocess \
-                    --workers \
-```  
-
-**参数：**  
-
-|参数|用途|  
-|-|-|  
-|--modules/-m|PaddleHub Serving预安装模型，以多个Module==Version键值对的形式列出<br>*`当不指定Version时，默认选择最新版本`*|  
-|--port/-p|服务端口，默认为8866|  
-|--use_multiprocess|是否启用并发方式，默认为单进程方式，推荐多核CPU机器使用此方式<br>*`Windows操作系统只支持单进程方式`*|
-|--workers|在并发方式下指定的并发任务数，默认为`2*cpu_count-1`，其中`cpu_count`为CPU核数|  
-
-如启动串联服务：  ```hub serving start -m ocr_system```  
-
-这样就完成了一个服务化API的部署，使用默认端口号8866。
-
-#### 方式2. 配置文件启动（支持CPU、GPU）
-**启动命令：**  
-```hub serving start -c config.json```  
-
-其中，`config.json`格式如下：
-```python
-{
-    "modules_info": {
-        "ocr_system": {
-            "init_args": {
-                "version": "1.0.0",
-                "use_gpu": true
-            },
-            "predict_args": {
-            }
-        }
-    },
-    "port": 8868,
-    "use_multiprocess": false,
-    "workers": 2
-}
-```
-
- `init_args`中的可配参数与`module.py`中的`_initialize`函数接口一致。其中，**当`use_gpu`为`true`时，表示使用GPU启动服务**。  
- `predict_args`中的可配参数与`module.py`中的`predict`函数接口一致。
-
-**注意:**  
- 使用配置文件启动服务时，其他参数会被忽略。
- 如果使用GPU预测(即，`use_gpu`置为`true`)，则需要在启动服务之前，设置CUDA_VISIBLE_DEVICES环境变量，如：```export CUDA_VISIBLE_DEVICES=0```，否则不用设置。
- **`use_gpu`不可与`use_multiprocess`同时为`true`**。
-
-如，使用GPU 3号卡启动串联服务：  
-```shell
-export CUDA_VISIBLE_DEVICES=3
-hub serving start -c deploy/hubserving/ocr_system/config.json
-```  
-
-## 发送预测请求
-配置好服务端，可使用以下命令发送预测请求，获取预测结果:  
-
-```python tools/test_hubserving.py server_url image_path```  
-
-需要给脚本传递2个参数：  
- **server_url**：服务地址，格式为  
-`http://[ip_address]:[port]/predict/[module_name]`  
-例如，如果使用配置文件启动检测、识别、检测+识别2阶段服务，那么发送请求的url将分别是：  
-`http://127.0.0.1:8866/predict/ocr_det`  
-`http://127.0.0.1:8867/predict/ocr_rec`  
-`http://127.0.0.1:8868/predict/ocr_system`  
- **image_path**：测试图像路径，可以是单张图片路径，也可以是图像集合目录路径  
-
-访问示例：  
-```python tools/test_hubserving.py http://127.0.0.1:8868/predict/ocr_system ./doc/imgs/```
-
-## 返回结果格式说明
-返回结果为列表（list），列表中的每一项为词典（dict），词典一共可能包含3种字段，信息如下：
-
-|字段名称|数据类型|意义|
-|-|-|-|
-|text|str|文本内容|
-|confidence|float| 文本识别置信度|
-|text_region|list|文本位置坐标|
-
-不同模块返回的字段不同，如，文本识别服务模块返回结果不含`text_region`字段，具体信息如下：
-
-|字段名/模块名|ocr_det|ocr_rec|ocr_system|
-|-|-|-|-|  
-|text||✔|✔|
-|confidence||✔|✔|
-|text_region|✔||✔|
-
-**说明：** 如果需要增加、删除、修改返回字段，可在相应模块的`module.py`文件中进行修改，完整流程参考下一节自定义修改服务模块。
-
-## 自定义修改服务模块
-如果需要修改服务逻辑，你一般需要操作以下步骤（以修改`ocr_system`为例）：  
-
- 1、 停止服务  
-```hub serving stop --port/-p XXXX```  
-
- 2、 到相应的`module.py`和`params.py`等文件中根据实际需求修改代码。  
-例如，如果需要替换部署服务所用模型，则需要到`params.py`中修改模型路径参数`det_model_dir`和`rec_model_dir`，当然，同时可能还需要修改其他相关参数，请根据实际情况修改调试。 建议修改后先直接运行`module.py`调试，能正确运行预测后再启动服务测试。
-
- 3、 卸载旧服务包  
-```hub uninstall ocr_system```  
-
- 4、 安装修改后的新服务包  
-```hub install deploy/hubserving/ocr_system/```  
-
- 5、重新启动服务  
-```hub serving start -m ocr_system```  
--- a/doc/doc_ch/serving_inference.md
+++ b/doc/doc_ch/serving_inference.md
@ -0,0 +1,239 @@
+# 使用Paddle Serving预测推理
+
+阅读本文档之前，请先阅读文档 [基于Python预测引擎推理](./inference.md)
+
+同本地执行预测一样，我们需要保存一份可以用于Paddle Serving的模型。
+
+接下来首先介绍如何将训练的模型转换成Paddle Serving模型，然后将依次介绍文本检测、文本识别以及两者串联基于预测引擎推理。
+
+### 一、 准备环境
+我们先安装Paddle Serving相关组件
+我们推荐用户使用GPU来做Paddle Serving的OCR服务部署
+
+**CUDA版本：9.X/10.X**
+
+**CUDNN版本：7.X**
+
+**操作系统版本：Linux/Windows**
+
+**Python版本： 2.7/3.5/3.6/3.7**
+
+**Python操作指南：**
+
+目前Serving用于OCR的部分功能还在测试当中，因此在这里我们给出[Servnig latest package](https://github.com/PaddlePaddle/Serving/blob/develop/doc/LATEST_PACKAGES.md)
+大家根据自己的环境选择需要安装的whl包即可，例如以Python 3.5为例，执行下列命令
+```
+#CPU/GPU版本选择一个
+#GPU版本服务端
+#CUDA 9
+python -m pip install -U https://paddle-serving.bj.bcebos.com/whl/paddle_serving_server_gpu-0.0.0.post9-py3-none-any.whl
+#CUDA 10
+python -m pip install -U https://paddle-serving.bj.bcebos.com/whl/paddle_serving_server_gpu-0.0.0.post10-py3-none-any.whl
+#CPU版本服务端
+python -m pip install -U https://paddle-serving.bj.bcebos.com/whl/paddle_serving_server-0.0.0-py3-none-any.whl
+#客户端和App包使用以下链接（CPU，GPU通用）
+python -m pip install -U https://paddle-serving.bj.bcebos.com/whl/paddle_serving_client-0.0.0-cp36-none-any.whl https://paddle-serving.bj.bcebos.com/whl/paddle_serving_app-0.0.0-py3-none-any.whl
+```
+
+## 二、训练模型转Serving模型
+
+在前序文档 [基于Python预测引擎推理](./inference.md) 中，我们提供了如何把训练的checkpoint转换成Paddle模型。Paddle模型通常由一个文件夹构成，内含模型结构描述文件`model`和模型参数文件`params`。Serving模型由两个文件夹构成，用于存放客户端和服务端的配置。
+
+我们以`ch_rec_r34_vd_crnn`模型作为例子，下载链接在：
+
+```
+wget --no-check-certificate https://paddleocr.bj.bcebos.com/ch_models/ch_rec_r34_vd_crnn_infer.tar
+tar xf ch_rec_r34_vd_crnn_infer.tar
+```
+因此我们按照Serving模型转换教程，运行下列python文件。
+```
+python tools/inference_to_serving.py --model_dir ch_rec_r34_vd_crnn
+```
+最终会在`serving_client_dir`和`serving_server_dir`生成客户端和服务端的模型配置。其中`serving_server_dir`和`serving_client_dir`的名字可以自定义。最终文件结构如下
+
+```
+/ch_rec_r34_vd_crnn/
+├── serving_client_dir # 客户端配置文件夹
+└── serving_server_dir # 服务端配置文件夹
+```
+
+## 三、文本检测模型Serving推理
+
+启动服务可以根据实际需求选择启动`标准版`或者`快速版`，两种方式的对比如下表：  
+
+|版本|特点|适用场景|
+|-|-|-|
+|标准版|稳定性高，分布式部署|适用于吞吐量大，需要跨机房部署的情况|
+|快速版|部署方便，预测速度快|适用于对预测速度要求高，迭代速度快的场景，Windows用户只能选择快速版|
+
+接下来的命令中，我们会指定快速版和标准版的命令。需要说明的是，标准版只能用Linux平台，快速版可以支持Linux/Windows。
+文本检测模型推理，默认使用DB模型的配置参数，识别默认为CRNN。
+
+配置文件在`params.py`中，我们贴出配置部分，如果需要做改动，也在这个文件内部进行修改。
+
+```
+def read_params():
+    cfg = Config()
+    #use gpu
+    cfg.use_gpu = False # 是否使用GPU
+    cfg.use_pdserving = True # 是否使用paddleserving，必须为True
+
+    #params for text detector
+    cfg.det_algorithm = "DB" # 检测算法， DB/EAST等
+    cfg.det_model_dir = "./det_mv_server/" # 检测算法模型路径
+    cfg.det_max_side_len = 960
+
+    #DB params
+    cfg.det_db_thresh =0.3
+    cfg.det_db_box_thresh =0.5
+    cfg.det_db_unclip_ratio =2.0
+
+    #EAST params
+    cfg.det_east_score_thresh = 0.8
+    cfg.det_east_cover_thresh = 0.1
+    cfg.det_east_nms_thresh = 0.2
+
+    #params for text recognizer
+    cfg.rec_algorithm = "CRNN" # 识别算法， CRNN/RARE等
+    cfg.rec_model_dir = "./ocr_rec_server/" # 识别算法模型路径
+
+    cfg.rec_image_shape = "3, 32, 320"
+    cfg.rec_char_type = 'ch'
+    cfg.rec_batch_num = 30
+    cfg.max_text_length = 25
+
+    cfg.rec_char_dict_path = "./ppocr_keys_v1.txt" # 识别算法字典文件
+    cfg.use_space_char = True
+
+    #params for text classifier
+    cfg.use_angle_cls = True # 是否启用分类算法
+    cfg.cls_model_dir = "./ocr_clas_server/" # 分类算法模型路径
+    cfg.cls_image_shape = "3, 48, 192"
+    cfg.label_list = ['0', '180']
+    cfg.cls_batch_num = 30
+    cfg.cls_thresh = 0.9
+
+    return cfg
+```
+与本地预测不同的是，Serving预测需要一个客户端和一个服务端，因此接下来的教程都是两行代码。
+
+在正式执行服务端启动命令之前，先export PYTHONPATH到工程主目录下。
+```
+export PYTHONPATH=$PWD:$PYTHONPATH
+cd deploy/pdserving
+```
+为了方便用户复现Demo程序，我们提供了Chinese and English ultra-lightweight OCR model (8.1M)版本的Serving模型
+```
+wget --no-check-certificate https://paddleocr.bj.bcebos.com/deploy/pdserving/ocr_pdserving_suite.tar.gz
+tar xf ocr_pdserving_suite.tar.gz
+```
+
+### 1. 超轻量中文检测模型推理
+
+超轻量中文检测模型推理，可以执行如下命令启动服务端：
+
+```
+#根据环境只需要启动其中一个就可以
+python det_rpc_server.py #标准版，Linux用户
+python det_local_server.py #快速版，Windows/Linux用户
+```
+
+客户端
+
+```
+python det_web_client.py
+```
+
+
+Serving的推测和本地预测不同点在于，客户端发送请求到服务端，服务端需要检测到文字框之后返回框的坐标，此处没有后处理的图片，只能看到坐标值。
+
+## 四、文本识别模型Serving推理
+
+下面将介绍超轻量中文识别模型推理、基于CTC损失的识别模型推理和基于Attention损失的识别模型推理。对于中文文本识别，建议优先选择基于CTC损失的识别模型，实践中也发现基于Attention损失的效果不如基于CTC损失的识别模型。此外，如果训练时修改了文本的字典，请参考下面的自定义文本识别字典的推理。
+
+### 1. 超轻量中文识别模型推理
+
+超轻量中文识别模型推理，可以执行如下命令启动服务端：
+需要注意params.py中的`--use_gpu`的值
+```
+#根据环境只需要启动其中一个就可以
+python rec_rpc_server.py #标准版，Linux用户
+python rec_local_server.py #快速版，Windows/Linux用户
+```
+如果需要使用CPU版本，还需增加 `--use_gpu False`。
+
+客户端
+
+```
+python rec_web_client.py
+```
+
+![](../imgs_words/ch/word_4.jpg)
+
+执行命令后，上面图像的预测结果（识别的文本和得分）会打印到屏幕上，示例如下：
+
+```
+{u'result': {u'score': [u'0.89547354'], u'pred_text': ['实力活力']}}
+```
+
+
+
+## 五、方向分类模型推理
+
+下面将介绍方向分类模型推理。
+
+
+
+### 1. 方向分类模型推理
+
+方向分类模型推理， 可以执行如下命令启动服务端：
+需要注意params.py中的`--use_gpu`的值
+```
+#根据环境只需要启动其中一个就可以
+python clas_rpc_server.py #标准版，Linux用户
+python clas_local_server.py #快速版，Windows/Linux用户
+```
+
+客户端
+
+```
+python rec_web_client.py
+```
+
+![](../imgs_words/ch/word_4.jpg)
+
+执行命令后，上面图像的预测结果（分类的方向和得分）会打印到屏幕上，示例如下：
+
+```
+{u'result': {u'direction': [u'0'], u'score': [u'0.9999963']}}
+```
+
+
+## 六、文本检测、方向分类和文字识别串联Serving推理
+
+### 1. 超轻量中文OCR模型推理
+
+在执行预测时，需要通过参数`image_dir`指定单张图像或者图像集合的路径、参数`det_model_dir`,`cls_model_dir`和`rec_model_dir`分别指定检测，方向分类和识别的inference模型路径。参数`use_angle_cls`用于控制是否启用方向分类模型。与本地预测不同的是，为了减少网络传输耗时，可视化识别结果目前不做处理，用户收到的是推理得到的文字字段。
+
+执行如下命令启动服务端：
+需要注意params.py中的`--use_gpu`的值
+```
+#标准版，Linux用户
+#GPU用户
+python -m paddle_serving_server_gpu.serve --model det_infer_server --port 9293 --gpu_id 0
+python -m paddle_serving_server_gpu.serve --model cls_infer_server --port 9294 --gpu_id 0
+python ocr_rpc_server.py
+#CPU用户
+python -m paddle_serving_server.serve --model det_infer_server --port 9293
+python -m paddle_serving_server.serve --model cls_infer_server --port 9294
+python ocr_rpc_server.py
+
+#快速版，Windows/Linux用户
+python ocr_local_server.py
+```
+
+客户端
+
+```
+python rec_web_client.py
+```
--- a/doc/doc_ch/tree.md
+++ b/doc/doc_ch/tree.md
@ -0,0 +1,208 @@
+# 整体目录结构
+
+PaddleOCR 的整体目录结构介绍如下：
+
+```
+PaddleOCR
+├── configs   // 配置文件，可通过yml文件选择模型结构并修改超参
+│   ├── cls   // 方向分类器相关配置文件
+│   │   ├── cls_mv3.yml               // 训练配置相关，包括骨干网络、head、loss、优化器
+│   │   └── cls_reader.yml            // 数据读取相关，数据读取方式、数据存储路径
+│   ├── det   // 检测相关配置文件
+│   │   ├── det_db_icdar15_reader.yml  // 数据读取
+│   │   ├── det_mv3_db.yml             // 训练配置
+│   │   ...  
+│   └── rec   // 识别相关配置文件
+│       ├── rec_benchmark_reader.yml      // LMDB 格式数据读取相关
+│       ├── rec_chinese_common_train.yml  // 通用中文训练配置
+│       ├── rec_icdar15_reader.yml        // simple 数据读取相关，包括数据读取函数、数据路径、标签文件
+│       ...  
+├── deploy   // 部署相关
+│   ├── android_demo // android_demo
+│   │   ...
+│   ├── cpp_infer    // C++ infer
+│   │   ├── CMakeLists.txt    // Cmake 文件
+│   │   ├── docs              // 说明文档
+│   │   │   └── windows_vs2019_build.md
+│   │   ├── include           // 头文件
+│   │   │   ├── clipper.h     // clipper 库
+│   │   │   ├── config.h      // 预测配置
+│   │   │   ├── ocr_cls.h     // 方向分类器
+│   │   │   ├── ocr_det.h     // 文字检测
+│   │   │   ├── ocr_rec.h     // 文字识别
+│   │   │   ├── postprocess_op.h  // 检测后处理
+│   │   │   ├── preprocess_op.h   // 检测预处理
+│   │   │   └── utility.h         // 工具
+│   │   ├── readme.md     // 说明文档
+│   │   ├── ...
+│   │   ├── src              // 源文件
+│   │   │   ├── clipper.cpp  
+│   │   │   ├── config.cpp
+│   │   │   ├── main.cpp
+│   │   │   ├── ocr_cls.cpp
+│   │   │   ├── ocr_det.cpp
+│   │   │   ├── ocr_rec.cpp
+│   │   │   ├── postprocess_op.cpp
+│   │   │   ├── preprocess_op.cpp
+│   │   │   └── utility.cpp
+│   │   └── tools      // 编译、执行脚本
+│   │       ├── build.sh   // 编译脚本
+│   │       ├── config.txt // 配置文件
+│   │       └── run.sh     // 测试启动脚本
+│   ├── docker
+│   │   └── hubserving
+│   │       ├── cpu
+│   │       │   └── Dockerfile
+│   │       ├── gpu
+│   │       │   └── Dockerfile
+│   │       ├── README_cn.md
+│   │       ├── README.md
+│   │       └── sample_request.txt
+│   ├── hubserving  // hubserving
+│   │   ├── ocr_det   // 文字检测
+│   │   │   ├── config.json  // serving 配置
+│   │   │   ├── __init__.py  
+│   │   │   ├── module.py    // 预测模型
+│   │   │   └── params.py    // 预测参数
+│   │   ├── ocr_rec   // 文字识别
+│   │   │   ├── config.json
+│   │   │   ├── __init__.py
+│   │   │   ├── module.py
+│   │   │   └── params.py
+│   │   └── ocr_system  // 系统预测
+│   │       ├── config.json
+│   │       ├── __init__.py
+│   │       ├── module.py
+│   │       └── params.py
+│   ├── imgs  // 预测图片
+│   │   ├── cpp_infer_pred_12.png
+│   │   └── demo.png
+│   ├── ios_demo  // ios demo
+│   │   ...
+│   ├── lite      // lite 部署
+│   │   ├── cls_process.cc  // 方向分类器数据处理
+│   │   ├── cls_process.h
+│   │   ├── config.txt      // 检测配置参数
+│   │   ├── crnn_process.cc  // crnn数据处理
+│   │   ├── crnn_process.h
+│   │   ├── db_post_process.cc  // db数据处理
+│   │   ├── db_post_process.h
+│   │   ├── Makefile            // 编译文件
+│   │   ├── ocr_db_crnn.cc      // 串联预测
+│   │   ├── prepare.sh          // 数据准备
+│   │   ├── readme.md        // 说明文档
+│   │   ...
+│   ├── pdserving  // pdserving 部署
+│   │   ├── det_local_server.py  // 检测 快速版，部署方便预测速度快
+│   │   ├── det_web_server.py    // 检测 完整版，稳定性高分布式部署
+│   │   ├── ocr_local_server.py  // 检测+识别 快速版
+│   │   ├── ocr_web_client.py    // 客户端
+│   │   ├── ocr_web_server.py    // 检测+识别 完整版
+│   │   ├── readme.md            // 说明文档
+│   │   ├── rec_local_server.py  // 识别 快速版
+│   │   └── rec_web_server.py    // 识别 完整版
+│   └── slim  
+│       └── quantization         // 量化相关
+│           ├── export_model.py  // 导出模型
+│           ├── quant.py         // 量化
+│           └── README.md        // 说明文档
+├── doc  // 文档教程
+│   ...
+├── paddleocr.py
+├── ppocr            // 网络核心代码
+│   ├── data         // 数据处理
+│   │   ├── cls   // 方向分类器
+│   │   │   ├── dataset_traversal.py  // 数据传输，定义数据读取器，读取数据并组成batch
+│   │   │   └── randaugment.py        // 随机数据增广操作
+│   │   ├── det   // 检测
+│   │   │   ├── data_augment.py       // 数据增广操作
+│   │   │   ├── dataset_traversal.py  // 数据传输，定义数据读取器，读取数据并组成batch
+│   │   │   ├── db_process.py         // db 数据处理
+│   │   │   ├── east_process.py       // east 数据处理
+│   │   │   ├── make_border_map.py    // 生成边界图
+│   │   │   ├── make_shrink_map.py    // 生成收缩图
+│   │   │   ├── random_crop_data.py   // 随机切割
+│   │   │   └── sast_process.py       // sast 数据处理
+│   │   ├── reader_main.py   // 数据读取器主函数
+│   │   └── rec  // 识别
+│   │       ├── dataset_traversal.py  // 数据传输，定义数据读取器，包含 LMDB_Reader 和 Simple_Reader
+│   │       └── img_tools.py          // 数据处理相关，包括数据归一化、扰动
+│   ├── __init__.py
+│   ├── modeling       // 组网相关
+│   │   ├── architectures  // 模型架构，定义模型所需的各个模块
+│   │   │   ├── cls_model.py  // 方向分类器
+│   │   │   ├── det_model.py  // 检测
+│   │   │   └── rec_model.py  // 识别
+│   │   ├── backbones  // 骨干网络
+│   │   │   ├── det_mobilenet_v3.py  // 检测 mobilenet_v3
+│   │   │   ├── det_resnet_vd.py  
+│   │   │   ├── det_resnet_vd_sast.py
+│   │   │   ├── rec_mobilenet_v3.py  // 识别 mobilenet_v3
+│   │   │   ├── rec_resnet_fpn.py
+│   │   │   └── rec_resnet_vd.py
+│   │   ├── common_functions.py      // 公共函数
+│   │   ├── heads      // 头函数
+│   │   │   ├── cls_head.py          // 分类头
+│   │   │   ├── det_db_head.py       // db 检测头
+│   │   │   ├── det_east_head.py     // east 检测头
+│   │   │   ├── det_sast_head.py     // sast 检测头
+│   │   │   ├── rec_attention_head.py  // 识别 attention
+│   │   │   ├── rec_ctc_head.py        // 识别 ctc
+│   │   │   ├── rec_seq_encoder.py     // 识别 序列编码
+│   │   │   ├── rec_srn_all_head.py    // 识别 srn 相关
+│   │   │   └── self_attention         // srn attention
+│   │   │       └── model.py
+│   │   ├── losses    // 损失函数
+│   │   │   ├── cls_loss.py            // 方向分类器损失函数
+│   │   │   ├── det_basic_loss.py      // 检测基础loss
+│   │   │   ├── det_db_loss.py         // DB loss
+│   │   │   ├── det_east_loss.py       // EAST loss
+│   │   │   ├── det_sast_loss.py       // SAST loss
+│   │   │   ├── rec_attention_loss.py  // attention loss
+│   │   │   ├── rec_ctc_loss.py        // ctc loss
+│   │   │   └── rec_srn_loss.py        // srn loss
+│   │   └── stns     // 空间变换网络
+│   │       └── tps.py   // TPS 变换
+│   ├── optimizer.py  // 优化器
+│   ├── postprocess   // 后处理
+│   │   ├── db_postprocess.py     // DB 后处理
+│   │   ├── east_postprocess.py   // East 后处理
+│   │   ├── lanms                 // lanms 相关
+│   │   │   ...
+│   │   ├── locality_aware_nms.py // nms
+│   │   └── sast_postprocess.py   // sast 后处理
+│   └── utils  // 工具
+│       ├── character.py       // 字符处理，包括对文本的编码和解码，计算预测准确率
+│       ├── check.py           // 参数加载检查
+│       ├── ic15_dict.txt      // 英文数字字典，区分大小写
+│       ├── ppocr_keys_v1.txt  // 中文字典，用于训练中文模型
+│       ├── save_load.py       // 模型保存和加载函数
+│       ├── stats.py           // 统计
+│       └── utility.py         // 工具函数，包含输入参数是否合法等相关检查工具
+├── README_en.md    // 说明文档
+├── README.md
+├── requirments.txt // 安装依赖
+├── setup.py        // whl包打包脚本
+└── tools           // 启动工具
+    ├── eval.py                 // 评估函数
+    ├── eval_utils              // 评估工具
+    │   ├── eval_cls_utils.py   // 分类相关
+    │   ├── eval_det_iou.py     // 检测 iou 相关
+    │   ├── eval_det_utils.py   // 检测相关
+    │   ├── eval_rec_utils.py   // 识别相关
+    │   └── __init__.py
+    ├── export_model.py         // 导出 infer 模型
+    ├── infer                   // 基于预测引擎预测
+    │   ├── predict_cls.py  
+    │   ├── predict_det.py
+    │   ├── predict_rec.py
+    │   ├── predict_system.py
+    │   └── utility.py
+    ├── infer_cls.py            // 基于训练引擎 预测分类
+    ├── infer_det.py            // 基于训练引擎 预测检测
+    ├── infer_rec.py            // 基于训练引擎 预测识别
+    ├── program.py              // 整体流程
+    ├── test_hubserving.py  
+    └── train.py                // 启动训练
+
+```
--- a/doc/doc_ch/tricks.md
+++ b/doc/doc_ch/tricks.md
@ -1,68 +0,0 @@
-## 中文OCR训练预测技巧
-这里整理了一些中文OCR训练预测技巧，持续更新中，欢迎各位小伙伴贡献OCR炼丹秘籍～
- [更换骨干网络](#更换骨干网络)
- [中文长文本识别](#中文长文本识别)
- [空格识别](#空格识别)
-
-<a name="更换骨干网络"></a>
-#### 1、更换骨干网络
- **问题描述**
-
-  目前PaddleOCR中使用的骨干网络有ResNet_vd系列和MobileNetV3系列，更换骨干网络是否有助于效果提升？更换时需要注意什么？
-
- **炼丹建议**
-
-  - 无论是文字检测，还是文字识别，骨干网络的选择是预测效果和预测效率的权衡。一般，选择更大规模的骨干网络，例如ResNet101_vd，则检测或识别更准确，但预测耗时相应也会增加。而选择更小规模的骨干网络，例如MobileNetV3_small_x0_35，则预测更快，但检测或识别的准确率会大打折扣。幸运的是不同骨干网络的检测或识别效果与在ImageNet数据集图像1000分类任务效果正相关。[**飞桨图像分类套件PaddleClas**](https://github.com/PaddlePaddle/PaddleClas)汇总了ResNet_vd、Res2Net、HRNet、MobileNetV3、GhostNet等23种系列的分类网络结构，在上述图像分类任务的top1识别准确率，GPU(V100和T4)和CPU(骁龙855)的预测耗时以及相应的[**117个预训练模型下载地址**](https://paddleclas.readthedocs.io/zh_CN/latest/models/models_intro.html)。
-  - 文字检测骨干网络的替换，主要是确定类似与ResNet的4个stages，以方便集成后续的类似FPN的检测头。此外，对于文字检测问题，使用ImageNet训练的分类预训练模型，可以加速收敛和效果提升。
-  - 文字识别的骨干网络的替换，需要注意网络宽高stride的下降位置。由于文本识别一般宽高比例很大，因此高度下降频率少一些，宽度下降频率多一些。可以参考PaddleOCR中[MobileNetV3骨干网络](https://github.com/PaddlePaddle/PaddleOCR/blob/develop/ppocr/modeling/backbones/rec_mobilenet_v3.py)的改动。
-
-<a name="中文长文本识别"></a>
-#### 2、中文长文本识别
- **问题描述**
-  
-  中文识别模型训练时分辨率最大是[3,32,320]，如果待识别的文本图像太长，如下图所示，该如何适配？
-  
-  <div align="center">
-    <img src="../tricks/long_text_examples.jpg" width="600">
-  </div>
-  
- **炼丹建议**
-    
-  在中文识别模型训练时，并不是采用直接将训练样本缩放到[3,32,320]进行训练，而是先等比例缩放图像，保证图像高度为32，宽度不足320的部分补0，宽高比大于10的样本直接丢弃。预测时，如果是单张图像预测，则按上述操作直接对图像缩放，不做宽度320的限制。如果是多张图预测，则采用batch方式预测，每个batch的宽度动态变换，采用这个batch中最长宽度。[参考代码如下](https://github.com/PaddlePaddle/PaddleOCR/blob/develop/tools/infer/predict_rec.py)：
-  
-  ```
-    def resize_norm_img(self, img, max_wh_ratio):
-        imgC, imgH, imgW = self.rec_image_shape
-        assert imgC == img.shape[2]
-        if self.character_type == "ch":
-            imgW = int((32 * max_wh_ratio))
-        h, w = img.shape[:2]
-        ratio = w / float(h)
-        if math.ceil(imgH * ratio) > imgW:
-            resized_w = imgW
-        else:
-            resized_w = int(math.ceil(imgH * ratio))
-        resized_image = cv2.resize(img, (resized_w, imgH))
-        resized_image = resized_image.astype('float32')
-        resized_image = resized_image.transpose((2, 0, 1)) / 255
-        resized_image -= 0.5
-        resized_image /= 0.5
-        padding_im = np.zeros((imgC, imgH, imgW), dtype=np.float32)
-        padding_im[:, :, 0:resized_w] = resized_image
-        return padding_im  
-  ```
-
-<a name="空格识别"></a>
-#### 3、空格识别
- **问题描述**
-
-   如下图所示，对于中英文混合场景，为了便于阅读和使用识别结果，往往需要将单词之间的空格识别出来，这种情况如何适配？
-   
-  <div align="center">
-    <img src="../imgs_results/chinese_db_crnn_server/en_paper.jpg" width="600">
-  </div>
-  
- **炼丹建议**
-  
-   空格识别可以考虑以下两种方案:(1)优化文本检测算法。检测结果在空格处将文本断开。这种方案在检测数据标注时，需要将含有空格的文本行分成好多段。(2)优化文本识别算法。在识别字典里面引入空格字符，然后在识别的训练数据中，如果用空行，进行标注。此外，合成数据时，通过拼接训练数据，生成含有空格的文本。PaddleOCR目前采用的是第二种方案。
-   
--- a/doc/doc_ch/update.md
+++ b/doc/doc_ch/update.md
@ -1,4 +1,9 @@
 # 更新
+- 2020.9.22 更新PP-OCR技术文章，https://arxiv.org/abs/2009.09941
+- 2020.9.19 更新超轻量压缩ppocr_mobile_slim系列模型，整体模型3.5M(详见[PP-OCR Pipline](../../README_ch.md#PP-OCR))，适合在移动端部署使用。[模型下载](../../README_ch.md#模型下载)
+- 2020.9.17 更新超轻量ppocr_mobile系列和通用ppocr_server系列中英文ocr模型，媲美商业效果。[模型下载](../../README_ch.md#模型下载)
+- 2020.9.17 更新[英文识别模型](./models_list.md#english-recognition-model)和[多语种识别模型](./models_list.md#english-recognition-model)，已支持`德语、法语、日语、韩语`，更多语种识别模型将持续更新。
+- 2020.8.26 更新OCR相关的84个常见问题及解答，具体参考[FAQ](./FAQ.md)
 - 2020.8.24 支持通过whl包安装使用PaddleOCR，具体参考[Paddleocr Package使用说明](https://github.com/PaddlePaddle/PaddleOCR/blob/develop/doc/doc_ch/whl.md)
 - 2020.8.21 更新8月18日B站直播课回放和PPT，课节2，易学易用的OCR工具大礼包，[获取地址](https://aistudio.baidu.com/aistudio/education/group/info/1519)
 - 2020.8.16 开源文本检测算法[SAST](https://arxiv.org/abs/1908.05498)和文本识别算法[SRN](https://arxiv.org/abs/2003.12294)
@ -7,8 +12,8 @@
 - 2020.7.15 完善预测部署，添加基于C++预测引擎推理、服务化部署和端侧部署方案，以及超轻量级中文OCR模型预测耗时Benchmark
 - 2020.7.15 整理OCR相关数据集、常用数据标注以及合成工具
 - 2020.7.9 添加支持空格的识别模型，识别效果，预测及训练方式请参考快速开始和文本识别训练相关文档
- 2020.7.9 添加数据增强、学习率衰减策略,具体参考[配置文件](./doc/doc_ch/config.md)
- 2020.6.8 添加[数据集](./doc/doc_ch/datasets.md)，并保持持续更新
+- 2020.7.9 添加数据增强、学习率衰减策略,具体参考[配置文件](./config.md)
+- 2020.6.8 添加[数据集](./datasets.md)，并保持持续更新
 - 2020.6.5 支持 `attetnion` 模型导出 `inference_model`
 - 2020.6.5 支持单独预测识别时，输出结果得分
 - 2020.5.30 提供超轻量级中文OCR在线体验
--- a/doc/doc_ch/visualization.md
+++ b/doc/doc_ch/visualization.md
@ -1,67 +1,49 @@
 # 效果展示
- [超轻量级中文OCR效果展示](#超轻量级中文OCR)
- [通用中文OCR效果展示](#通用中文OCR)
- [支持空格的中文OCR效果展示](#支持空格的中文OCR)

-<a name="超轻量级中文OCR"></a>
-## 超轻量级中文OCR效果展示
+<a name="通用ppocr_server_1.1效果展示"></a>
+## 通用ppocr_server_1.1效果展示

 <div align="center">
-    <img src="../imgs_results/1.jpg" width="800">
+    <img src="../imgs_results/1101.jpg" width="800">
+    <img src="../imgs_results/1102.jpg" width="800">
+    <img src="../imgs_results/1103.jpg" width="800">
+    <img src="../imgs_results/1104.jpg" width="800">
+    <img src="../imgs_results/1105.jpg" width="800">
+    <img src="../imgs_results/1106.jpg" width="800">
 </div>

-<div align="center">
-    <img src="../imgs_results/7.jpg" width="800">
-</div>

+<a name="英文识别模型效果展示"></a>
+## 英文识别模型效果展示
 <div align="center">
-    <img src="../imgs_results/12.jpg" width="800">
+    <img src="../imgs_results/img_12.jpg" width="800">
 </div>

-<div align="center">
-    <img src="../imgs_results/4.jpg" width="800">
-</div>

+<a name="多语言识别模型效果展示"></a>
+## 多语言识别模型效果展示
 <div align="center">
-    <img src="../imgs_results/6.jpg" width="800">
+    <img src="../imgs_results/1110.jpg" width="800">
+    <img src="../imgs_results/1112.jpg" width="800">
 </div>

-<div align="center">
-    <img src="../imgs_results/9.jpg" width="800">
-</div>
+
+<a name="超轻量ppocr_mobile_1.0效果展示"></a>
+## 超轻量ppocr_mobile_1.0效果展示

 <div align="center">
+    <img src="../imgs_results/1.jpg" width="800">
+    <img src="../imgs_results/7.jpg" width="800">
+    <img src="../imgs_results/6.jpg" width="800">
    <img src="../imgs_results/16.png" width="800">
 </div>

-<div align="center">
-    <img src="../imgs_results/22.jpg" width="800">
-</div>

-<a name="通用中文OCR"></a>
-## 通用中文OCR效果展示
+<a name="通用ppocr_server_1.0效果展示"></a>
+## 通用ppocr_server_1.0效果展示

 <div align="center">
    <img src="../imgs_results/chinese_db_crnn_server/11.jpg" width="800">
-</div>
-
-<div align="center">
    <img src="../imgs_results/chinese_db_crnn_server/2.jpg" width="800">
-</div>
-
-<div align="center">
    <img src="../imgs_results/chinese_db_crnn_server/8.jpg" width="800">
 </div>
-
-<a name="支持空格的中文OCR"></a>
-## 支持空格的中文OCR效果展示
-
-### 轻量级模型
-<div align="center">
-    <img src="../imgs_results/img_11.jpg" width="800">
-</div>
-
-### 通用模型
-<div align="center">
-    <img src="../imgs_results/chinese_db_crnn_server/en_paper.jpg" width="800">
-</div>
--- a/Show More
+++ b/Show More