Merge branch 'develop' of https://github.com/PaddlePaddle/PaddleOCR into fixocr

5 years ago · 2ee1225308
parent bee2b15ea8 52ae30b068
commit 2ee1225308
140 changed files with 31328 additions and 510 deletions
--- a/README.md
+++ b/README.md
--- a/README_cn.md
+++ b/README_cn.md
@ -0,0 +1,213 @@
+[English](README.md) | 简体中文
+
+## 简介
+PaddleOCR旨在打造一套丰富、领先、且实用的OCR工具库，助力使用者训练出更好的模型，并应用落地。
+
+**直播预告：2020年7月21日晚8点B站直播，PaddleOCR开源大礼包全面解读，直播地址当天更新**
+
+**近期更新**
+- 2020.7.15 添加基于EasyEdge和Paddle-Lite的移动端DEMO，支持iOS和Android系统
+- 2020.7.15 完善预测部署，添加基于C++预测引擎推理、服务化部署和端侧部署方案，以及超轻量级中文OCR模型预测耗时Benchmark
+- 2020.7.15 整理OCR相关数据集、常用数据标注以及合成工具
+- 2020.7.9 添加支持空格的识别模型，识别效果，预测及训练方式请参考快速开始和文本识别训练相关文档
+- 2020.7.9 添加数据增强、学习率衰减策略,具体参考[配置文件](./doc/doc_ch/config.md)
+- [more](./doc/doc_ch/update.md)
+
+
+## 特性
+- 超轻量级中文OCR模型，总模型仅8.6M
+    - 单模型支持中英文数字组合识别、竖排文本识别、长文本识别
+    - 检测模型DB（4.1M）+识别模型CRNN（4.5M）
+- 实用通用中文OCR模型
+- 多种预测推理部署方案，包括服务部署和端侧部署
+- 多种文本检测训练算法，EAST、DB
+- 多种文本识别训练算法，Rosetta、CRNN、STAR-Net、RARE
+- 可运行于Linux、Windows、MacOS等多种系统
+
+## 快速体验
+
+<div align="center">
+    <img src="doc/imgs_results/11.jpg" width="800">
+</div>
+
+上图是超轻量级中文OCR模型效果展示，更多效果图请见[效果展示页面](./doc/doc_ch/visualization.md)。
+
+- 超轻量级中文OCR在线体验地址：https://www.paddlepaddle.org.cn/hub/scene/ocr
+- 移动端DEMO体验(基于EasyEdge和Paddle-Lite, 支持iOS和Android系统)：[安装包二维码获取地址](https://ai.baidu.com/easyedge/app/openSource?from=paddlelite) 
+
+   Android手机也可以扫描下面二维码安装体验。
+
+<div align="center">
+<img src="./doc/ocr-android-easyedge.png"  width = "200" height = "200" />
+</div>
+
+- [**中文OCR模型快速使用**](./doc/doc_ch/quickstart.md)
+
+
+## 中文OCR模型列表
+
+|模型名称|模型简介|检测模型地址|识别模型地址|支持空格的识别模型地址|
+|-|-|-|-|-|
+|chinese_db_crnn_mobile|超轻量级中文OCR模型|[inference模型](https://paddleocr.bj.bcebos.com/ch_models/ch_det_mv3_db_infer.tar) / [预训练模型](https://paddleocr.bj.bcebos.com/ch_models/ch_det_mv3_db.tar)|[inference模型](https://paddleocr.bj.bcebos.com/ch_models/ch_rec_mv3_crnn_infer.tar) / [预训练模型](https://paddleocr.bj.bcebos.com/ch_models/ch_rec_mv3_crnn.tar)|[inference模型](https://paddleocr.bj.bcebos.com/ch_models/ch_rec_mv3_crnn_enhance_infer.tar) / [预训练模型](https://paddleocr.bj.bcebos.com/ch_models/ch_rec_mv3_crnn_enhance.tar)
+|chinese_db_crnn_server|通用中文OCR模型|[inference模型](https://paddleocr.bj.bcebos.com/ch_models/ch_det_r50_vd_db_infer.tar) / [预训练模型](https://paddleocr.bj.bcebos.com/ch_models/ch_det_r50_vd_db.tar)|[inference模型](https://paddleocr.bj.bcebos.com/ch_models/ch_rec_r34_vd_crnn_infer.tar) / [预训练模型](https://paddleocr.bj.bcebos.com/ch_models/ch_rec_r34_vd_crnn.tar)|[inference模型](https://paddleocr.bj.bcebos.com/ch_models/ch_rec_r34_vd_crnn_enhance_infer.tar) / [预训练模型](https://paddleocr.bj.bcebos.com/ch_models/ch_rec_r34_vd_crnn_enhance.tar)
+
+## 文档教程
+- [快速安装](./doc/doc_ch/installation.md)
+- [中文OCR模型快速使用](./doc/doc_ch/quickstart.md)
+- 算法介绍
+    - [文本检测](#文本检测算法)
+    - [文本识别](#文本识别算法)
+    - [端到端OCR](#端到端OCR算法)
+- 模型训练/评估
+    - [文本检测](./doc/doc_ch/detection.md)
+    - [文本识别](./doc/doc_ch/recognition.md)
+    - [yml参数配置文件介绍](./doc/doc_ch/config.md)
+    - [中文OCR训练预测技巧](./doc/doc_ch/tricks.md)
+- 预测部署
+    - [基于Python预测引擎推理](./doc/doc_ch/inference.md)
+    - [基于C++预测引擎推理](./deploy/cpp_infer/readme.md)
+    - [服务化部署](./doc/doc_ch/serving.md)
+    - [端侧部署](./deploy/lite/readme.md)
+    - 模型量化压缩（coming soon）
+    - [Benchmark](./doc/doc_ch/benchmark.md)
+- 数据集
+    - [通用中英文OCR数据集](./doc/doc_ch/datasets.md)
+    - [手写中文OCR数据集](./doc/doc_ch/handwritten_datasets.md)
+    - [垂类多语言OCR数据集](./doc/doc_ch/vertical_and_multilingual_datasets.md)
+    - [常用数据标注工具](./doc/doc_ch/data_annotation.md)
+    - [常用数据合成工具](./doc/doc_ch/data_synthesis.md)
+- [FAQ](#FAQ)
+- 效果展示
+    - [超轻量级中文OCR效果展示](#超轻量级中文OCR效果展示)
+    - [通用中文OCR效果展示](#通用中文OCR效果展示)
+    - [支持空格的中文OCR效果展示](#支持空格的中文OCR效果展示)
+- [技术交流群](#欢迎加入PaddleOCR技术交流群)
+- [参考文献](./doc/doc_ch/reference.md)
+- [许可证书](#许可证书)
+- [贡献代码](#贡献代码)
+
+<a name="算法介绍"></a>
+## 算法介绍
+<a name="文本检测算法"></a>
+### 1.文本检测算法
+
+PaddleOCR开源的文本检测算法列表：
+- [x]  EAST([paper](https://arxiv.org/abs/1704.03155))
+- [x]  DB([paper](https://arxiv.org/abs/1911.08947))
+- [ ]  SAST([paper](https://arxiv.org/abs/1908.05498))(百度自研, coming soon)
+
+在ICDAR2015文本检测公开数据集上，算法效果如下：
+
+|模型|骨干网络|precision|recall|Hmean|下载链接|
+|-|-|-|-|-|-|
+|EAST|ResNet50_vd|88.18%|85.51%|86.82%|[下载链接](https://paddleocr.bj.bcebos.com/det_r50_vd_east.tar)|
+|EAST|MobileNetV3|81.67%|79.83%|80.74%|[下载链接](https://paddleocr.bj.bcebos.com/det_mv3_east.tar)|
+|DB|ResNet50_vd|83.79%|80.65%|82.19%|[下载链接](https://paddleocr.bj.bcebos.com/det_r50_vd_db.tar)|
+|DB|MobileNetV3|75.92%|73.18%|74.53%|[下载链接](https://paddleocr.bj.bcebos.com/det_mv3_db.tar)|
+
+使用[LSVT](https://github.com/PaddlePaddle/PaddleOCR/blob/develop/doc/doc_ch/datasets.md#1icdar2019-lsvt)街景数据集共3w张数据，训练中文检测模型的相关配置和预训练文件如下：
+|模型|骨干网络|配置文件|预训练模型|
+|-|-|-|-|
+|超轻量中文模型|MobileNetV3|det_mv3_db.yml|[下载链接](https://paddleocr.bj.bcebos.com/ch_models/ch_det_mv3_db.tar)|
+|通用中文OCR模型|ResNet50_vd|det_r50_vd_db.yml|[下载链接](https://paddleocr.bj.bcebos.com/ch_models/ch_det_r50_vd_db.tar)|
+
+* 注： 上述DB模型的训练和评估，需设置后处理参数box_thresh=0.6，unclip_ratio=1.5，使用不同数据集、不同模型训练，可调整这两个参数进行优化
+
+PaddleOCR文本检测算法的训练和使用请参考文档教程中[模型训练/评估中的文本检测部分](./doc/doc_ch/detection.md)。
+
+<a name="文本识别算法"></a>
+### 2.文本识别算法
+
+PaddleOCR开源的文本识别算法列表：
+- [x]  CRNN([paper](https://arxiv.org/abs/1507.05717))
+- [x]  Rosetta([paper](https://arxiv.org/abs/1910.05085))
+- [x]  STAR-Net([paper](http://www.bmva.org/bmvc/2016/papers/paper043/index.html))
+- [x]  RARE([paper](https://arxiv.org/abs/1603.03915v1))
+- [ ]  SRN([paper](https://arxiv.org/abs/2003.12294))(百度自研, coming soon)
+
+参考[DTRB](https://arxiv.org/abs/1904.01906)文字识别训练和评估流程，使用MJSynth和SynthText两个文字识别数据集训练，在IIIT, SVT, IC03, IC13, IC15, SVTP, CUTE数据集上进行评估，算法效果如下：
+
+|模型|骨干网络|Avg Accuracy|模型存储命名|下载链接|
+|-|-|-|-|-|
+|Rosetta|Resnet34_vd|80.24%|rec_r34_vd_none_none_ctc|[下载链接](https://paddleocr.bj.bcebos.com/rec_r34_vd_none_none_ctc.tar)|
+|Rosetta|MobileNetV3|78.16%|rec_mv3_none_none_ctc|[下载链接](https://paddleocr.bj.bcebos.com/rec_mv3_none_none_ctc.tar)|
+|CRNN|Resnet34_vd|82.20%|rec_r34_vd_none_bilstm_ctc|[下载链接](https://paddleocr.bj.bcebos.com/rec_r34_vd_none_bilstm_ctc.tar)|
+|CRNN|MobileNetV3|79.37%|rec_mv3_none_bilstm_ctc|[下载链接](https://paddleocr.bj.bcebos.com/rec_mv3_none_bilstm_ctc.tar)|
+|STAR-Net|Resnet34_vd|83.93%|rec_r34_vd_tps_bilstm_ctc|[下载链接](https://paddleocr.bj.bcebos.com/rec_r34_vd_tps_bilstm_ctc.tar)|
+|STAR-Net|MobileNetV3|81.56%|rec_mv3_tps_bilstm_ctc|[下载链接](https://paddleocr.bj.bcebos.com/rec_mv3_tps_bilstm_ctc.tar)|
+|RARE|Resnet34_vd|84.90%|rec_r34_vd_tps_bilstm_attn|[下载链接](https://paddleocr.bj.bcebos.com/rec_r34_vd_tps_bilstm_attn.tar)|
+|RARE|MobileNetV3|83.32%|rec_mv3_tps_bilstm_attn|[下载链接](https://paddleocr.bj.bcebos.com/rec_mv3_tps_bilstm_attn.tar)|
+
+使用[LSVT](https://github.com/PaddlePaddle/PaddleOCR/blob/develop/doc/doc_ch/datasets.md#1icdar2019-lsvt)街景数据集根据真值将图crop出来30w数据，进行位置校准。此外基于LSVT语料生成500w合成数据训练中文模型，相关配置和预训练文件如下：  
+
+|模型|骨干网络|配置文件|预训练模型|
+|-|-|-|-|
+|超轻量中文模型|MobileNetV3|rec_chinese_lite_train.yml|[下载链接](https://paddleocr.bj.bcebos.com/ch_models/ch_rec_mv3_crnn.tar)|
+|通用中文OCR模型|Resnet34_vd|rec_chinese_common_train.yml|[下载链接](https://paddleocr.bj.bcebos.com/ch_models/ch_rec_r34_vd_crnn.tar)|
+
+PaddleOCR文本识别算法的训练和使用请参考文档教程中[模型训练/评估中的文本识别部分](./doc/doc_ch/recognition.md)。
+
+<a name="端到端OCR算法"></a>
+### 3.端到端OCR算法
+- [ ]  [End2End-PSL](https://arxiv.org/abs/1909.07808)(百度自研, coming soon)
+
+## 效果展示
+
+<a name="超轻量级中文OCR效果展示"></a>
+### 1.超轻量级中文OCR效果展示  [more](./doc/doc_ch/visualization.md)
+
+<div align="center">
+    <img src="doc/imgs_results/1.jpg" width="800">
+</div>
+
+<a name="通用中文OCR效果展示"></a>
+### 2.通用中文OCR效果展示  [more](./doc/doc_ch/visualization.md)
+
+<div align="center">
+    <img src="doc/imgs_results/chinese_db_crnn_server/11.jpg" width="800">
+</div>
+
+<a name="支持空格的中文OCR效果展示"></a>
+### 3.支持空格的中文OCR效果展示  [more](./doc/doc_ch/visualization.md)
+
+<div align="center">
+    <img src="doc/imgs_results/chinese_db_crnn_server/en_paper.jpg" width="800">
+</div>
+
+<a name="FAQ"></a>
+## FAQ
+1. **转换attention识别模型时报错：KeyError: 'predict'**  
+问题已解，请更新到最新代码。  
+
+2. **关于推理速度**  
+图片中的文字较多时，预测时间会增，可以使用--rec_batch_num设置更小预测batch num，默认值为30，可以改为10或其他数值。  
+
+3. **服务部署与移动端部署**  
+预计6月中下旬会先后发布基于Serving的服务部署方案和基于Paddle Lite的移动端部署方案，欢迎持续关注。  
+
+4. **自研算法发布时间**  
+自研算法SAST、SRN、End2End-PSL都将在7-8月陆续发布，敬请期待。  
+
+[more](./doc/doc_ch/FAQ.md)
+
+<a name="欢迎加入PaddleOCR技术交流群"></a>
+## 欢迎加入PaddleOCR技术交流群
+请扫描下面二维码，完成问卷填写，获取加群二维码和OCR方向的炼丹秘籍
+
+<div align="center">
+<img src="./doc/joinus.jpg"  width = "200" height = "200" />
+</div>
+
+<a name="许可证书"></a>
+## 许可证书
+本项目的发布受<a href="https://github.com/PaddlePaddle/PaddleOCR/blob/master/LICENSE">Apache 2.0 license</a>许可认证。
+
+<a name="贡献代码"></a>
+## 贡献代码
+我们非常欢迎你为PaddleOCR贡献代码，也十分感谢你的反馈。
+
+- 非常感谢 [Khanh Tran](https://github.com/xxxpsyduck) 贡献了英文文档。
+- 非常感谢 [zhangxin](https://github.com/ZhangXinNan)([Blog](https://blog.csdn.net/sdlypyzq)) 贡献新的可视化方式、添加.gitgnore、处理手动设置PYTHONPATH环境变量的问题
+- 非常感谢 [lyl120117](https://github.com/lyl120117) 贡献打印网络结构的代码
+- 非常感谢 [xiangyubo](https://github.com/xiangyubo) 贡献手写中文OCR数据集
+- 非常感谢 [authorfu](https://github.com/authorfu) 贡献Android和[xiadeye](https://github.com/xiadeye) 贡献IOS的demo代码
--- a/README_en.md
+++ b/README_en.md
--- a/deploy/android_demo/.gitignore
+++ b/deploy/android_demo/.gitignore
@ -0,0 +1,9 @@
+*.iml
+.gradle
+/local.properties
+/.idea/*
+.DS_Store
+/build
+/captures
+.externalNativeBuild
+
--- a/deploy/android_demo/README.md
+++ b/deploy/android_demo/README.md
@ -0,0 +1,19 @@
+# 如何快速测试
+### 1. 安装最新版本的Android Studio
+可以从https://developer.android.com/studio下载。本Demo使用是4.0版本Android Studio编写。
+
+### 2. 按照NDK 20 以上版本 
+Demo测试的时候使用的是NDK 20b版本，20版本以上均可以支持编译成功。
+
+如果您是初学者，可以用以下方式安装和测试NDK编译环境。
+点击 File -> New ->New Project，  新建  "Native C++" project
+
+### 3. 导入项目
+点击 File->New->Import Project...， 然后跟着Android Studio的引导导入
+
+
+# 获得更多支持
+前往[端计算模型生成平台EasyEdge](https://ai.baidu.com/easyedge/app/open_source_demo?referrerUrl=paddlelite)，获得更多开发支持：
+
+- Demo APP：可使用手机扫码安装，方便手机端快速体验文字识别
+- SDK：模型被封装为适配不同芯片硬件和操作系统SDK，包括完善的接口，方便进行二次开发
--- a/deploy/android_demo/app/.gitignore
+++ b/deploy/android_demo/app/.gitignore
@ -0,0 +1 @@
+/build
--- a/deploy/android_demo/app/build.gradle
+++ b/deploy/android_demo/app/build.gradle
@ -0,0 +1,95 @@
+import java.security.MessageDigest
+
+apply plugin: 'com.android.application'
+
+android {
+    compileSdkVersion 28
+    defaultConfig {
+        applicationId "com.baidu.paddle.lite.demo.ocr"
+        minSdkVersion 15
+        targetSdkVersion 28
+        versionCode 1
+        versionName "1.0"
+        testInstrumentationRunner "android.support.test.runner.AndroidJUnitRunner"
+        externalNativeBuild {
+            cmake {
+                cppFlags "-std=c++11 -frtti -fexceptions -Wno-format"
+                arguments '-DANDROID_PLATFORM=android-23', '-DANDROID_STL=c++_shared' ,"-DANDROID_ARM_NEON=TRUE"
+            }
+        }
+        ndk {
+            // abiFilters "arm64-v8a", "armeabi-v7a"
+            abiFilters   "arm64-v8a", "armeabi-v7a"
+            ldLibs "jnigraphics"
+        }
+    }
+    buildTypes {
+        release {
+            minifyEnabled false
+            proguardFiles getDefaultProguardFile('proguard-android-optimize.txt'), 'proguard-rules.pro'
+        }
+    }
+    externalNativeBuild {
+        cmake {
+            path "src/main/cpp/CMakeLists.txt"
+            version "3.10.2"
+        }
+    }
+}
+
+dependencies {
+    implementation fileTree(include: ['*.jar'], dir: 'libs')
+    implementation 'com.android.support:appcompat-v7:28.0.0'
+    implementation 'com.android.support.constraint:constraint-layout:1.1.3'
+    implementation 'com.android.support:design:28.0.0'
+    testImplementation 'junit:junit:4.12'
+    androidTestImplementation 'com.android.support.test:runner:1.0.2'
+    androidTestImplementation 'com.android.support.test.espresso:espresso-core:3.0.2'
+}
+
+def archives = [
+        [
+                'src' : 'https://paddlelite-demo.bj.bcebos.com/libs/android/paddle_lite_libs_v2_6_1.tar.gz',
+                'dest': 'PaddleLite'
+        ],
+        [
+                'src' : 'https://paddlelite-demo.bj.bcebos.com/libs/android/opencv-4.2.0-android-sdk.tar.gz',
+                'dest': 'OpenCV'
+        ],
+        [
+                'src' : 'https://paddleocr.bj.bcebos.com/deploy/lite/ocr_v1_for_cpu.tar.gz',
+                'dest' : 'src/main/assets/models/ocr_v1_for_cpu'
+        ]
+]
+
+task downloadAndExtractArchives(type: DefaultTask) {
+    doFirst {
+        println "Downloading and extracting archives including libs and models"
+    }
+    doLast {
+        // Prepare cache folder for archives
+        String cachePath = "cache"
+        if (!file("${cachePath}").exists()) {
+            mkdir "${cachePath}"
+        }
+        archives.eachWithIndex { archive, index ->
+            MessageDigest messageDigest = MessageDigest.getInstance('MD5')
+            messageDigest.update(archive.src.bytes)
+            String cacheName = new BigInteger(1, messageDigest.digest()).toString(32)
+            // Download the target archive if not exists
+            boolean copyFiles = !file("${archive.dest}").exists()
+            if (!file("${cachePath}/${cacheName}.tar.gz").exists()) {
+                ant.get(src: archive.src, dest: file("${cachePath}/${cacheName}.tar.gz"))
+                copyFiles = true; // force to copy files from the latest archive files
+            }
+            // Extract the target archive if its dest path does not exists
+            if (copyFiles) {
+                copy {
+                    from tarTree("${cachePath}/${cacheName}.tar.gz")
+                    into "${archive.dest}"
+                }
+            }
+        }
+    }
+}
+preBuild.dependsOn downloadAndExtractArchives
--- a/deploy/android_demo/app/proguard-rules.pro
+++ b/deploy/android_demo/app/proguard-rules.pro
@ -0,0 +1,21 @@
+# Add project specific ProGuard rules here.
+# You can control the set of applied configuration files using the
+# proguardFiles setting in build.gradle.
+#
+# For more details, see
+#   http://developer.android.com/guide/developing/tools/proguard.html
+
+# If your project uses WebView with JS, uncomment the following
+# and specify the fully qualified class name to the JavaScript interface
+# class:
+#-keepclassmembers class fqcn.of.javascript.interface.for.webview {
+#   public *;
+#}
+
+# Uncomment this to preserve the line number information for
+# debugging stack traces.
+#-keepattributes SourceFile,LineNumberTable
+
+# If you keep the line number information, uncomment this to
+# hide the original source file name.
+#-renamesourcefileattribute SourceFile
--- a/deploy/android_demo/app/src/androidTest/java/com/baidu/paddle/lite/demo/ocr/ExampleInstrumentedTest.java
+++ b/deploy/android_demo/app/src/androidTest/java/com/baidu/paddle/lite/demo/ocr/ExampleInstrumentedTest.java
@ -0,0 +1,26 @@
+package com.baidu.paddle.lite.demo.ocr;
+
+import android.content.Context;
+import android.support.test.InstrumentationRegistry;
+import android.support.test.runner.AndroidJUnit4;
+
+import org.junit.Test;
+import org.junit.runner.RunWith;
+
+import static org.junit.Assert.*;
+
+/**
+ * Instrumented test, which will execute on an Android device.
+ *
+ * @see <a href="http://d.android.com/tools/testing">Testing documentation</a>
+ */
+@RunWith(AndroidJUnit4.class)
+public class ExampleInstrumentedTest {
+    @Test
+    public void useAppContext() {
+        // Context of the app under test.
+        Context appContext = InstrumentationRegistry.getTargetContext();
+
+        assertEquals("com.baidu.paddle.lite.demo", appContext.getPackageName());
+    }
+}
--- a/deploy/android_demo/app/src/main/AndroidManifest.xml
+++ b/deploy/android_demo/app/src/main/AndroidManifest.xml
@ -0,0 +1,30 @@
+<?xml version="1.0" encoding="utf-8"?>
+<manifest xmlns:android="http://schemas.android.com/apk/res/android"
+          package="com.baidu.paddle.lite.demo.ocr">
+
+    <uses-permission android:name="android.permission.WRITE_EXTERNAL_STORAGE"/>
+    <uses-permission android:name="android.permission.READ_EXTERNAL_STORAGE"/>
+    <uses-permission android:name="android.permission.CAMERA"/>
+
+
+    <application
+            android:allowBackup="true"
+            android:icon="@mipmap/ic_launcher"
+            android:label="@string/app_name"
+            android:roundIcon="@mipmap/ic_launcher_round"
+            android:supportsRtl="true"
+            android:theme="@style/AppTheme">
+        <activity android:name="com.baidu.paddle.lite.demo.ocr.MainActivity">
+            <intent-filter>
+                <action android:name="android.intent.action.MAIN"/>
+
+                <category android:name="android.intent.category.LAUNCHER"/>
+            </intent-filter>
+        </activity>
+        <activity
+                android:name="com.baidu.paddle.lite.demo.ocr.SettingsActivity"
+                android:label="Settings">
+        </activity>
+    </application>
+
+</manifest>
--- a/deploy/android_demo/app/src/main/assets/images/5.jpg
+++ b/deploy/android_demo/app/src/main/assets/images/5.jpg
--- a/deploy/android_demo/app/src/main/assets/labels/ppocr_keys_v1.txt
+++ b/deploy/android_demo/app/src/main/assets/labels/ppocr_keys_v1.txt
--- a/deploy/android_demo/app/src/main/cpp/CMakeLists.txt
+++ b/deploy/android_demo/app/src/main/cpp/CMakeLists.txt
@ -0,0 +1,117 @@
+# For more information about using CMake with Android Studio, read the
+# documentation: https://d.android.com/studio/projects/add-native-code.html
+
+# Sets the minimum version of CMake required to build the native library.
+
+cmake_minimum_required(VERSION 3.4.1)
+
+# Creates and names a library, sets it as either STATIC or SHARED, and provides
+# the relative paths to its source code. You can define multiple libraries, and
+# CMake builds them for you. Gradle automatically packages shared libraries with
+# your APK.
+
+set(PaddleLite_DIR "${CMAKE_CURRENT_SOURCE_DIR}/../../../PaddleLite")
+include_directories(${PaddleLite_DIR}/cxx/include)
+
+set(OpenCV_DIR "${CMAKE_CURRENT_SOURCE_DIR}/../../../OpenCV/sdk/native/jni")
+message(STATUS "opencv dir: ${OpenCV_DIR}")
+find_package(OpenCV REQUIRED)
+message(STATUS "OpenCV libraries: ${OpenCV_LIBS}")
+include_directories(${OpenCV_INCLUDE_DIRS})
+aux_source_directory(. SOURCES)
+set(CMAKE_CXX_FLAGS
+        "${CMAKE_CXX_FLAGS} -ffast-math -Ofast -Os"
+        )
+set(CMAKE_CXX_FLAGS
+        "${CMAKE_CXX_FLAGS} -fvisibility=hidden -fvisibility-inlines-hidden -fdata-sections -ffunction-sections"
+        )
+set(CMAKE_SHARED_LINKER_FLAGS
+        "${CMAKE_SHARED_LINKER_FLAGS} -Wl,--gc-sections -Wl,-z,nocopyreloc")
+
+add_library(
+        # Sets the name of the library.
+        Native
+        # Sets the library as a shared library.
+        SHARED
+        # Provides a relative path to your source file(s).
+        ${SOURCES})
+
+find_library(
+        # Sets the name of the path variable.
+        log-lib
+        # Specifies the name of the NDK library that you want CMake to locate.
+        log)
+
+add_library(
+        # Sets the name of the library.
+        paddle_light_api_shared
+        # Sets the library as a shared library.
+        SHARED
+        # Provides a relative path to your source file(s).
+        IMPORTED)
+
+set_target_properties(
+        # Specifies the target library.
+        paddle_light_api_shared
+        # Specifies the parameter you want to define.
+        PROPERTIES
+        IMPORTED_LOCATION
+        ${PaddleLite_DIR}/cxx/libs/${ANDROID_ABI}/libpaddle_light_api_shared.so
+        # Provides the path to the library you want to import.
+)
+
+
+# Specifies libraries CMake should link to your target library. You can link
+# multiple libraries, such as libraries you define in this build script,
+# prebuilt third-party libraries, or system libraries.
+
+target_link_libraries(
+        # Specifies the target library.
+        Native
+        paddle_light_api_shared
+        ${OpenCV_LIBS}
+        GLESv2
+        EGL
+        jnigraphics
+        ${log-lib}
+)
+
+add_custom_command(
+        TARGET Native
+        POST_BUILD
+        COMMAND
+        ${CMAKE_COMMAND} -E copy
+        ${PaddleLite_DIR}/cxx/libs/${ANDROID_ABI}/libc++_shared.so
+        ${CMAKE_LIBRARY_OUTPUT_DIRECTORY}/libc++_shared.so)
+
+add_custom_command(
+        TARGET Native
+        POST_BUILD
+        COMMAND
+        ${CMAKE_COMMAND} -E copy
+        ${PaddleLite_DIR}/cxx/libs/${ANDROID_ABI}/libpaddle_light_api_shared.so
+        ${CMAKE_LIBRARY_OUTPUT_DIRECTORY}/libpaddle_light_api_shared.so)
+
+add_custom_command(
+        TARGET Native
+        POST_BUILD
+        COMMAND
+        ${CMAKE_COMMAND} -E copy
+        ${PaddleLite_DIR}/cxx/libs/${ANDROID_ABI}/libhiai.so
+        ${CMAKE_LIBRARY_OUTPUT_DIRECTORY}/libhiai.so)
+
+add_custom_command(
+        TARGET Native
+        POST_BUILD
+        COMMAND
+        ${CMAKE_COMMAND} -E copy
+        ${PaddleLite_DIR}/cxx/libs/${ANDROID_ABI}/libhiai_ir.so
+        ${CMAKE_LIBRARY_OUTPUT_DIRECTORY}/libhiai_ir.so)
+
+add_custom_command(
+        TARGET Native
+        POST_BUILD
+        COMMAND
+        ${CMAKE_COMMAND} -E copy
+        ${PaddleLite_DIR}/cxx/libs/${ANDROID_ABI}/libhiai_ir_build.so
+        ${CMAKE_LIBRARY_OUTPUT_DIRECTORY}/libhiai_ir_build.so)
--- a/deploy/android_demo/app/src/main/cpp/common.h
+++ b/deploy/android_demo/app/src/main/cpp/common.h
@ -0,0 +1,48 @@
+//
+// Created by fu on 4/25/18.
+//
+
+#pragma once
+#import <vector>
+#import <numeric>
+
+#ifdef __ANDROID__
+
+#include <android/log.h>
+
+#define LOG_TAG "OCR_NDK"
+
+#define LOGI(...) \
+  __android_log_print(ANDROID_LOG_INFO,  LOG_TAG,  __VA_ARGS__)
+#define LOGW(...) \
+  __android_log_print(ANDROID_LOG_WARN,  LOG_TAG,  __VA_ARGS__)
+#define LOGE(...) \
+  __android_log_print(ANDROID_LOG_ERROR,  LOG_TAG,  __VA_ARGS__)
+#else
+#include <stdio.h>
+#define LOGI(format, ...) \
+  fprintf(stdout, "[" LOG_TAG "]" format "\n", ##__VA_ARGS__)
+#define LOGW(format, ...) \
+  fprintf(stdout, "[" LOG_TAG "]" format "\n", ##__VA_ARGS__)
+#define LOGE(format, ...) \
+  fprintf(stderr, "[" LOG_TAG "]Error: " format "\n", ##__VA_ARGS__)
+#endif
+
+enum RETURN_CODE {
+    RETURN_OK = 0
+};
+
+enum NET_TYPE{
+    NET_OCR = 900100,
+    NET_OCR_INTERNAL = 991008
+};
+
+
+template <typename  T>
+inline T product(const std::vector<T> &vec) {
+    if (vec.empty()){
+        return 0;
+    }
+    return std::accumulate(vec.begin(), vec.end(), 1, std::multiplies<T>());
+}
+
--- a/deploy/android_demo/app/src/main/cpp/native.cpp
+++ b/deploy/android_demo/app/src/main/cpp/native.cpp
@ -0,0 +1,115 @@
+//
+// Created by fujiayi on 2020/7/5.
+//
+
+#include "native.h"
+#include "ocr_ppredictor.h"
+#include <string>
+#include <algorithm>
+#include <paddle_api.h>
+
+static paddle::lite_api::PowerMode str_to_cpu_mode(const std::string &cpu_mode);
+
+extern "C"
+JNIEXPORT jlong JNICALL
+Java_com_baidu_paddle_lite_demo_ocr_OCRPredictorNative_init(JNIEnv *env, jobject thiz,
+                                                            jstring j_det_model_path,
+                                                            jstring j_rec_model_path,
+                                                            jint j_thread_num,
+                                                            jstring j_cpu_mode) {
+    std::string det_model_path = jstring_to_cpp_string(env, j_det_model_path);
+    std::string rec_model_path = jstring_to_cpp_string(env, j_rec_model_path);
+    int thread_num = j_thread_num;
+    std::string cpu_mode = jstring_to_cpp_string(env, j_cpu_mode);
+    ppredictor::OCR_Config conf;
+    conf.thread_num = thread_num;
+    conf.mode = str_to_cpu_mode(cpu_mode);
+    ppredictor::OCR_PPredictor *orc_predictor = new ppredictor::OCR_PPredictor{conf};
+    orc_predictor->init_from_file(det_model_path, rec_model_path);
+    return reinterpret_cast<jlong>(orc_predictor);
+}
+
+/**
+ * "LITE_POWER_HIGH" 转为 paddle::lite_api::LITE_POWER_HIGH
+ * @param cpu_mode
+ * @return
+ */
+static paddle::lite_api::PowerMode str_to_cpu_mode(const std::string &cpu_mode) {
+    static std::map<std::string, paddle::lite_api::PowerMode> cpu_mode_map{
+        {"LITE_POWER_HIGH",      paddle::lite_api::LITE_POWER_HIGH},
+        {"LITE_POWER_LOW",       paddle::lite_api::LITE_POWER_HIGH},
+        {"LITE_POWER_FULL",      paddle::lite_api::LITE_POWER_FULL},
+        {"LITE_POWER_NO_BIND",   paddle::lite_api::LITE_POWER_NO_BIND},
+        {"LITE_POWER_RAND_HIGH", paddle::lite_api::LITE_POWER_RAND_HIGH},
+        {"LITE_POWER_RAND_LOW",  paddle::lite_api::LITE_POWER_RAND_LOW}
+    };
+    std::string upper_key;
+    std::transform(cpu_mode.cbegin(), cpu_mode.cend(), upper_key.begin(), ::toupper);
+    auto index = cpu_mode_map.find(upper_key);
+    if (index == cpu_mode_map.end()) {
+        LOGE("cpu_mode not found %s", upper_key.c_str());
+        return paddle::lite_api::LITE_POWER_HIGH;
+    } else {
+        return index->second;
+    }
+
+}
+
+extern "C"
+JNIEXPORT jfloatArray JNICALL
+Java_com_baidu_paddle_lite_demo_ocr_OCRPredictorNative_forward(JNIEnv *env, jobject thiz,
+                                                               jlong java_pointer, jfloatArray buf,
+                                                               jfloatArray ddims,
+                                                               jobject original_image) {
+    LOGI("begin to run native forward");
+    if (java_pointer == 0) {
+        LOGE("JAVA pointer is NULL");
+        return cpp_array_to_jfloatarray(env, nullptr, 0);
+    }
+    cv::Mat origin = bitmap_to_cv_mat(env, original_image);
+    if (origin.size == 0) {
+        LOGE("origin bitmap cannot convert to CV Mat");
+        return cpp_array_to_jfloatarray(env, nullptr, 0);
+    }
+    ppredictor::OCR_PPredictor *ppredictor = (ppredictor::OCR_PPredictor *) java_pointer;
+    std::vector<float> dims_float_arr = jfloatarray_to_float_vector(env, ddims);
+    std::vector<int64_t> dims_arr;
+    dims_arr.resize(dims_float_arr.size());
+    std::copy(dims_float_arr.cbegin(), dims_float_arr.cend(), dims_arr.begin());
+
+    // 这里值有点大，就不调用jfloatarray_to_float_vector了
+    int64_t buf_len = (int64_t) env->GetArrayLength(buf);
+    jfloat *buf_data = env->GetFloatArrayElements(buf, JNI_FALSE);
+    float *data = (jfloat *) buf_data;
+    std::vector<ppredictor::OCRPredictResult> results = ppredictor->infer_ocr(dims_arr, data,
+                                                                              buf_len,
+                                                                              NET_OCR, origin);
+    LOGI("infer_ocr finished with boxes %ld", results.size());
+    // 这里将std::vector<ppredictor::OCRPredictResult> 序列化成 float数组，传输到java层再反序列化
+    std::vector<float> float_arr;
+    for (const ppredictor::OCRPredictResult &r :results) {
+        float_arr.push_back(r.points.size());
+        float_arr.push_back(r.word_index.size());
+        float_arr.push_back(r.score);
+        for (const std::vector<int> &point : r.points) {
+            float_arr.push_back(point.at(0));
+            float_arr.push_back(point.at(1));
+        }
+        for (int index: r.word_index) {
+            float_arr.push_back(index);
+        }
+    }
+    return cpp_array_to_jfloatarray(env, float_arr.data(), float_arr.size());
+}
+
+extern "C"
+JNIEXPORT void JNICALL
+Java_com_baidu_paddle_lite_demo_ocr_OCRPredictorNative_release(JNIEnv *env, jobject thiz,
+                                                               jlong java_pointer){
+    if (java_pointer == 0) {
+        LOGE("JAVA pointer is NULL");
+        return;
+    }
+    ppredictor::OCR_PPredictor *ppredictor = (ppredictor::OCR_PPredictor *) java_pointer;
+    delete ppredictor;
+}
--- a/deploy/android_demo/app/src/main/cpp/native.h
+++ b/deploy/android_demo/app/src/main/cpp/native.h
@ -0,0 +1,138 @@
+//
+// Created by fujiayi on 2020/7/5.
+//
+
+#pragma once
+
+
+#include <jni.h>
+#include <string>
+#include <vector>
+#include <android/bitmap.h>
+#include <opencv2/opencv.hpp>
+#include "common.h"
+
+inline std::string jstring_to_cpp_string(JNIEnv *env, jstring jstr) {
+    // In java, a unicode char will be encoded using 2 bytes (utf16).
+    // so jstring will contain characters utf16. std::string in c++ is
+    // essentially a string of bytes, not characters, so if we want to
+    // pass jstring from JNI to c++, we have convert utf16 to bytes.
+    if (!jstr) {
+        return "";
+    }
+    const jclass stringClass = env->GetObjectClass(jstr);
+    const jmethodID getBytes =
+        env->GetMethodID(stringClass, "getBytes", "(Ljava/lang/String;)[B");
+    const jbyteArray stringJbytes = (jbyteArray) env->CallObjectMethod(
+        jstr, getBytes, env->NewStringUTF("UTF-8"));
+
+    size_t length = (size_t) env->GetArrayLength(stringJbytes);
+    jbyte *pBytes = env->GetByteArrayElements(stringJbytes, NULL);
+
+    std::string ret = std::string(reinterpret_cast<char *>(pBytes), length);
+    env->ReleaseByteArrayElements(stringJbytes, pBytes, JNI_ABORT);
+
+    env->DeleteLocalRef(stringJbytes);
+    env->DeleteLocalRef(stringClass);
+    return ret;
+}
+
+inline jstring cpp_string_to_jstring(JNIEnv *env, std::string str) {
+    auto *data = str.c_str();
+    jclass strClass = env->FindClass("java/lang/String");
+    jmethodID strClassInitMethodID =
+        env->GetMethodID(strClass, "<init>", "([BLjava/lang/String;)V");
+
+    jbyteArray bytes = env->NewByteArray(strlen(data));
+    env->SetByteArrayRegion(bytes, 0, strlen(data),
+                            reinterpret_cast<const jbyte *>(data));
+
+    jstring encoding = env->NewStringUTF("UTF-8");
+    jstring res = (jstring) (
+        env->NewObject(strClass, strClassInitMethodID, bytes, encoding));
+
+    env->DeleteLocalRef(strClass);
+    env->DeleteLocalRef(encoding);
+    env->DeleteLocalRef(bytes);
+
+    return res;
+}
+
+inline jfloatArray cpp_array_to_jfloatarray(JNIEnv *env, const float *buf,
+                                            int64_t len) {
+    if (len == 0) {
+        return env->NewFloatArray(0);
+    }
+    jfloatArray result = env->NewFloatArray(len);
+    env->SetFloatArrayRegion(result, 0, len, buf);
+    return result;
+}
+
+inline jintArray cpp_array_to_jintarray(JNIEnv *env, const int *buf,
+                                        int64_t len) {
+    jintArray result = env->NewIntArray(len);
+    env->SetIntArrayRegion(result, 0, len, buf);
+    return result;
+}
+
+inline jbyteArray cpp_array_to_jbytearray(JNIEnv *env, const int8_t *buf,
+                                          int64_t len) {
+    jbyteArray result = env->NewByteArray(len);
+    env->SetByteArrayRegion(result, 0, len, buf);
+    return result;
+}
+
+inline jlongArray int64_vector_to_jlongarray(JNIEnv *env,
+                                             const std::vector<int64_t> &vec) {
+    jlongArray result = env->NewLongArray(vec.size());
+    jlong *buf = new jlong[vec.size()];
+    for (size_t i = 0; i < vec.size(); ++i) {
+        buf[i] = (jlong) vec[i];
+    }
+    env->SetLongArrayRegion(result, 0, vec.size(), buf);
+    delete[] buf;
+    return result;
+}
+
+inline std::vector<int64_t> jlongarray_to_int64_vector(JNIEnv *env,
+                                                       jlongArray data) {
+    int data_size = env->GetArrayLength(data);
+    jlong *data_ptr = env->GetLongArrayElements(data, nullptr);
+    std::vector<int64_t> data_vec(data_ptr, data_ptr + data_size);
+    env->ReleaseLongArrayElements(data, data_ptr, 0);
+    return data_vec;
+}
+
+inline std::vector<float> jfloatarray_to_float_vector(JNIEnv *env,
+                                                      jfloatArray data) {
+    int data_size = env->GetArrayLength(data);
+    jfloat *data_ptr = env->GetFloatArrayElements(data, nullptr);
+    std::vector<float> data_vec(data_ptr, data_ptr + data_size);
+    env->ReleaseFloatArrayElements(data, data_ptr, 0);
+    return data_vec;
+}
+
+inline cv::Mat bitmap_to_cv_mat(JNIEnv *env, jobject bitmap) {
+    AndroidBitmapInfo info;
+    int result = AndroidBitmap_getInfo(env, bitmap, &info);
+    if (result != ANDROID_BITMAP_RESULT_SUCCESS) {
+        LOGE("AndroidBitmap_getInfo failed, result: %d", result);
+        return cv::Mat{};
+    }
+    if (info.format != ANDROID_BITMAP_FORMAT_RGBA_8888) {
+        LOGE("Bitmap format is not RGBA_8888 !");
+        return cv::Mat{};
+    }
+    unsigned char *srcData = NULL;
+    AndroidBitmap_lockPixels(env, bitmap, (void **) &srcData);
+    cv::Mat mat = cv::Mat::zeros(info.height, info.width, CV_8UC4);
+    memcpy(mat.data, srcData, info.height * info.width * 4);
+    AndroidBitmap_unlockPixels(env, bitmap);
+    cv::cvtColor(mat, mat, cv::COLOR_RGBA2BGR);
+    /**
+    if (!cv::imwrite("/sdcard/1/copy.jpg", mat)){
+        LOGE("Write image failed " );
+    }
+     */
+    return mat;
+}
--- a/deploy/android_demo/app/src/main/cpp/ocr_clipper.cpp
+++ b/deploy/android_demo/app/src/main/cpp/ocr_clipper.cpp
--- a/deploy/android_demo/app/src/main/cpp/ocr_clipper.hpp
+++ b/deploy/android_demo/app/src/main/cpp/ocr_clipper.hpp
--- a/deploy/android_demo/app/src/main/cpp/ocr_crnn_process.cpp
+++ b/deploy/android_demo/app/src/main/cpp/ocr_crnn_process.cpp
@ -0,0 +1,140 @@
+// Copyright (c) 2020 PaddlePaddle Authors. All Rights Reserved.
+//
+// Licensed under the Apache License, Version 2.0 (the "License");
+// you may not use this file except in compliance with the License.
+// You may obtain a copy of the License at
+//
+//     http://www.apache.org/licenses/LICENSE-2.0
+//
+// Unless required by applicable law or agreed to in writing, software
+// distributed under the License is distributed on an "AS IS" BASIS,
+// WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+// See the License for the specific language governing permissions and
+// limitations under the License.
+
+#include "ocr_crnn_process.h"
+#include <iostream>
+#include <vector>
+#include <iostream>
+#include <cstring>
+#include <fstream>
+#include <cmath>
+
+const std::string CHARACTER_TYPE = "ch";
+const int MAX_DICT_LENGTH = 6624;
+const std::vector<int> REC_IMAGE_SHAPE = {3, 32, 320};
+
+static cv::Mat crnn_resize_norm_img(cv::Mat img, float wh_ratio) {
+    int imgC = REC_IMAGE_SHAPE[0];
+    int imgW = REC_IMAGE_SHAPE[2];
+    int imgH = REC_IMAGE_SHAPE[1];
+
+    if (CHARACTER_TYPE == "ch")
+        imgW = int(32 * wh_ratio);
+
+    float ratio = float(img.cols) / float(img.rows);
+    int resize_w = 0;
+    if (ceilf(imgH * ratio) > imgW)
+        resize_w = imgW;
+    else
+        resize_w = int(ceilf(imgH * ratio));
+    cv::Mat resize_img;
+    cv::resize(img, resize_img, cv::Size(resize_w, imgH), 0.f, 0.f, cv::INTER_CUBIC);
+
+    resize_img.convertTo(resize_img, CV_32FC3, 1 / 255.f);
+
+    for (int h = 0; h < resize_img.rows; h++) {
+        for (int w = 0; w < resize_img.cols; w++) {
+            resize_img.at<cv::Vec3f>(h, w)[0] = (resize_img.at<cv::Vec3f>(h, w)[0] - 0.5) * 2;
+            resize_img.at<cv::Vec3f>(h, w)[1] = (resize_img.at<cv::Vec3f>(h, w)[1] - 0.5) * 2;
+            resize_img.at<cv::Vec3f>(h, w)[2] = (resize_img.at<cv::Vec3f>(h, w)[2] - 0.5) * 2;
+        }
+    }
+
+    cv::Mat dist;
+    cv::copyMakeBorder(resize_img, dist, 0, 0, 0, int(imgW - resize_w), cv::BORDER_CONSTANT,
+                       {0, 0, 0});
+
+    return dist;
+
+}
+
+cv::Mat crnn_resize_img(const cv::Mat &img, float wh_ratio) {
+    int imgC = REC_IMAGE_SHAPE[0];
+    int imgW = REC_IMAGE_SHAPE[2];
+    int imgH = REC_IMAGE_SHAPE[1];
+
+    if (CHARACTER_TYPE == "ch") {
+        imgW = int(32 * wh_ratio);
+    }
+
+    float ratio = float(img.cols) / float(img.rows);
+    int resize_w = 0;
+    if (ceilf(imgH * ratio) > imgW)
+        resize_w = imgW;
+    else
+        resize_w = int(ceilf(imgH * ratio));
+    cv::Mat resize_img;
+    cv::resize(img, resize_img, cv::Size(resize_w, imgH));
+    return resize_img;
+}
+
+
+cv::Mat get_rotate_crop_image(const cv::Mat &srcimage, const std::vector<std::vector<int>> &box) {
+
+    std::vector<std::vector<int>> points = box;
+
+    int x_collect[4] = {box[0][0], box[1][0], box[2][0], box[3][0]};
+    int y_collect[4] = {box[0][1], box[1][1], box[2][1], box[3][1]};
+    int left = int(*std::min_element(x_collect, x_collect + 4));
+    int right = int(*std::max_element(x_collect, x_collect + 4));
+    int top = int(*std::min_element(y_collect, y_collect + 4));
+    int bottom = int(*std::max_element(y_collect, y_collect + 4));
+
+    cv::Mat img_crop;
+    srcimage(cv::Rect(left, top, right - left, bottom - top)).copyTo(img_crop);
+
+    for (int i = 0; i < points.size(); i++) {
+        points[i][0] -= left;
+        points[i][1] -= top;
+    }
+
+    int img_crop_width = int(sqrt(pow(points[0][0] - points[1][0], 2) +
+                                  pow(points[0][1] - points[1][1], 2)));
+    int img_crop_height = int(sqrt(pow(points[0][0] - points[3][0], 2) +
+                                   pow(points[0][1] - points[3][1], 2)));
+
+    cv::Point2f pts_std[4];
+    pts_std[0] = cv::Point2f(0., 0.);
+    pts_std[1] = cv::Point2f(img_crop_width, 0.);
+    pts_std[2] = cv::Point2f(img_crop_width, img_crop_height);
+    pts_std[3] = cv::Point2f(0.f, img_crop_height);
+
+    cv::Point2f pointsf[4];
+    pointsf[0] = cv::Point2f(points[0][0], points[0][1]);
+    pointsf[1] = cv::Point2f(points[1][0], points[1][1]);
+    pointsf[2] = cv::Point2f(points[2][0], points[2][1]);
+    pointsf[3] = cv::Point2f(points[3][0], points[3][1]);
+
+    cv::Mat M = cv::getPerspectiveTransform(pointsf, pts_std);
+
+    cv::Mat dst_img;
+    cv::warpPerspective(img_crop, dst_img, M, cv::Size(img_crop_width, img_crop_height),
+                        cv::BORDER_REPLICATE);
+
+    if (float(dst_img.rows) >= float(dst_img.cols) * 1.5) {
+        /*
+        cv::Mat srcCopy = cv::Mat(dst_img.rows, dst_img.cols, dst_img.depth());
+        cv::transpose(dst_img, srcCopy);
+        cv::flip(srcCopy, srcCopy, 0);
+        return srcCopy;
+        */
+        cv::transpose(dst_img, dst_img);
+        cv::flip(dst_img, dst_img, 0);
+        return dst_img;
+    } else {
+        return dst_img;
+    }
+
+}
+
--- a/deploy/android_demo/app/src/main/cpp/ocr_crnn_process.h
+++ b/deploy/android_demo/app/src/main/cpp/ocr_crnn_process.h
@ -0,0 +1,19 @@
+//
+// Created by fujiayi on 2020/7/3.
+//
+#pragma once
+
+#include <vector>
+#include <opencv2/opencv.hpp>
+#include "common.h"
+
+extern const std::vector<int> REC_IMAGE_SHAPE;
+
+cv::Mat get_rotate_crop_image(const cv::Mat &srcimage, const std::vector<std::vector<int>> &box);
+
+cv::Mat crnn_resize_img(const cv::Mat &img, float wh_ratio);
+
+template<class ForwardIterator>
+inline size_t argmax(ForwardIterator first, ForwardIterator last) {
+    return std::distance(first, std::max_element(first, last));
+}
--- a/deploy/android_demo/app/src/main/cpp/ocr_db_post_process.cpp
+++ b/deploy/android_demo/app/src/main/cpp/ocr_db_post_process.cpp
--- a/deploy/android_demo/app/src/main/cpp/ocr_db_post_process.h
+++ b/deploy/android_demo/app/src/main/cpp/ocr_db_post_process.h
@ -0,0 +1,17 @@
+//
+// Created by fujiayi on 2020/7/2.
+//
+#pragma once
+#include <vector>
+#include <opencv2/opencv.hpp>
+
+std::vector<std::vector<std::vector<int>>>
+boxes_from_bitmap(const cv::Mat &pred, const cv::Mat &bitmap);
+
+std::vector<std::vector<std::vector<int>>>
+filter_tag_det_res(
+    const std::vector<std::vector<std::vector<int>>> &o_boxes,
+    float ratio_h,
+    float ratio_w,
+    const cv::Mat &srcimg
+);
--- a/deploy/android_demo/app/src/main/cpp/ocr_ppredictor.cpp
+++ b/deploy/android_demo/app/src/main/cpp/ocr_ppredictor.cpp
@ -0,0 +1,186 @@
+//
+// Created by fujiayi on 2020/7/1.
+//
+
+#include "ocr_ppredictor.h"
+#include "preprocess.h"
+#include "common.h"
+#include "ocr_db_post_process.h"
+#include "ocr_crnn_process.h"
+
+namespace ppredictor {
+
+OCR_PPredictor::OCR_PPredictor(const OCR_Config &config) : _config(config) {
+
+}
+
+int
+OCR_PPredictor::init(const std::string &det_model_content, const std::string &rec_model_content) {
+    _det_predictor = std::unique_ptr<PPredictor>(
+        new PPredictor{_config.thread_num, NET_OCR, _config.mode});
+    _det_predictor->init_nb(det_model_content);
+
+    _rec_predictor = std::unique_ptr<PPredictor>(
+        new PPredictor{_config.thread_num, NET_OCR_INTERNAL, _config.mode});
+    _rec_predictor->init_nb(rec_model_content);
+    return RETURN_OK;
+}
+
+int OCR_PPredictor::init_from_file(const std::string &det_model_path, const std::string &rec_model_path){
+    _det_predictor = std::unique_ptr<PPredictor>(
+        new PPredictor{_config.thread_num, NET_OCR, _config.mode});
+    _det_predictor->init_from_file(det_model_path);
+
+    _rec_predictor = std::unique_ptr<PPredictor>(
+        new PPredictor{_config.thread_num, NET_OCR_INTERNAL, _config.mode});
+    _rec_predictor->init_from_file(rec_model_path);
+    return RETURN_OK;
+}
+/**
+ * 调试用，保存第一步的框选结果
+ * @param filter_boxes
+ * @param boxes
+ * @param srcimg
+ */
+static void visual_img(const std::vector<std::vector<std::vector<int>>> &filter_boxes,
+                       const std::vector<std::vector<std::vector<int>>> &boxes,
+                       const cv::Mat &srcimg) {
+    // visualization
+    cv::Point rook_points[filter_boxes.size()][4];
+    for (int n = 0; n < filter_boxes.size(); n++) {
+        for (int m = 0; m < filter_boxes[0].size(); m++) {
+            rook_points[n][m] = cv::Point(int(filter_boxes[n][m][0]), int(filter_boxes[n][m][1]));
+        }
+    }
+
+    cv::Mat img_vis;
+    srcimg.copyTo(img_vis);
+    for (int n = 0; n < boxes.size(); n++) {
+        const cv::Point *ppt[1] = {rook_points[n]};
+        int npt[] = {4};
+        cv::polylines(img_vis, ppt, npt, 1, 1, CV_RGB(0, 255, 0), 2, 8, 0);
+    }
+    // 调试用，自行替换需要修改的路径
+    cv::imwrite("/sdcard/1/vis.png", img_vis);
+}
+
+std::vector<OCRPredictResult>
+OCR_PPredictor::infer_ocr(const std::vector<int64_t> &dims, const float *input_data, int input_len,
+                          int net_flag, cv::Mat &origin) {
+
+    PredictorInput input = _det_predictor->get_first_input();
+    input.set_dims(dims);
+    input.set_data(input_data, input_len);
+    std::vector<PredictorOutput> results = _det_predictor->infer();
+    PredictorOutput &res = results.at(0);
+    std::vector<std::vector<std::vector<int>>> filtered_box
+        = calc_filtered_boxes(res.get_float_data(), res.get_size(), (int) dims[2], (int) dims[3],
+                              origin);
+    LOGI("Filter_box size %ld", filtered_box.size());
+    return infer_rec(filtered_box, origin);
+}
+
+std::vector<OCRPredictResult>
+OCR_PPredictor::infer_rec(const std::vector<std::vector<std::vector<int>>> &boxes,
+                          const cv::Mat &origin_img) {
+    std::vector<float> mean = {0.5f, 0.5f, 0.5f};
+    std::vector<float> scale = {1 / 0.5f, 1 / 0.5f, 1 / 0.5f};
+    std::vector<int64_t> dims = {1, 3, 0, 0};
+    std::vector<OCRPredictResult> ocr_results;
+
+    PredictorInput input = _rec_predictor->get_first_input();
+    for (auto bp = boxes.crbegin(); bp != boxes.crend(); ++bp) {
+        const std::vector<std::vector<int>> &box = *bp;
+        cv::Mat crop_img = get_rotate_crop_image(origin_img, box);
+        float wh_ratio = float(crop_img.cols) / float(crop_img.rows);
+        cv::Mat input_image = crnn_resize_img(crop_img, wh_ratio);
+        input_image.convertTo(input_image, CV_32FC3, 1 / 255.0f);
+        const float *dimg = reinterpret_cast<const float *>(input_image.data);
+        int input_size = input_image.rows * input_image.cols;
+
+        dims[2] = input_image.rows;
+        dims[3] = input_image.cols;
+        input.set_dims(dims);
+
+        neon_mean_scale(dimg, input.get_mutable_float_data(), input_size, mean, scale);
+
+        std::vector<PredictorOutput> results = _rec_predictor->infer();
+
+        OCRPredictResult res;
+        res.word_index = postprocess_rec_word_index(results.at(0));
+        if (res.word_index.empty()) {
+            continue;
+        }
+        res.score = postprocess_rec_score(results.at(1));
+        res.points = box;
+        ocr_results.emplace_back(std::move(res));
+    }
+    LOGI("ocr_results finished %lu", ocr_results.size());
+    return ocr_results;
+}
+
+std::vector<std::vector<std::vector<int>>>
+OCR_PPredictor::calc_filtered_boxes(const float *pred, int pred_size, int output_height,
+                                    int output_width, const cv::Mat &origin) {
+    const double threshold = 0.3;
+    const double maxvalue = 1;
+
+    cv::Mat pred_map = cv::Mat::zeros(output_height, output_width, CV_32F);
+    memcpy(pred_map.data, pred, pred_size * sizeof(float));
+    cv::Mat cbuf_map;
+    pred_map.convertTo(cbuf_map, CV_8UC1);
+
+    cv::Mat bit_map;
+    cv::threshold(cbuf_map, bit_map, threshold, maxvalue, cv::THRESH_BINARY);
+
+    std::vector<std::vector<std::vector<int>>> boxes = boxes_from_bitmap(pred_map, bit_map);
+    float ratio_h = output_height * 1.0f / origin.rows;
+    float ratio_w = output_width * 1.0f / origin.cols;
+    std::vector<std::vector<std::vector<int>>> filter_boxes = filter_tag_det_res(boxes, ratio_h,
+                                                                                 ratio_w, origin);
+    return filter_boxes;
+}
+
+std::vector<int> OCR_PPredictor::postprocess_rec_word_index(const PredictorOutput &res) {
+    const int *rec_idx = res.get_int_data();
+    const std::vector<std::vector<uint64_t>> rec_idx_lod = res.get_lod();
+
+    std::vector<int> pred_idx;
+    for (int n = int(rec_idx_lod[0][0]); n < int(rec_idx_lod[0][1] * 2); n += 2) {
+        pred_idx.emplace_back(rec_idx[n]);
+    }
+    return pred_idx;
+}
+
+float OCR_PPredictor::postprocess_rec_score(const PredictorOutput &res) {
+    const float *predict_batch = res.get_float_data();
+    const std::vector<int64_t> predict_shape = res.get_shape();
+    const std::vector<std::vector<uint64_t>> predict_lod = res.get_lod();
+    int blank = predict_shape[1];
+    float score = 0.f;
+    int count = 0;
+    for (int n = predict_lod[0][0]; n < predict_lod[0][1] - 1; n++) {
+        int argmax_idx = argmax(predict_batch + n * predict_shape[1],
+                                predict_batch + (n + 1) * predict_shape[1]);
+        float max_value = predict_batch[n * predict_shape[1] + argmax_idx];
+        if (blank - 1 - argmax_idx > 1e-5) {
+            score += max_value;
+            count += 1;
+        }
+
+    }
+    if (count == 0) {
+        LOGE("calc score count 0");
+    } else {
+        score /= count;
+    }
+    LOGI("calc score: %f", score);
+    return score;
+
+}
+
+
+NET_TYPE OCR_PPredictor::get_net_flag() const {
+    return NET_OCR;
+}
+}
--- a/deploy/android_demo/app/src/main/cpp/ocr_ppredictor.h
+++ b/deploy/android_demo/app/src/main/cpp/ocr_ppredictor.h
@ -0,0 +1,112 @@
+//
+// Created by fujiayi on 2020/7/1.
+//
+
+#pragma once
+
+#include <string>
+#include <opencv2/opencv.hpp>
+#include <paddle_api.h>
+#include "ppredictor.h"
+
+namespace ppredictor {
+
+/**
+ * 配置
+ */
+struct OCR_Config {
+    int thread_num = 4; // 线程数
+    paddle::lite_api::PowerMode mode = paddle::lite_api::LITE_POWER_HIGH; // PaddleLite Mode
+};
+
+/**
+ * 一个四边形内图片的推理结果,
+ */
+struct OCRPredictResult {
+    std::vector<int> word_index; //
+    std::vector<std::vector<int>> points;
+    float score;
+};
+
+/**
+ * OCR 一共有2个模型进行推理，
+ * 1. 使用第一个模型（det），框选出多个四边形
+ * 2. 从原图从抠出这些多边形，使用第二个模型（rec），获取文本
+ */
+class OCR_PPredictor : public PPredictor_Interface {
+public:
+    OCR_PPredictor(const OCR_Config &config);
+
+    virtual ~OCR_PPredictor() {
+
+    }
+
+    /**
+     * 初始化二个模型的Predictor
+     * @param det_model_content
+     * @param rec_model_content
+     * @return
+     */
+    int init(const std::string &det_model_content, const std::string &rec_model_content);
+    int init_from_file(const std::string &det_model_path, const std::string &rec_model_path);
+    /**
+     * 返回OCR结果
+     * @param dims
+     * @param input_data
+     * @param input_len
+     * @param net_flag
+     * @param origin
+     * @return
+     */
+    virtual std::vector<OCRPredictResult>
+    infer_ocr(const std::vector<int64_t> &dims, const float *input_data, int input_len,
+              int net_flag, cv::Mat &origin);
+
+
+    virtual NET_TYPE get_net_flag() const;
+
+
+private:
+
+    /**
+     * 从第一个模型的结果中计算有文字的四边形
+     * @param pred
+     * @param output_height
+     * @param output_width
+     * @param origin
+     * @return
+     */
+    std::vector<std::vector<std::vector<int>>>
+    calc_filtered_boxes(const float *pred, int pred_size, int output_height, int output_width,
+                        const cv::Mat &origin);
+
+    /**
+     * 第二个模型的推理
+     *
+     * @param boxes
+     * @param origin
+     * @return
+     */
+    std::vector<OCRPredictResult>
+    infer_rec(const std::vector<std::vector<std::vector<int>>> &boxes, const cv::Mat &origin);
+
+    /**
+     * 第二个模型提取文字的后处理
+     * @param res
+     * @return
+     */
+    std::vector<int> postprocess_rec_word_index(const PredictorOutput &res);
+
+    /**
+     * 计算第二个模型的文字的置信度
+     * @param res
+     * @return
+     */
+    float postprocess_rec_score(const PredictorOutput &res);
+
+    std::unique_ptr<PPredictor> _det_predictor;
+    std::unique_ptr<PPredictor> _rec_predictor;
+    OCR_Config _config;
+
+};
+}
--- a/deploy/android_demo/app/src/main/cpp/ppredictor.cpp
+++ b/deploy/android_demo/app/src/main/cpp/ppredictor.cpp
@ -0,0 +1,70 @@
+#include "ppredictor.h"
+#include "common.h"
+
+namespace ppredictor {
+PPredictor::PPredictor(int thread_num, int net_flag, paddle::lite_api::PowerMode mode) :
+    _thread_num(thread_num), _net_flag(net_flag), _mode(mode) {
+}
+
+int PPredictor::init_nb(const std::string &model_content) {
+    paddle::lite_api::MobileConfig config;
+    config.set_model_from_buffer(model_content);
+    return _init(config);
+}
+
+int PPredictor::init_from_file(const std::string &model_content){
+    paddle::lite_api::MobileConfig config;
+    config.set_model_from_file(model_content);
+    return _init(config);
+}
+
+template<typename ConfigT>
+int PPredictor::_init(ConfigT &config) {
+    config.set_threads(_thread_num);
+    config.set_power_mode(_mode);
+    _predictor = paddle::lite_api::CreatePaddlePredictor(config);
+    LOGI("paddle instance created");
+    return RETURN_OK;
+}
+
+PredictorInput PPredictor::get_input(int index) {
+    PredictorInput input{_predictor->GetInput(index), index, _net_flag};
+    _is_input_get = true;
+    return input;
+}
+
+std::vector<PredictorInput> PPredictor::get_inputs(int num) {
+    std::vector<PredictorInput> results;
+    for (int i = 0; i < num; i++) {
+        results.emplace_back(get_input(i));
+    }
+    return results;
+}
+
+PredictorInput PPredictor::get_first_input() {
+    return get_input(0);
+}
+
+std::vector<PredictorOutput> PPredictor::infer() {
+    LOGI("infer Run start %d", _net_flag);
+    std::vector<PredictorOutput> results;
+    if (!_is_input_get) {
+        return results;
+    }
+    _predictor->Run();
+    LOGI("infer Run end");
+
+    for (int i = 0; i < _predictor->GetOutputNames().size(); i++) {
+        std::unique_ptr<const paddle::lite_api::Tensor> output_tensor = _predictor->GetOutput(i);
+        LOGI("output tensor[%d] size %ld", i, product(output_tensor->shape()));
+        PredictorOutput result{std::move(output_tensor), i, _net_flag};
+        results.emplace_back(std::move(result));
+    }
+    return results;
+}
+
+NET_TYPE PPredictor::get_net_flag() const {
+    return (NET_TYPE) _net_flag;
+}
+
+}
--- a/Show More
+++ b/Show More