|
|
|
@ -2,6 +2,7 @@
|
|
|
|
|
|
|
|
|
|
## Style Text
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
### 目录
|
|
|
|
|
- [一、工具简介](#工具简介)
|
|
|
|
|
- [二、环境配置](#环境配置)
|
|
|
|
@ -88,7 +89,7 @@ python3 -m tools.synth_image -c configs/config.yml --style_image examples/style_
|
|
|
|
|
</div>
|
|
|
|
|
|
|
|
|
|
#### 批量合成
|
|
|
|
|
在实际应用场景中,经常需要批量合成图片,补充到训练集中。StyleText可以使用一批风格图片和语料,批量合成数据。合成过程如下:
|
|
|
|
|
在实际应用场景中,经常需要批量合成图片,补充到训练集中。Style-Text可以使用一批风格图片和语料,批量合成数据。合成过程如下:
|
|
|
|
|
|
|
|
|
|
1. 在`configs/dataset_config.yml`中配置目标场景风格图像和语料的路径,具体如下:
|
|
|
|
|
|
|
|
|
@ -103,7 +104,7 @@ python3 -m tools.synth_image -c configs/config.yml --style_image examples/style_
|
|
|
|
|
* `language`:语料的语种;
|
|
|
|
|
* `corpus_file`: 语料文件路径。
|
|
|
|
|
|
|
|
|
|
StyleText也提供了一批中英韩5万张通用场景数据用作文本风格图像,便于合成场景丰富的文本图像,下图给出了一些示例。
|
|
|
|
|
Style-Text也提供了一批中英韩5万张通用场景数据用作文本风格图像,便于合成场景丰富的文本图像,下图给出了一些示例。
|
|
|
|
|
|
|
|
|
|
中英韩5万张通用场景数据: [下载地址](https://paddleocr.bj.bcebos.com/dygraph_v2.0/style_text/chkoen_5w.tar)
|
|
|
|
|
|
|
|
|
@ -119,7 +120,7 @@ python3 -m tools.synth_image -c configs/config.yml --style_image examples/style_
|
|
|
|
|
|
|
|
|
|
<a name="应用案例"></a>
|
|
|
|
|
### 四、应用案例
|
|
|
|
|
下面以金属表面英文数字识别和通用韩语识别两个场景为例,说明使用StyleText合成数据,来提升文本识别效果的实际案例。下图给出了一些真实场景图像和合成图像的示例:
|
|
|
|
|
下面以金属表面英文数字识别和通用韩语识别两个场景为例,说明使用Style-Text合成数据,来提升文本识别效果的实际案例。下图给出了一些真实场景图像和合成图像的示例:
|
|
|
|
|
|
|
|
|
|
<div align="center">
|
|
|
|
|
<img src="doc/images/6.png" width="800">
|
|
|
|
@ -135,40 +136,41 @@ python3 -m tools.synth_image -c configs/config.yml --style_image examples/style_
|
|
|
|
|
|
|
|
|
|
<a name="代码结构"></a>
|
|
|
|
|
### 五、代码结构
|
|
|
|
|
|
|
|
|
|
```
|
|
|
|
|
style_text_rec
|
|
|
|
|
|-- arch
|
|
|
|
|
StyleText
|
|
|
|
|
|-- arch // 网络结构定义文件
|
|
|
|
|
| |-- base_module.py
|
|
|
|
|
| |-- decoder.py
|
|
|
|
|
| |-- encoder.py
|
|
|
|
|
| |-- spectral_norm.py
|
|
|
|
|
| `-- style_text_rec.py
|
|
|
|
|
|-- configs
|
|
|
|
|
|-- configs // 配置文件
|
|
|
|
|
| |-- config.yml
|
|
|
|
|
| `-- dataset_config.yml
|
|
|
|
|
|-- engine
|
|
|
|
|
| |-- corpus_generators.py
|
|
|
|
|
| |-- predictors.py
|
|
|
|
|
| |-- style_samplers.py
|
|
|
|
|
| |-- synthesisers.py
|
|
|
|
|
| |-- text_drawers.py
|
|
|
|
|
| `-- writers.py
|
|
|
|
|
|-- examples
|
|
|
|
|
|-- engine // 数据合成引擎
|
|
|
|
|
| |-- corpus_generators.py // 从文本采样或随机生成语料
|
|
|
|
|
| |-- predictors.py // 调用网络生成数据
|
|
|
|
|
| |-- style_samplers.py // 采样风格图片
|
|
|
|
|
| |-- synthesisers.py // 调度各个模块,合成数据
|
|
|
|
|
| |-- text_drawers.py // 生成标准文字图片,用作输入
|
|
|
|
|
| `-- writers.py // 将合成的图片和标签写入本地目录
|
|
|
|
|
|-- examples // 示例文件
|
|
|
|
|
| |-- corpus
|
|
|
|
|
| | `-- example.txt
|
|
|
|
|
| |-- image_list.txt
|
|
|
|
|
| `-- style_images
|
|
|
|
|
| |-- 1.jpg
|
|
|
|
|
| `-- 2.jpg
|
|
|
|
|
|-- fonts
|
|
|
|
|
|-- fonts // 字体文件
|
|
|
|
|
| |-- ch_standard.ttf
|
|
|
|
|
| |-- en_standard.ttf
|
|
|
|
|
| `-- ko_standard.ttf
|
|
|
|
|
|-- tools
|
|
|
|
|
|-- tools // 程序入口
|
|
|
|
|
| |-- __init__.py
|
|
|
|
|
| |-- synth_dataset.py
|
|
|
|
|
| `-- synth_image.py
|
|
|
|
|
`-- utils
|
|
|
|
|
| |-- synth_dataset.py // 批量合成数据
|
|
|
|
|
| `-- synth_image.py // 合成单张图片
|
|
|
|
|
`-- utils // 其他基础功能模块
|
|
|
|
|
|-- config.py
|
|
|
|
|
|-- load_params.py
|
|
|
|
|
|-- logging.py
|
|
|
|
|