You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
dface/README.md

138 lines
4.8 KiB

7 years ago
<div align=center>
<img src="http://affluent.oss-cn-hangzhou.aliyuncs.com/html/images/dface_logo.png" width="350">
</div>
-----------------
# DFace • [![License](http://pic.dface.io/apache2.svg)](https://opensource.org/licenses/Apache-2.0) [![gitter](http://pic.dface.io/gitee.svg)](https://gitter.im/cmusatyalab/DFace)
| **`Linux CPU`** | **`Linux GPU`** | **`Mac OS CPU`** | **`Windows CPU`** |
|-----------------|---------------------|------------------|-------------------|
| [![Build Status](http://pic.dface.io/pass.svg)](http://pic.dface.io/pass.svg) | [![Build Status](http://pic.dface.io/pass.svg)](http://pic.dface.io/pass.svg) | [![Build Status](http://pic.dface.io/pass.svg)](http://pic.dface.io/pass.svg) | [![Build Status](http://pic.dface.io/pass.svg)](http://pic.dface.io/pass.svg) |
**基于多任务卷积网络(MTCNN)和Center-Loss的多人实时人脸检测和人脸识别系统。**
**DFace** 是个开源的深度学习人脸检测和人脸识别系统。所有功能都采用 **[pytorch](https://github.com/pytorch/pytorch)** 框架开发。pytorch是一个由facebook开发的深度学习框架它包含了一些比较有趣的高级特性例如自动求导动态构图等。DFace天然的继承了这些优点使得它的训练过程可以更加简单方便并且实现的代码可以更加清晰易懂。
DFace可以利用CUDA来支持GPU加速模式。我们建议尝试linux GPU这种模式它几乎可以实现实时的效果。
所有的灵感都来源于学术界最近的一些研究成果,例如 [Joint Face Detection and Alignment using Multi-task Cascaded Convolutional Networks](https://arxiv.org/abs/1604.02878) 和 [FaceNet: A Unified Embedding for Face Recognition and Clustering](https://arxiv.org/abs/1503.03832)
**MTCNN 结构**  
![mtcnn](http://affluent.oss-cn-hangzhou.aliyuncs.com/html/images/mtcnn_st.png)
**如果你对DFace感兴趣并且想参与到这个项目中, 请查看目录下的 CONTRIBUTING.md 文档它会实时展示一些需要的清单。我会用 [issues](https://github.com/DFace/DFace/issues)
来跟踪和反馈所有的问题.**
## 安装
DFace主要有两大模块人脸检测和人脸识别。我会提供所有模型训练和运行的详细步骤。你首先需要构建一个pytorch和cv2的python环境我推荐使用Anaconda来设置一个独立的虚拟环境。
### 依赖
* cuda 8.0
* anaconda
* pytorch
* torchvision
* cv2
* matplotlib
在这里我提供了一个anaconda的环境依赖文件environment.yml它能方便你构建自己的虚拟环境。
```shell
conda env create -f path/to/environment.yml
```
### 人脸检测
如果你对mtcnn模型感兴趣以下过程可能会帮助到你。
#### 训练mtcnn模型
MTCNN主要有三个网络叫做**PNet**, **RNet****ONet**。因此我们的训练过程也需要分三步先后进行。为了更好的实现效果,当前被训练的网络都将依赖于上一个训练好的网络来生成数据。所有的人脸数据集都来自 **[WIDER FACE](http://mmlab.ie.cuhk.edu.hk/projects/WIDERFace/)** 和 **[CelebA](http://mmlab.ie.cuhk.edu.hk/projects/CelebA.html)**。WIDER FACE仅提供了大量的人脸边框定位数据而CelebA包含了人脸关键点定位数据。
* 生成PNet训练数据和标注文件
```shell
python src/prepare_data/gen_Pnet_train_data.py --dataset_path {your dataset path} --anno_file {your dataset original annotation path}
```
* 乱序合并标注文件
```shell
python src/prepare_data/assemble_pnet_imglist.py
```
* 训练PNet模型
```shell
python src/train_net/train_p_net.py
```
* 生成Net训练数据和标注文件
```shell
python src/prepare_data/gen_Rnet_train_data.py --dataset_path {your dataset path} --anno_file {your dataset original annotation path} --pmodel_file {yout PNet model file trained before}
```
* 乱序合并标注文件
```shell
python src/prepare_data/assemble_rnet_imglist.py
```
* 训练RNet模型
```shell
python src/train_net/train_r_net.py
```
* 生成ONet训练数据和标注文件
```shell
python src/prepare_data/gen_Onet_train_data.py --dataset_path {your dataset path} --anno_file {your dataset original annotation path} --pmodel_file {yout PNet model file trained before} --rmodel_file {yout RNet model file trained before}
```
* 生成ONet的人脸关键点训练数据和标注文件
```shell
python src/prepare_data/gen_landmark_48.py
```
* 乱序合并标注文件(包括人脸关键点)
```shell
python src/prepare_data/assemble_onet_imglist.py
```
* 训练ONet模型
```shell
python src/train_net/train_o_net.py
```
#### 测试人脸检测
```shell
python test_image.py
```
### 人脸识别
TODO
## 测试效果
![mtcnn](http://affluent.oss-cn-hangzhou.aliyuncs.com/html/images/dface_demo.png)
## License
[Apache License 2.0](LICENSE)
## Reference
* [Seanlinx/mtcnn](https://github.com/Seanlinx/mtcnn)