You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
graphengine/README_CN.md

112 lines
5.6 KiB

This file contains ambiguous Unicode characters!

This file contains ambiguous Unicode characters that may be confused with others in your current locale. If your use case is intentional and legitimate, you can safely ignore this warning. Use the Escape button to highlight these characters.

[View English](./README.md)
图引擎模块(GE)是MindSpore的一个子模块其代码由C++实现位于前端模块ME和底层硬件之间起到承接作用。图引擎模块以ME下发的图作为输入然后进行一系列的深度图优化操作最后输出一张可以在底层硬件上高效运行的图。GE针对昇腾AI处理器的硬件结构特点做了特定的优化工作以此来充分发挥出昇腾AI处理器的强大算力。在进行模型训练/推理时GE会被自动调用而用户并不感知。GE主要由GE API和GE Core两部分组成详细的架构图如下所示。
![GE_schema](docs/GE_Architecture_CN.png)
- GE API
GE API是连接前端模块ME和GE Core的接口负责GE Core中初始化、Session管理模块的接口支持运行环境初始化Session创建、销毁图添加执行。
- GE Core
GE Core是GE的核心模块负责整个训练过程中的图管理。GE Core中的图处理可细分为六大步骤分别是图准备、图拆分、图优化、图编译、图加载和图执行对于ME下发的每一张图都会经过这六个步骤的操作最终得到可以直接在底层硬件上高效执行的图。
- 图准备 & 整图优化
完成整图级别的数据准备和优化涉及到IR库及算子库。使用IR库中算子的InferShape函数完成整图的Shape推导以便后续申请内存同时根据算子的聚合属性完成某些算子的聚合优化如allreduce算子会按照聚合参数将若干各参数对应梯度的allreduce算子聚合为一个以此减少通讯耗时。
- 图拆分
昇腾AI处理器是一种异构芯片含有CPU(AICPU)和向量计算部件AICORE图中每个算子会按照开销模型选择执行的核心此阶段会对算子进行最优的核心分配每种核心对应软件上的一个抽象引擎按照之前对各算子的引擎分配以引擎为边界将整图拆分为若干子图在图边界算子上插入相应的Placeholder算子以做标识之后的优化、编译、加载操作均会以子图为单位进行这样可以有效减少优化过程的耗时。
- 子图优化
根据子图所属引擎调用不同的优化器接口执行优化。为了充分发挥昇腾AI处理器中AICORE模块的算力在AICORE内CUBE单元进行计算的算子会采用一种5D的数据格式图优化阶段会对相应算子进行4D/5D的类型转换为了进一步发挥CUBE单元的算力减少数据搬运次数GE会对某种范式的算子连接进行融合操作此步骤也在图优化阶段进行对所有子图优化之后需进行算子运行属性计算以计算输入输出内存大小。
- 图编译 & 图加载
GE采用即时算子编译技术即按照实际网络结构即时编译生成算子可执行程序同时完成内存复用与内存分配、流分配、算子可执行程序加载等。每个算子执行任务绑定到特定的流上同一个流的任务是串行执行的不同流上的任务可以并行执行。图加载阶段按照引擎归属的runtime将子图加载到硬件上准备执行。
- 图执行
最终在硬件上执行子图,并返回相应的输出值。为了提高运行效率,图执行阶段提供了一种下沉模式,可以在底层硬件上连续运行多轮再返回输出值,以此减少从底层硬件拷贝数据的次数。
在训练/推理过程中上述过程会自动执行通过上述图操作GE可以将前端下发的图转换为一种可以在昇腾AI处理器上高效运行的图模式。
<!-- TOC -->
- [安装说明](#安装说明)
- [安装GE](#安装ge)
- [源码安装](#源码安装)
- [社区](#社区)
- [贡献](#贡献)
- [Release Notes](#release-notes)
- [License](#license)
<!-- /TOC -->
# 安装说明
## 安装GE
GE内嵌在MindSpore安装包中MindSpore安装完毕后GE以三个动态库的方式被调用。
## 源码安装
GE也支持由源码编译进行源码编译前首先确保你有昇腾910 AI处理器的环境同时系统满足以下要求
- GCC >= 7.3.0
- CMake >= 3.14.0
- Autoconf >= 2.64
- Libtool >= 2.4.6
- Automake >= 1.15.1
编译完成后会生成几个动态库他们会链接到MindSpore中执行无法单独运行。
1. 下载GE源码。
GE源码托管在码云平台可由此下载。
```
git clone https://gitee.com/mindspore/graphengine.git
cd graphengine
```
2. 在GE根目录下执行下列命令即可进行编译。
```
bash build.sh
```
> - 开始编译之前,请确保正确设置相关的环境变量。
> - 在`build.sh`的脚本中,会进行`git clone`操作请确保网络连接正常且git配置正确。
> - 在`build.sh`的脚本中默认会8线程编译如果机器性能较差可能会编译失败。可以通过`-j{线程数}`来控制线程数,如`bash build.sh j4`。
3. 完成编译后相应的动态库文件会生成在output文件夹中。
更多指令帮助,可以使用:
```
bash build.sh h
```
如果想清除历史编译记录,可以如下操作:
```
rm -rf build/ output/
bash build.sh
```
## 社区
- [MindSpore Slack](https://join.slack.com/t/mindspore/shared_invite/enQtOTcwMTIxMDI3NjM0LTNkMWM2MzI5NjIyZWU5ZWQ5M2EwMTQ5MWNiYzMxOGM4OWFhZjI4M2E5OGI2YTg3ODU1ODE2Njg1MThiNWI3YmQ) - 可以提问和找答案。
## 贡献
欢迎参与贡献,更多信息详见[Contributor Wiki](https://gitee.com/mindspore/mindspore/blob/master/CONTRIBUTING.md)。
## Release Notes
Release Notes请参考[RELEASE](RELEASE.md).
## License
[Apache License 2.0](LICENSE)