14 KiB
MindSpore Lite 端侧图像分割demo(Android)
本示例程序演示了如何在端侧利用MindSpore Lite Java API 以及MindSpore Lite 图像分割模型完成端侧推理,实现对设备摄像头捕获的内容进行分割,并在App图像预览界面中显示出最可能的分割结果。
运行依赖
- Android Studio >= 3.2 (推荐4.0以上版本)
构建与运行
-
在Android Studio中加载本示例源码。
启动Android Studio后,点击
File->Settings->System Settings->Android SDK
,勾选相应的SDK Tools
。如下图所示,勾选后,点击OK
,Android Studio即可自动安装SDK。Android SDK Tools为默认安装项,取消
Hide Obsolete Packages
选框之后可看到。使用过程中若出现问题,可参考第4项解决。
-
连接Android设备,运行该应用程序。
通过USB连接Android手机。待成功识别到设备后,点击
Run 'app'
即可在您的手机上运行本示例项目。编译过程中Android Studio会自动下载MindSpore Lite、模型文件等相关依赖项,编译过程需做耐心等待。
Android Studio连接设备调试操作,可参考https://developer.android.com/studio/run/device?hl=zh-cn。
手机需开启“USB调试模式”,Android Studio 才能识别到手机。 华为手机一般在设置->系统和更新->开发人员选项->USB调试中开始“USB调试模型”。
-
在Android设备上,点击“继续安装”,安装完即可查看到设备摄像头捕获的内容和推理结果。
如下图所示,识别出的概率最高的物体是植物。
-
Demo部署问题解决方案。
4.1 NDK、CMake、JDK等工具问题:
如果Android Studio内安装的工具出现无法识别等问题,可重新从相应官网下载和安装,并配置路径。
4.2 NDK版本不匹配问题:
打开
Android SDK
,点击Show Package Details
,根据报错信息选择安装合适的NDK版本。4.3 Android Studio版本问题:
在
工具栏-help-Checkout for Updates
中更新Android Studio版本。4.4 Gradle下依赖项安装过慢问题:
如图所示, 打开Demo根目录下
build.gradle
文件,加入华为镜像源地址:maven {url 'https://developer.huawei.com/repo/'}
,修改classpath为4.0.0,点击sync
进行同步。下载完成后,将classpath版本复原,再次进行同步。
示例程序详细说明
本端侧图像分割Android示例程序使用Java实现,Java层主要通过Android Camera 2 API实现摄像头获取图像帧,进行相应的图像处理,之后调用Java API 完成模型推理。
此处详细说明示例程序的Java层图像处理及模型推理实现,Java层运用Android Camera 2 API实现开启设备摄像头以及图像帧处理等功能,需读者具备一定的Android开发基础知识。
示例程序结构
app
├── src/main
│ ├── assets # 资源文件
| | └── deeplabv3.ms # 存放模型文件
│ |
│ ├── java # java层应用代码
│ │ └── com.mindspore.imagesegmentation
│ │ ├── help # 图像处理及MindSpore Java调用相关实现
│ │ │ └── ImageUtils # 图像预处理
│ │ │ └── ModelTrackingResult # 推理数据后处理
│ │ │ └── TrackingMobile # 模型加载、构建计算图和推理
│ │ └── BitmapUtils # 图像处理
│ │ └── MainActivity # 交互主页面
│ │ └── OnBackgroundImageListener # 获取相册图像
│ │ └── StyleRecycleViewAdapter # 获取相册图像
│ │
│ ├── res # 存放Android相关的资源文件
│ └── AndroidManifest.xml # Android配置文件
│
├── CMakeList.txt # cmake编译入口文件
│
├── build.gradle # 其他Android配置文件
├── download.gradle # 工程依赖文件下载
└── ...
配置MindSpore Lite依赖项
Android 调用MindSpore Java API时,需要相关库文件支持。可通过MindSpore Lite源码编译生成mindspore-lite-{version}-minddata-{os}-{device}.tar.gz
库文件包并解压缩(包含libmindspore-lite.so
库文件和相关头文件),在本例中需使用生成带图像预处理模块的编译命令。
version:输出件版本号,与所编译的分支代码对应的版本一致。
device:当前分为cpu(内置CPU算子)和gpu(内置CPU和GPU算子)。
os:输出件应部署的操作系统。
本示例中,build过程由download.gradle文件自动下载MindSpore Lite 版本文件,并放置在app/src/main/cpp/
目录下。
若自动下载失败,请手动下载相关库文件,解压并放在对应位置:
mindspore-lite-1.0.1-runtime-arm64-cpu.tar.gz 下载链接
在app的build.gradle
文件中配置CMake编译支持,以及arm64-v8a
的编译支持,如下所示:
android{
defaultConfig{
externalNativeBuild{
cmake{
arguments "-DANDROID_STL=c++_shared"
}
}
ndk{
abiFilters 'arm64-v8a'
}
}
}
在app/CMakeLists.txt
文件中建立.so
库文件链接,如下所示。
# ============== Set MindSpore Dependencies. =============
include_directories(${CMAKE_SOURCE_DIR}/src/main/cpp)
include_directories(${CMAKE_SOURCE_DIR}/src/main/cpp/${MINDSPORELITE_VERSION}/third_party/flatbuffers/include)
include_directories(${CMAKE_SOURCE_DIR}/src/main/cpp/${MINDSPORELITE_VERSION})
include_directories(${CMAKE_SOURCE_DIR}/src/main/cpp/${MINDSPORELITE_VERSION}/include)
include_directories(${CMAKE_SOURCE_DIR}/src/main/cpp/${MINDSPORELITE_VERSION}/include/ir/dtype)
include_directories(${CMAKE_SOURCE_DIR}/src/main/cpp/${MINDSPORELITE_VERSION}/include/schema)
add_library(mindspore-lite SHARED IMPORTED )
add_library(minddata-lite SHARED IMPORTED )
set_target_properties(mindspore-lite PROPERTIES IMPORTED_LOCATION
${CMAKE_SOURCE_DIR}/src/main/cpp/${MINDSPORELITE_VERSION}/lib/libmindspore-lite.so)
set_target_properties(minddata-lite PROPERTIES IMPORTED_LOCATION
${CMAKE_SOURCE_DIR}/src/main/cpp/${MINDSPORELITE_VERSION}/lib/libminddata-lite.so)
# --------------- MindSpore Lite set End. --------------------
# Link target library.
target_link_libraries(
...
# --- mindspore ---
minddata-lite
mindspore-lite
...
)
下载及部署模型文件
从MindSpore Model Hub中下载模型文件,本示例程序中使用的终端图像分割模型文件为deeplabv3.ms
,同样通过download.gradle脚本在APP构建时自动下载,并放置在app/src/main/assets
工程目录下。
若下载失败请手动下载模型文件,deeplabv3.ms 下载链接。
编写端侧推理代码
调用MindSpore Lite Java API实现端测推理。
推理代码流程如下,完整代码请参见src/java/TrackingMobile.java
。
-
加载MindSpore Lite模型文件,构建上下文、会话以及用于推理的计算图。
- 加载模型文件:创建并配置用于模型推理的上下文
// Create context and load the .ms model named 'IMAGESEGMENTATIONMODEL' model = new Model(); if (!model.loadModel(Context, IMAGESEGMENTATIONMODEL)) { Log.e(TAG, "Load Model failed"); return; }
- 创建会话
// Create and init config. msConfig = new MSConfig(); if (!msConfig.init(DeviceType.DT_CPU, 2, CpuBindMode.MID_CPU)) { Log.e(TAG, "Init context failed"); return; } // Create the MindSpore lite session. session = new LiteSession(); if (!session.init(msConfig)) { Log.e(TAG, "Create session failed"); msConfig.free(); return; } msConfig.free();
- 构建计算图
if (!session.compileGraph(model)) { Log.e(TAG, "Compile graph failed"); model.freeBuffer(); return; } // Note: when use model.freeBuffer(), the model can not be compile graph again. model.freeBuffer();
-
将输入图片转换为传入MindSpore模型的Tensor格式。
List<MSTensor> inputs = session.getInputs(); if (inputs.size() != 1) { Log.e(TAG, "inputs.size() != 1"); return null; } // `bitmap` is the picture used to infer. float resource_height = bitmap.getHeight(); float resource_weight = bitmap.getWidth(); ByteBuffer contentArray = bitmapToByteBuffer(bitmap, imageSize, imageSize, IMAGE_MEAN, IMAGE_STD); MSTensor inTensor = inputs.get(0); inTensor.setData(contentArray);
-
对输入Tensor按照模型进行推理,获取输出Tensor,并进行后处理。
- 图执行,端侧推理。
// After the model and image tensor data is loaded, run inference. if (!session.runGraph()) { Log.e(TAG, "Run graph failed"); return null; }
- 获取输出数据。
// Get output tensor values, the model only outputs one tensor. List<String> tensorNames = session.getOutputTensorNames(); MSTensor output = session.getOutputByTensorName(tensorNames.front()); if (output == null) { Log.e(TAG, "Can not find output " + tensorName); return null; }
- 输出数据的后续处理。
// Show output as pictures. float[] results = output.getFloatData(); ByteBuffer bytebuffer_results = floatArrayToByteArray(results); Bitmap dstBitmap = convertBytebufferMaskToBitmap(bytebuffer_results, imageSize, imageSize, bitmap, dstBitmap, segmentColors); dstBitmap = scaleBitmapAndKeepRatio(dstBitmap, (int) resource_height, (int) resource_weight);
-
图片处理及输出数据后处理请参考如下代码。
Bitmap scaleBitmapAndKeepRatio(Bitmap targetBmp, int reqHeightInPixels, int reqWidthInPixels) { if (targetBmp.getHeight() == reqHeightInPixels && targetBmp.getWidth() == reqWidthInPixels) { return targetBmp; } Matrix matrix = new Matrix(); matrix.setRectToRect(new RectF(0f, 0f, targetBmp.getWidth(), targetBmp.getHeight()), new RectF(0f, 0f, reqWidthInPixels, reqHeightInPixels), Matrix.ScaleToFit.FILL; return Bitmap.createBitmap(targetBmp, 0, 0, targetBmp.getWidth(), targetBmp.getHeight(), matrix, true); } ByteBuffer bitmapToByteBuffer(Bitmap bitmapIn, int width, int height, float mean, float std) { Bitmap bitmap = scaleBitmapAndKeepRatio(bitmapIn, width, height); ByteBuffer inputImage = ByteBuffer.allocateDirect(1 * width * height * 3 * 4); inputImage.order(ByteOrder.nativeOrder()); inputImage.rewind(); int[] intValues = new int[width * height]; bitmap.getPixels(intValues, 0, width, 0, 0, width, height); int pixel = 0; for (int y = 0; y < height; y++) { for (int x = 0; x < width; x++) { int value = intValues[pixel++]; inputImage.putFloat(((float) (value >> 16 & 255) - mean) / std); inputImage.putFloat(((float) (value >> 8 & 255) - mean) / std); inputImage.putFloat(((float) (value & 255) - mean) / std); } } inputImage.rewind(); return inputImage; } ByteBuffer floatArrayToByteArray(float[] floats) { ByteBuffer buffer = ByteBuffer.allocate(4 * floats.length); FloatBuffer floatBuffer = buffer.asFloatBuffer(); floatBuffer.put(floats); return buffer; } Bitmap convertBytebufferMaskToBitmap(ByteBuffer inputBuffer, int imageWidth, int imageHeight, Bitmap backgroundImage, int[] colors) { Bitmap.Config conf = Bitmap.Config.ARGB_8888; Bitmap dstBitmap = Bitmap.createBitmap(imageWidth, imageHeight, conf); Bitmap scaledBackgroundImage = scaleBitmapAndKeepRatio(backgroundImage, imageWidth, imageHeight); int[][] mSegmentBits = new int[imageWidth][imageHeight]; inputBuffer.rewind(); for (int y = 0; y < imageHeight; y++) { for (int x = 0; x < imageWidth; x++) { float maxVal = 0f; mSegmentBits[x][y] = 0; // NUM_CLASSES is the number of labels, the value here is 21. for (int i = 0; i < NUM_CLASSES; i++) { float value = inputBuffer.getFloat((y * imageWidth * NUM_CLASSES + x * NUM_CLASSES + i) * 4); if (i == 0 || value > maxVal) { maxVal = value; // Check whether a pixel belongs to a person whose label is 15. if (i == 15) { mSegmentBits[x][y] = i; } else { mSegmentBits[x][y] = 0; } } } itemsFound.add(mSegmentBits[x][y]); int newPixelColor = ColorUtils.compositeColors( colors[mSegmentBits[x][y] == 0 ? 0 : 1], scaledBackgroundImage.getPixel(x, y) ); dstBitmap.setPixel(x, y, mSegmentBits[x][y] == 0 ? colors[0] : scaledBackgroundImage.getPixel(x, y)); } } return dstBitmap; }