小米开源框架MACE 源码阅读笔记

article/2025/9/15 16:20:50




转载自 https://www.jianshu.com/p/7061fd67d419

前扯

在前不久的某高峰论坛上,小米开源了其移动端的深度学习框架Mobile AI Compute Engine(MACE)。这对于很多致力于嵌入式端优化的人来说,无疑是巨大的惊喜(新坑出现,在 NCNNTVMTensorLite 的坑里不断徘徊的人表示泪目…)。要掌握并使用一个框架,不单单能够跑通 demo,还需要对其源码有充分的认识,知其优而优。笔者开启此帖(坑),希望能够分享自己学习源码的过程,水平及理解有限,欢迎交流(点赞)和指正(赞赏)。

另外,Github上的代码会一直处于更新中,后续会尽量紧跟更新。

开篇

首先看一下从Github上拉下来的代码结构:

下边的几个文件是一些版本发布与介绍性文件,与代码的相关性不大,简单看下 README_zh.md 里边说的:

“Mobile AI Compute Engine (MACE) 是一个专为移动端异构计算平台优化的神经网络计算框架。主要从以下的角度做了专门的优化:

  • 性能
    代码经过NEON指令,OpenCL以及Hexagon HVX专门优化,并且采用 Winograd算法 来进行卷积操作的加速。此外,还对启动速度进行了专门的优化。

  • 功耗
    支持芯片的功耗管理,例如ARM的big.LITTLE调度,以及高通Adreno GPU功耗选项。

  • 系统响应
    支持自动拆解长时间的OpenCL计算任务,来保证UI渲染任务能够做到较好的抢占调度,从而保证系统UI的相应和用户体验。

  • 内存占用
    通过运用内存依赖分析技术,以及内存复用,减少内存的占用。另外,保持尽量少的外部依赖,保证代码尺寸精简。

  • 模型加密与保护
    模型保护是重要设计目标之一。支持将模型转换成C++代码,以及关键常量字符混淆,增加逆向的难度。

  • 硬件支持范围
    支持高通,联发科,以及松果等系列芯片的CPU,GPU与DSP(目前仅支持Hexagon)计算加速。同时支持在具有POSIX接口的系统的CPU上运行。

看其介绍,MACE团队应该是倾注了不少心血,希望能够不断完善下去。

回到代码目录上来。docker文件夹是几个与docker安装相关的文件,不用过多关注。docs文件夹是一些文档,与代码关系不大。third_partytools文件夹是需要用到的一些第三方模块和代码构建、测试所用到的相关脚本。其中tools/converter.py是构建代码的顶层脚本,有兴趣的可以详细看一下,之前的文章里也有提到 <小米开源框架MACE> 如何构建和使用。

核心的代码在mace文件夹下。同样的,先看一下mace文件夹下的结构:

仍然是聚焦一些与框架代码相关的文件夹。此处默认读者已事先学习过mace\examples\cli\examples.cc,如没有建议先过一遍,对如何在项目里使用 mace 有个了解。也可以参考 <小米开源框架MACE> 如何构建和使用 一文的最后内容。按照 examples.cc 里的引用,先来看 public 文件夹里的两个头文件:mace.hmace_runtime.h

mace\public\mace.h 剖析

mace.h头文件定义了mace框架的几个核心API,包括 CallStatsConvPoolArgsOperatorStats 三个结构体以及 DeviceType 和 MaceStatus 两个枚举类型。

  1. enum DeviceType { CPU = 0, GPU = 2, HEXAGON = 3 }; //框架支持的设备类型及其对应ID.
  1. enum MaceStatus {
  2. MACE_SUCCESS = 0,
  3. MACE_INVALID_ARGS = 1,
  4. MACE_OUT_OF_RESOURCES = 2
  5. }; // 函数的返回类型

mace.h头文件中还定义了三个类:RunMetadataMaceTensor 和 MaceEngine

RunMetadata:定义了一个public类型的变量 op_stats,类型为vector <OperatorStats>
MaceTensor:定义了 MACE 输入输出 tensor,有几个不同形式的构造函数
MaceEngine:作为 MACE 框架引擎,根据构造函数传入的DeviceType执行相应的功能代码

MaceTensor 和 MaceEngine两个类中都分别定义了一个嵌套类Impl,这个嵌套类才是真正实现具体功能的类。

mace\core\mace.cc剖析

对应于mace\public\mace.h头文件的实现文件为mace\core\mace.cc
作为深入源码的第一步,下面我们一起看一下这个文件。

首先是LoadModelData 和 UnloadModelData两个与模型数据导入和清空的函数。

接下来是MaceTensor中的嵌套类Impl的定义:

  1. class MaceTensor::Impl {
  2. public:
  3. std::vector<int64_t> shape;
  4. std::shared_ptr<float> data;
  5. };

然后是MaceTensor的构造函数实现。MaceTensor的构造函数主要实现Impl类中shapedata两个变量的初始化工作,以下贴出其中一种形式的构造函数,更多代码请查阅mace\core\mace.cc

  1. MaceTensor::MaceTensor(const std::vector<int64_t> &shape,
  2. std::shared_ptr<float> data) {
  3. MACE_CHECK_NOTNULL(data.get());
  4. impl_ = std::unique_ptr<MaceTensor::Impl>(new MaceTensor::Impl());
  5. impl_->shape = shape;
  6. impl_->data = data;
  7. }

MaceTensor 类中还有三个成员函数,用于获取impl的变量值。

  1. const std::vector<int64_t> &MaceTensor::shape() const { return impl_->shape; }
  2. const std::shared_ptr<float> MaceTensor::data() const { return impl_->data; }
  3. std::shared_ptr<float> MaceTensor::data() { return impl_->data; }

接下来是MaceEngine中的嵌套类Impl的定义,其中涉及到的WorkspaceNetBase等类,暂时不需要过多关注,只需要知道这个内嵌类实现了MACE引擎的创建、初始化和运行。下边是Impl类的主体代码:

  1. class MaceEngine::Impl {
  2. public:
  3. explicit Impl(DeviceType device_type);
  4. ~Impl();
  5. MaceStatus Init(const NetDef *net_def,
  6. const std::vector<std::string> &input_nodes,
  7. const std::vector<std::string> &output_nodes,
  8. const unsigned char *model_data);
  9. MaceStatus Init(const NetDef *net_def,
  10. const std::vector<std::string> &input_nodes,
  11. const std::vector<std::string> &output_nodes,
  12. const std::string &model_data_file);
  13. MaceStatus Run(const std::map<std::string, MaceTensor> &inputs,
  14. std::map<std::string, MaceTensor> *outputs,
  15. RunMetadata *run_metadata);
  16. private:
  17. const unsigned char *model_data_;
  18. size_t model_data_size_;
  19. std::shared_ptr<OperatorRegistry> op_registry_;
  20. DeviceType device_type_;
  21. std::unique_ptr<Workspace> ws_;
  22. std::unique_ptr<NetBase> net_;
  23. std::map<std::string, mace::InputInfo> input_info_map_;
  24. std::map<std::string, mace::OutputInfo> output_info_map_;
  25. #ifdef MACE_ENABLE_HEXAGON
  26. std::unique_ptr<HexagonControlWrapper> hexagon_controller_;
  27. #endif
  28. MACE_DISABLE_COPY_AND_ASSIGN(Impl);
  29. };

Impl 类中有ImplInitRun三个函数(Init有一个重载函数)。

  • Impl函数
    Impl 函数是构造函数,完成一些变量的初始化工作。与 Tensor 相关的一些操作会在 Workspace 下,因而此处创建了一个 Workspace对象。

  • Init函数
    Init 函数完成 MaceEngine 的初始化工作。包括根据网络定义创建输入输出的存储 map,根据输入输出节点和 deviceType 创建Tensor,初始化整个网络模型。Init还有一个重载函数,区别只是const unsigned char *model_data 和 const std::string &model_data_file 这两个参数。后者通过 LoadModelData 载入模型数据后调用前者完成初始化。

  • Run函数
    Run 函数根据输入输出文件信息,初始化的模型信息和模型数据,以及 device_type_类型调用相应的执行代码。完成模型的前向运算。输出运算结果并保存。

MaceEngine 类本身还有InitRun 函数,都是通过调用 Impl 类的相应函数实现的。

mace\core\mace.cc 中还有一个 CreateMaceEngineFromProto 函数。这个函数和 mace/codegen/engine/mace_engine_factory.h 中 CreateMaceEngineFromCode 函数是对应的。两者都是通过调用MaceEngine 的 Init 函数(也即调用 Impl 的Init函数) 实现初始化过程。 区别在于,前者是通过模型proto定义文件进行初始化,后者是将模型编为代码(在模型部署文件 .yaml 中设置CODE_TYPE 为 code)。mace/codegen/engine/mace_engine_factory.h 这个文件是代码构建之后产生的。

以上,对 mace\public\mace.h 和 mace\core\mace.cc 进行了分解,并分析了 mace 框架顶层的几个API,也是框架的基础。

后续将陆续扩展到框架中核心代码的实现。

敬请拍砖(轻拍o( ̄▽ ̄)d )。

版权所有,欢迎转载,转载请注明出处


http://chatgpt.dhexx.cn/article/NSapYpuY.shtml

相关文章

Mace-micro引擎编译与测试

官方简介 Mobile AI Compute Engine (MACE) 是一个专为移动端异构计算平台(支持Android, iOS, Linux, Windows)优化的神经网络计算框架。 主要从以下的角度做了专门的优化&#xff1a; 性能 代码经过NEON指令&#xff0c;OpenCL以及Hexagon HVX专门优化&#xff0c;并且采用W…

小米MACE开源框架搭建

一、环境配置 请参照小米官方的文档&#xff1a; https://mace.readthedocs.io/en/latest/installation/env_requirement.html For Android build, ANDROID_NDK_HOME must be confifigured by using export ANDROID_NDK_HOME/path/to/ndk It will link libc instead of gnustl …

小米AI平台MACE的构建和部署

1.准备部署文件 需要准备的部署文件包括头文件(.h), mace库文件(.)&#xff0c;转化后的模型(.a)&#xff0c;这里以resnet18v1-opt.onnx模型为例 1.1. 优化onnx模型 # Optimize your model $python MACE_ROOT/tools/onnx_optimizer.py resnet18v1.onnx resnet18v1-opt.onnx…

小米开源框架MACE - 源码阅读笔记一

首先先一目了然看一下其目录结构&#xff08;这些个源码可以在github上下载到&#xff0c;只要在GitHub搜索mace即可&#xff09;&#xff1a; 介绍 MACE&#xff08;Mobile AI Compute Engine&#xff09;是一个针对移动异构计算平台优化的深度学习推理框架。MACE提供工具和文…

MACE的环境搭建和工程构建

1. MACE 主页 MACE 的github地址&#xff1a;https://github.com/XiaoMi/mace 小米官方的相关文档&#xff1a;https://mace.readthedocs.io/en/latest/ 对开发环境的要求&#xff0c;可以按照以下指令安装相关的包&#xff1a; 2. 安装docker 参照教程&#xff1a;https:/…

meterpreter之timestomp命令修改文件MACE时间

文章目录 前言一、timestomp的使用前提二、MACE时间1、文件系统简述2、linux操作系统3、windows操作系统 三、timestomp使用详解1.查看帮助文档2.使用-v选项查看文件信息3.使用-f选项拷贝文件MACE时间4.使用-m/-a/-c/-e修改文件MACE时间5.使用-b/-r使MACE时间显示清空 总结 前言…

小米开源AI框架mace编译构建

目录 简介 环境要求 1 安装 Bazel 2 安装Android NDK 3 在Ubuntu16.04下安装Docker&#xff08;17.09&#xff09; 构建并运行示例模型 1 拉取MACE项目 2 拉取MACE Model Zoo项目 3 构建通用MACE库 4 将预先训练的mobilenet-v2模型转换为MACE格式模型 编译运行DEMO…

使用MACE加速---使用篇

最近开始研究如何对手机应用中的识别算法进行加速&#xff0c;搜索后发现了小米的MACE。 Mobile AI Compute Engine (MACE) 是一个专为移动端异构计算设备优化的深度学习前向预测框架。 覆盖了常见的移动端计算设备&#xff08;CPU&#xff0c;GPU和DSP&#xff09;。支持的硬…

小米AI推理框架MACE介绍

MACE 是小米公司自研的移动端深度学习框架 Mobile AI Compute Engine&#xff0c;2017年12月15日于公司内部正式发布。2018年6月28日&#xff0c;在“2018&#xff08;第十三届&#xff09;开源中国开源世界高峰论坛”上&#xff0c;小米公司人工智能与云平台副总裁崔宝秋博士宣…

MACE 使用笔记

环境安装 tensorflow 安装&#xff0c;一直不太想用mace的部分原因是不支持tensorflow2.模型&#xff0c; 但为了GPU(OpenCL)还是要用啊。 Shell set -e 学习笔记&#xff1a; shell 中的 set -e &#xff0c; set e 用法_滴水成川-CSDN博客_linux set-eset -eset命令的-e参…

小米开源框架MACE 简介

转载自 https://www.jianshu.com/p/2ab68779d05b 前言 MACE 是小米公司自研的移动端深度学习框架 Mobile AI Compute Engine&#xff0c;2017年12月15日于公司内部正式发布。2018年6月28日&#xff0c;在“2018&#xff08;第十三届&#xff09;开源中国开源世界高峰论坛”上…

MACE(1)-----环境搭建

学习MACE也有一个月了&#xff0c;将其划分三步来学习。本文是MACE学习的第一步即MACE环境的搭建。之后还有两步mace的编译和mace工程化。 MACE(2)-----模型编译&#xff1a;https://www.cnblogs.com/missidiot/p/9509831.html MACE(3)-----工程化&#xff1a;https://www.cnbl…

JDK , Tomcat , Eclipse 版本对应关系

1. JDK , Tomcat 版本对应关系 参考网址 : https://tomcat.apache.org/whichversion.html 2. JDK , Eclipse 版本对应关系 参考网址 : https://wiki.eclipse.org/Eclipse/Installation 作者 Github : tojohnonly , 博客 : EnskDeCode

如何查看eclipse的版本

阅读数&#xff1a;20254 转载文章&#xff0c;原文地址&#xff1a;https://blog.csdn.net/duqian94/article/details/52386076 由于作者已经写的很清楚了&#xff0c;就没有做修改直接转载过来了。 本篇文章主要讲解的是三种查看eclipse版本的方法&#xff08;超详细&#xf…

Eclipse各版本有什么区别?

一直以来对eclipse这个IDE的各发行版本都弄不清楚&#xff0c;今天做一个梳理和记录。 Eclipse基本内核包括&#xff1a;图形API&#xff08;SWT/Jface&#xff09;&#xff0c;Java开发环境插件&#xff08;JDT&#xff09;&#xff0c;插件开发环境&#xff08;PDE&#xff0…

超方便插件lombok的使用(eclipse版本)

1 准备 下载地址&#xff1a; 链接&#xff1a;https://pan.baidu.com/s/1Qoy2VRoERqZcgsOVYl3mZQ 提取码&#xff1a;2chx 2.安装 点击 或者找到对应的lombok文件所在目录执行java -jar lombok(1).jar 会自动扫描eclipse所以目录&#xff0c;也可以自己选择点击"S…

查看Eclipse版本号及各个版本区别

1. 找到eclipse安装目录 2. 进入readme文件夹&#xff0c;打开readme_eclipse.html 3. readme_eclipse.html呈现的第二行即数字版本号&#xff0c;如&#xff1a; Eclipse Project Release Notes Release 4.2.0 Last revised June 8th, 2012 附&#xff1a;Eclipse各个版本简介…

安装两个Eclipse 版本不一致,高版本无法打开

Could not create the Java Virtual Machine&#xff0c;A fatal exception has occurred。 首先删除了 工作空间的配置 然后删除掉C:\Windows\System32 里面的三个java文件 java.exe javas.exe javaw.exe 配置好环境变量就好了

eclipse选择java版本_使用 Eclipse 开发版本选择和下载说明

现在越来越多的人开发使用 IDEA,使用 Eclipse 开发的已经渐渐变少了,这篇就简单介绍下 Eclipse 的版本选择和下载,供目前还在坚守使用 Eclipse 开发的同胞们~ Eclipse 简介 Eclipse 是一个开放源代码的、基于Java的可扩展开发平台。就其本身而言,它只是一个框架和一组服务,…

解决pydev与eclipse版本问题

eclipsepydevanaconda版本问题方法&#xff1a; 在eclipse安装pydev插件时&#xff0c;会遇见安装后在“Preference”不显示“pydev”现象&#xff0c;原因&#xff1a;下载的pydev版本与eclipse版本不匹配&#xff0c;导致无法使用&#xff0c;经过反复调试&#xff0c;发现官…