ARM_SMMU_上

article/2025/9/18 10:20:38

本篇参考 arm 官网公开材料 和 小崔的linux 专栏 https://zhuanlan.zhihu.com/p/105005488

宋宝华老师MMU介绍
armv8-armv9 MMU深度学习

MMU简介

MMU是Memory Management Unit的缩写,中文名是内存管理单元。它是一种负责处理中央处理器(CPU)的内存访问请求的计算机硬件。它的功能包括虚拟地址到物理地址的转换(即虚拟内存管理)、内存保护、中央处理器高速缓存的控制。

在linux中,用户态使用的内存是虚拟地址(Virtual Address,VA),实际硬件内存称为物理地址(Physical Address,PA)。用户访问内存看到的是VA,内核转化成PA操作实际物理地址。这里要提一下,实际MMU硬件支持2层转化,PA->IPA->VA,但是linux bypass了IPA,简化了流程(加密1次和加密2次效果一样)。

对用户体现虚拟地址,一方面可以起到安全作用(防止直接访问物理地址,查看我们存储的数据),另一方面减少用户对物理内存设备的关注,用户只要关注申请、读写、释放等使用内存操作即可。

DMA简介

操作系统中,内存的使用非常频繁,小到一个进程任务分配堆栈、申请内存,大到设备访问内存(读写等操作)。根据上述MMU功能介绍,这些内存使用都需要经过CPU从VA到PA的互相转化。而CPU的总线固定,一旦访问过多,访问有快有慢等,势必造成总线拥堵,影响性能。

此时加入DMA (Direct Memory Access,直接内存存取)硬件,它与外设和内存连接,将搜集的数据批量传输到内存,然后再发送一个中断通知CPU去内存取,这样减少了CPU被中断的次数,提高了系统的效率。如下图:
在这里插入图片描述
由于DMA不能像CPU一样通过MMU操作虚拟地址,所以DMA需要的是连续的物理地址。

smmu

A System Memory Management Unit (SMMU) performs a task that is analogous to that of an MMU in a PE, ** **. It is active for DMA only. Traffic in the other direction, from the system or PE to the device, is managed by other means – for example, the PE MMUs.

SMMU全称System Memory Management Unit,看名字很难理解是做什么的。其实 SMMU 和 MMU具有同样的作用,区别是供使用DMA的外设使用,同样提供页表转换工作,外设可通过页表转换访问物理地址,达到devices设备和进程一样使用虚拟地址。
在这里插入图片描述
官方给出的应用1:
在这里插入图片描述
如上图:

1)上面SMMU给(使能DMA)device提供地址转换功能。device 使用VA访问内存,smmu根据VA计算对应PA,访问物理内存;

2)下面SMMU一对一连接PCIe Root Complex (which itself hosts a network of endpoints)设备,为PCIE设备提供虚拟地址(通过ATS)功能。

官方给出的应用2:
在这里插入图片描述
1)SMMU A为complex device提供地址翻译功能;

2)SMMU B为多个device(使用同个I/O,经过DMA)提供地址翻译功能;

3)SMMU C并行提供多条路径,多个功能,以提供更高带宽,包括:
a. central translation table walker,包括主接口(用于获取翻译地址、初始化页表结构和队列)以及从接口(用于配置访问权限)。
b. 为多个device设备和PCIe提供虚拟化能力。

SMMU和MMU功能一样,为device设备提供地址转换功能,同时提供读写权限、Cache属性,更厉害的是MMU和SMMU可以共页表。

相对不同的是,一个MMU仅支持一个CPU,但是SMMU可以支持多个外设,为了区分这些外设,使用StreamID来标识,同个SMMU的StreamID必须唯一,不同SMMU的StreamID互不影响.

SMMU提供三大功能

1.地址转换功能,虚拟内存,提供1级页表和2级页表的能力;

2.地址读写权限属性、cache属性;

3.地址转换,存储空间扩展功能,比如设备需要地址空间大于物理内存空间;
在这里插入图片描述
如上图,smmu最大提供2级页表转换,并可控制 stage1 和 stage2 是否 bypass(bypass:不进行地址转换,直接透传):

  1. 如果SMMU全局接口关闭(SMMU_CR0.SMMUEN == 0),地址不经过翻译直接bypass传输,相当于无smmu器件;

  2. stage1 bypass,只提供IPA->PA; stage2 bypass,只提供VA->IPA;这里理解下,并不是说任一bypass,smmu就无法提供VA->PA的能力,而是只翻译一次。之前提过,linux的IPA是直接bypass,只用一次页表翻译的,所以理论上bypass stage1或stage2,翻译一次即可同linux页表翻译,此时比如只使能stage1,VA->IPA相当于VA->PA;

stream table entry(STE)

SMMU有2个数据结构保存stage1和stage2地址翻译信息,分别是 STE和CD(Context descriptor)
在这里插入图片描述
STE(stream table entry):包含stage1初始化信息、CD表指针(CD中包含stage1的页表基地址和相关转换信息)、stage2的页表基地址以及相关转换信息(如果使能stage2的话)
Incoming transaction的stream定位STE。Stream表支持两种格式: Linear Stream Table 和 2-level Strem table.

Linear Stream Table

在这里插入图片描述
一个 linear Stream table 是一个连续的STE array,由StreamID从0开始索引。该大小可配置为STE大小的 2n 倍,直到 SMMU 硬件支持的最大 StreamID 位数。所有SMMU实现都支持线性流表格式

2-level Strem table

在这里插入图片描述
2-level Stream table 是由一个 top-level table 组成的结构,该表包含指向多个二级表的描述符,这些二级表包含STEs。整个结构所覆盖的 streamid 的跨度可以配置到SMMU支持的最大数量,但第二级表不需要完全填充,大小可能不同。这节省了内存,并避免了对非常大的stream空间进行大型物理连续分配的需求

如上
1)SMMU根据 STRTAB_BASE 查找 STE table,每个设备对应一个streamID,并对应一个STE表。
2)SMMU_(S_)STRTAB_BASE_CFG.SPLIT 决定是 Linear Stream Table 还是 2-level Stream Table 查表方式;
3)Linear Stream Table 方式每个 StreamID 对应一个STE
4)2-level Stream Table方式 StreamID 不同 bit 指向不同STE

Context descriptor(CD)

在这里插入图片描述
CD(Context descriptor):包含stage1的页表基地址和相关转换信息;
在这里插入图片描述
stage1和stage2相关转换流程,如上图:

1)SMMU根据StreamID和SMMU_STRTAB_BASE查找到设备对应STE表;
2)SMMU检查STE表,STE.Config决定是否进行stage1转换,如果是,则(结合SubStreamID)根据S1ContextPtr指向对应CD表,CD表中包含stage1页表和转换的信息;
3)SMMU根据S2TTB(如果配置的话),查找stage2页表和转换信息;
在这里插入图片描述
由上可知每个SubStreamID对应一个CD表,SubStreamID对应每个用户态空间地址,换句话说,每个涉及对应外设的进程,都对应一个SubStreamID。
在这里插入图片描述

TLB(Translation Lookaside Buffer)

Translation Lookaside Buffer可翻译为“地址转换后援缓冲器”,也可简称为“快表”。用于存放页表转换关系的 cache,其中存储了当前最可能被访问到的页表项,其内容是部分页表项的一个副本。只有在TLB无法完成地址翻译任务时,才会到内存中查询页表,这样就减少了页表查询导致的处理器性能下降,提高页表转换的效率。

TLB miss:在TLB中没有找到需要查找的页表,需要到配置中查找;
TLB hit:在TLB中找到所需页表;
PTW:Page Table Walk,页表查找过程
在这里插入图片描述

SMMU整个查表流程,如上图是页表翻译过程:
1)外设输入VA、StreamID 和 SubStreamID 给SMMU;
2)SMMU 查表 STE 和 CD,找到 stage1 和 stage2 页表转换信息;
3)先通过 TLB 查找页表,找到则计算对应 PA 地址,没找到则根据 STE 和 CD 计算 PA;
4)将PA地址输出;


http://chatgpt.dhexx.cn/article/ckalhBT3.shtml

相关文章

SMMU架构手册之数据结构和转换流程(3)

3. 配置和转换的查找 图中 描述了配置查找和转换查找所涉及的相关概念。 正如3.3.2中所描述的,传入的事务首先受配置查找的约束,而SMMU决定怎样开始进行事务的转换。这涉及到找到合适的STE,如果有必要也需要CD。 配置的查找不依赖于输入的地址…

简谈MMU与SMMU

在服务器的处理器firmware开发中,经常会遇到大家讨论MMU和SMMU的概念,而且会进一步讨论的相关的TLB和huge TLB概念。实不相瞒,一开始我是非常懵逼的,只是写code而已,最多是有用到MMIO来写device的寄存器,MM…

arm smmu 学习(1)

文章linux 4.14 代码分析smmu 流程 linux 在驱动找到对应的设备后会执行driver_probe_device 函数,具体dev和drv 匹配参考文章链接 driver_probe_device->really_probe->dma_configure->of_dma_configure int of_dma_configure(struct device *dev, str…

linux内核笔记之SMMU代码分析

2020/06/10: first version, 主要介绍smmu驱动的初始化流程 在前一篇博文ARM SMMU学习笔记中, 介绍了SMMU的一些基本概念以及SMMU地址转换的基本流程,本文主要分析linux kernel中SMMUv3的代码(drivers/iommu/arm-smmu-v3.c) linux kernel版本…

smmu实现分析

1.概述 1.1 SMMU产生背景 了解SMMU产生背景之前,首先要了解DMA工作原理。因为SMMU的产生主要是为了解决虚拟化平台下的DMA重映射问题。 DMA,外设和内存的连接件,用于解放CPU。外设可以通过DMA,将搜集的数据批量传输到内存&…

ARM SMMU介绍

SMMU:system Memory Management Unit系统存储管理单元 类似于CPU流水线中的MMU,SMMU负责翻译IO主设备对内存等从设备的读写请求地址,例如DMA,主设备读写请求也会发送到CPU物理地址总线上。IO设备上的DMA会对CPU物理地址总线上的内…

SMMU学习这一篇就够了

快速链接: . 👉👉👉 个人博客笔记导读目录(全部) 👈👈👈 付费专栏-付费课程 【购买须知】:【精选】ARMv8/ARMv9架构入门到精通-[目录] 👈👈👈引流关键词: SMMU,mmu500,mmu600,mmu700,system mmu,Non-cacheable,Cacheable, non-shareable,inner-shareable,…

arm64 smmu 驱动笔记

设备StreamID:sid struct iommu_fwspec {const struct iommu_ops *ops;struct fwnode_handle *iommu_fwnode;void *iommu_priv;unsigned int num_ids;u32 ids[1]; //ids保存的某device使用的streamID }; 通过iommu_fwspec_add_id函数设置: stru…

ARM_SMMU_下

SMMU驱动代码分析 本文主要分析linux kernel中SMMUv3的代码(drivers/iommu/arm-smmu-v3.c) linux kernel版本是linux 5.7, 体系结构是aarch64 SMMU的作用是把CPU提交给设备的VA地址,直接作为设备发出的地址,变成正确的物理地址,访问到物理内…

arm SMMU

相当于x86下面的IOMMU,是不同架构的不同实现。统一在linux中的IOMMU框架内部,都由结构体 iommu_device 管理。 SMMU的作用是将设备的DMA请求地址翻译成可用的物理地址,当不开启SMMU时也可以直接使用DMA来搬运内存。SMMU是为了安全考虑中间加…

smmu梳理

smmu 用途 用途: (参考引用见 参考资料章节) 访问非连续的地址 现在系统中很少再预留连续的memory,如果Master需要很多memory,可以通过SMMU把一些非连续的PA映射到连续的VA,例如给DMA,VPU&…

Android 底层知识-SMMU

1.首先了解下MMU MMU是Memory Management Unit的缩写,中文名是内存管理单元。它是一种负责处理中央处理器(CPU)的内存访问请求的计算机硬件。它的功能包括虚拟地址到物理地址的转换(即虚拟内存管理)、内存保护、中央处…

理解SMMU基本原理和基本概念

(阅读本文前假设您已经熟悉了MMU工作原理) 什么是SMMU/IOMMU, 有什么作用: SMMU 有MMU完全一样的能力,当设备以DMA方式工作时,连接在它上面的IOMMU/SMMU可以将设备所使用的地址进行进一步的转换,完全和MM…

SMMU 介绍

SMMU在系统中位置和作用 SMMU功能与MMU功能类似,将IO设备的DMA地址请求(IOVA)转化为系统总线地址(PA),实现地址映射、属性转换、权限检查等功能,实现不同设备的DMA地址空间隔离。 SMMU软硬件交互过程 硬件结构如下图所示: SMMU处…

MMU和SMMU/IOMMU使用场景和区别,SMMU技术与cache

目录 1.各种MMU 2.各种MMU的使用场景 2.1 各自的使用场景 2.1.1 地址转换 2.1.2 内存保护 3.MMU和SMMU的区别 4. MMU/SMMU/IOMMU与cache 5.扩展阅读 1.各种MMU MMU是memory manage unit 内存管理单元; SMMU是system memory manage unit 系统内存管理单元&a…

junit runwith

junit的runwith是给单元测试中增加一些附属特性,今天在看flink源码的时候,发现其使用了一个注解RunWith(Parameterized.class),有点好奇,于是研究了一下这个注解的使用。 这个注解产生的背景是这样的:flink中的每个功能…

springmvc--@runwith(springrunner.class)报错

目录 解决方法  1)代码 这是一个文件上传的测试类 不重要,重要的是 RunWith(SpringRunner.class)报错! import com.github.tobato.fastdfs.domain.StorePath; import com.github.tobato.fastdfs.domain.ThumbImageConfig; import com.github.tobato.fastdfs.service.FastF…

run()和start()方法区别

多线程原理:相当于玩游戏机,只有一个游戏机(cpu),可是有很多人要玩,于是,start是排队!等CPU选中你就是轮到你,你就run(),当CPU的运行的…

关于@RunWith注解的一点问题

问题引入 今天在用IDEA写一个springboot测试的时候,碰到了一个问题。 SpringBootTest public class ServiceTest {Autowiredprivate IUserService userService;Testpublic void testSelectById(){User byId userService.getById(1);System.out.println(byId);} }…

Java学习笔记-@RunWith(SpringRunner.class)

我们在进行Test测试时,除了要保证测试的包和启动包是同一个路径下,并且需要在Test测试类上加上RunWith(SpringRunner.class)注解,否则的话会直接报一个NullPointerExecption的错误! RunWith(SpringRunner.class)的作用&#xff1…