S3C2416带有CP15协处理器,里面集成了16KB的I/D-Cache和MMU。MMU负责虚拟地址到物理地址的映射,并提供硬件机制的内存访问权限检查。
笔者此处就MMU的使用作一个简单的介绍。
1. MMU映射时存储器访问
ARM CPU使用表格存储虚拟地址对应的物理地址,这类表格称为页表,页表由一个个条目组成,每个条目存储了一段虚拟地址对应的物理地址及其访问权限,或者下一级页表的地址。
当ARM要访问存储器时,根据MMU设定的一级页表基址(16KB对齐)以及虚拟地址一级页表索引[31:20],产生一个第一级描述符地址。MMU先查找TLB(转译查找缓存)中的虚拟地址表,如果是取指,则用指令TLB,否则用数据TLB。TLB的作用就是缓存之前遍历使用过的页表条目,避免每一次地址转换都去主存页表查找对应的条目,不然性能无法忍受。如果TLB中有第一级描述符地址的入口,则可直接得到该虚拟地址对应的一级页表描述符。描述符包括了访问权限、域、高速缓存、转换基址(二级页表基地)等信息。如果TLB没有第一级描述符地址的入口,则转换表遍历,硬件从主存储器转换表中获取对应的条目,并放入到TLB中。
S3C2416最多会使用到两级页表。以段(1MB)的方式进行转换时只用一级页表,以页方式进行转换时用到两级页表。页的大小有3种,分大页(64KB)、小页(4KB)、微页(1KB)。
当从TLB得到的一级页表描述符为段描述符时,从描述符中可以直接得到这段的段转换基址(1MB对齐),域和权限访问,高速缓存的信息。根据段转换基址以及虚拟地址[19:0]可以得到对应要访问的物理地址。
2. Cache
一般而言,存储器对于cpu来说都是慢速设备。如果每次取指或读写数据都去访问主存储器,则cpu必须等待主存储器读取完成才能进一步往下处理,性能无法忍受。笔者测试相同代码开了Cache与不开Cache,性能有天壤之别。Cache就是在主存与cpu通用寄存器间设置的一个高速,但容量较小的存储器。它能够缓存部分之前执行的代码(或读取的数据)以及目前正在执行的这段代码(或读取的数据)。开启了Cache后,当cpu需要取指(或读取数据),如果Cache中有缓存,则直接从Cache中获取返回,否则访问主存储器。由于程序访问的局部性,Cache具有很高的命中率,对提高程序的运行性能有很大的作用。
3. MMU映射代码实现
在嵌入式设计中,一般为了提高性能,是需要开启MMU的,对开D-Cache,是必须在MMU开启后才能使用。S3C2416从IROM SD/MMC启动时,ARM 0x0偏移处异常向量表位置是内部固化代码地址。如果不对0x0处地址进行内存映射,则无法使用中断。我们采用段方式进行映射,每个条目对应1MB的物理地址空间,32位地址空间共需4096条条目,即需16KB的页表内存空间。
我们实现的MMU模块头文件MMU.h内容如下:
#ifndef__MMU_H__
#define__MMU_H__
#ifdef__cplusplus
extern"C" {
#endif一般是1:1映射
// ICache使能控制位
#define R1_I (1<<12)
// DCache使能控制位
#define R1_C (1<<2)
// 地址对齐检查使能控制位
#define R1_A (1<<1)
// MMU使能控制位
#defineR1_M (1<<0)
// 段标识符,以段(1MB)方式进行映射
#define DESC_SEC ((1<<1)|(1<<4))
// cache_on, write_back cache会出现命中的情况
#define CB (3<<2)
// cache_on, write_through
#define CNB (2<<2)
// cache_off,WR_BUF on cache不会出现命中的情况
#define NCB (1<<2)
// cache_off,WR_BUF off
#define NCNB (0<<2)
//supervisor=RW, user=RW
#define AP_RW (3<<10)
//supervisor=RW, user=RO
#define AP_RO (2<<10)
//supervisor=RW, user=No access
#define AP_NO (1<<10)
// 任何访问都将导致"Domain fault"
#defineDOMAIN_FAULT (0x0)
// 使用描述符中的设置进行权限检查
#defineDOMAIN_CHK (0x1)
// 不进行权限检查,允许任何访问
#define DOMAIN_NOTCHK (0x3)
// 在域0检查权限
#define DOMAIN0 (0x0<<5)
// 在域1检查权限
#define DOMAIN1 (0x1<<5)
// 域0属性为用描述符权限进行权限检查
#defineDOMAIN0_ATTR (DOMAIN_CHK<<0)
// 域1属性为不可访问
#defineDOMAIN1_ATTR (DOMAIN_FAULT<<2)
// 段描述符域0可读写,开cache 写缓存
#define RW_CB (AP_RW|DOMAIN0|CB|DESC_SEC)
#defineRW_CNB (AP_RW|DOMAIN0|CNB|DESC_SEC)
#defineRW_NCB (AP_RW|DOMAIN0|NCB|DESC_SEC)
#defineRW_NCNB (AP_RW|DOMAIN0|NCNB|DESC_SEC)
// 段描述符域1不可访问
#defineRW_FAULT (AP_RW|DOMAIN1|NCNB|DESC_SEC)
void MMU_EnableICache(void);// 使能ICache
voidMMU_DisableICache(void); // 禁止ICache
voidMMU_EnableDCache(void); // 使能DCache
voidMMU_DisableDCache(void); // 禁止DCache
voidMMU_EnableAlignFault(void); // 使能对齐检查
voidMMU_EnableMMU(void); // 使能MMU
voidMMU_DisableMMU(void); // 禁止MMU
voidMMU_SetTTBase(int Base); // Set TTBase
voidMMU_SetDomain(int Domain); // Set Domain
voidMMU_InvalidateICache(void); // 无效ICache
voidMMU_InvalidateDCache(void); // 无效DCache
voidMMU_InvalidateTLB(void); // 无效TLB
voidMMU_SetProcessId(unsigned int pid); // Process ID
voidMMU_Init(void); // MMU页表初始化
unsigned int*MMU_GetTableBase(void); // 获取MMU页表内存地址
voidMMU_SetMTT(unsigned int vaddrStart,unsigned int vaddrEnd,
unsigned int paddrStart,unsignedint attr);
#ifdef__cplusplus
}
#endif
#endif /*__MMU_H__*/
我们在MMU模块MMU.c中实现对段映射的MMU页表的设置初始化,对于“寄存器空间”,一般是1:1映射且段属性不能开Cache和写缓存,因为寄存器的值可能随时都发生变化,每次读写均应从寄存器处读写。MMU映射除了异常向量表由0x0地址映射到用户异常向量表地址处外,其它空间均1:1映射,对于“内存空间”,可以开Cache和写缓存。模块代码实现如下:
#include "MMU.h"
// MMU页表在编译器初始化代码之前调用,分配一个16k对齐16k大小MMU内存段,
// 这里让编译器分配这个全局内存块,一定不能让编译器初始化这部分内存
// 用__attribute__限制为未初始化段,不要让编译器初始化
__align(0x4000) static unsigned char MMU_PageTable[0x4000]
__attribute__((section("MMU_Mem"),zero_init));
unsigned int* MMU_GetTableBase(void)
{
return (unsigned int *)MMU_PageTable;
}
void MMU_Init(void)
{
// 引入用户代码运行基址,0x0处向量表重映射到用户代码向量表位置处
extern unsigned int __CodeAddr__;
MMU_DisableDCache(); // 禁用DCache
MMU_DisableICache(); // 禁用ICache
MMU_InvalidateDCache(); // 使16K DCache无效
MMU_InvalidateICache(); // 使16K ICache无效
MMU_EnableICache(); // 加快执行MMU_Init
MMU_DisableMMU(); // 禁用MMU
MMU_InvalidateTLB(); // 使无效转换表
//MMU_SetMTT(int vaddrStart,int vaddrEnd,intpaddrStart,int attr)
// 0处异常向量表映射到__CodeAddr__处,代码搬移时己复制用户向量表
// 0地址中断向量表重新映射到代码运行RAM基址,其余默认1:1映射
// 寄存器空间不能开启cache,写缓存,寄存器应为volatile变量
//steppingstone(Nand Boot)
MMU_SetMTT(0x00000000, 0x00000000,__CodeAddr__, RW_CB);
//SROM Bank0 Reserve
MMU_SetMTT(0x00100000, 0x07f00000,0x00100000, RW_NCNB);
//SROM Bank1 Reserve
MMU_SetMTT(0x08000000, 0x0ff00000,0x08000000, RW_NCNB);
//SROM Bank2 Reserve
MMU_SetMTT(0x10000000, 0x17f00000,0x10000000, RW_NCNB);
//SROM Bank3 Reserve
MMU_SetMTT(0x18000000, 0x1ff00000,0x18000000, RW_NCNB);
//SROM Bank4 Reserve
MMU_SetMTT(0x20000000, 0x27f00000,0x20000000, RW_NCNB);
//SROM Bank5 Reserve
MMU_SetMTT(0x28000000, 0x2ff00000,0x28000000, RW_NCNB);
//Bank6 DDR2 64M
MMU_SetMTT(0x30000000, 0x33f00000,0x30000000, RW_CB);
//SDRAM Bank6-2 Reserve
MMU_SetMTT(0x34000000, 0x37f00000,0x34000000, RW_NCNB);
//SDRAM Bank7 Reserve
MMU_SetMTT(0x38000000, 0x3ff00000,0x38000000, RW_NCNB);
// steppingstone(IROM boot)
MMU_SetMTT(0x40000000, 0x40000000,0x40000000, RW_NCNB);
// 特殊功能寄存器
MMU_SetMTT(0x40100000, 0x47f00000,0x40100000, RW_NCNB);//SFR
MMU_SetMTT(0x48000000, 0x5af00000,0x48000000, RW_NCNB);//SFR
MMU_SetMTT(0x5b000000, 0x5c000000,0x5b000000, RW_NCNB);//SFR
MMU_SetMTT(0x5c100000, 0xfff00000,0x5c100000, RW_FAULT);//not used
MMU_SetTTBase((int)MMU_PageTable); // 设置MMU的页表地址,16K对齐
//DOMAIN1: no_access,DOMAIN0,2~15=client(AP is checked)
MMU_SetDomain(0x55555550|DOMAIN1_ATTR|DOMAIN0_ATTR);//域访问权限
MMU_SetProcessId(0x0);
MMU_EnableAlignFault(); // 使能对齐检查
MMU_EnableMMU(); // 开启MMU后用的是虚拟地址
MMU_EnableICache(); // 开启ICache
MMU_EnableDCache(); // MMU开启后开启DCache
}
/* 使用段映射 */
voidMMU_SetMTT(unsigned int vaddrStart,unsigned int vaddrEnd,
unsigned intpaddrStart,unsigned int attr)
{
unsigned int *pTT;
unsigned int i, nSec;
pTT = (unsigned int *)MMU_PageTable +(vaddrStart>>20);
nSec = (vaddrEnd>>20) -(vaddrStart>>20);
for(i=0; i<=nSec; i++) {
*pTT++ = attr |(((paddrStart>>20)+i)<<20);
}
}
__asm voidMMU_DisableMMU(void)
{
mrc p15,0,r0,c1,c0,0
bic r0,r0,#R1_M
mcr p15,0,r0,c1,c0,0
bx lr
}
__asm voidMMU_EnableMMU(void)
{
mrc p15,0,r0,c1,c0,0
orr r0,r0,#R1_M
mcr p15,0,r0,c1,c0,0
bx lr
}
__asm voidMMU_DisableICache(void)
{
mrc p15,0,r0,c1,c0,0
bic r0,r0,#R1_I
mcr p15,0,r0,c1,c0,0
bx lr
}
__asm voidMMU_EnableICache(void)
{
mrc p15,0,r0,c1,c0,0
orr r0,r0,#R1_I
mcr p15,0,r0,c1,c0,0
bx lr
}
__asm voidMMU_DisableDCache(void)
{
mrc p15,0,r0,c1,c0,0
bic r0,r0,#R1_C
mcr p15,0,r0,c1,c0,0
bx lr
}
__asm voidMMU_EnableDCache(void)
{
mrc p15,0,r0,c1,c0,0
orr r0,r0,#R1_C
mcr p15,0,r0,c1,c0,0
bx lr
}
__asm voidMMU_InvalidateDCache(void)
{
mcr p15,0,r0,c7,c6,0
bx lr
}
__asm voidMMU_InvalidateICache(void)
{
mcr p15,0,r0,c7,c5,0
bx lr
}
__asm voidMMU_InvalidateTLB(void)
{
mcr p15,0,r0,c8,c7,0
bx lr
}
__asm voidMMU_SetTTBase(int Base)
{
mcr p15,0,r0,c2,c0,0
bx lr
}
__asm voidMMU_SetDomain(int Domain)
{
mcr p15,0,r0,c3,c0,0
bx lr
}
__asm voidMMU_SetProcessId(unsigned int Pid)
{
mcr p15,0,r0,c13,c0,0
bx lr
}
__asm voidMMU_EnableAlignFault(void)
{
mrc p15,0,r0,c1,c0,0
orr r0,r0,#R1_A
mcr p15,0,r0,c1,c0,0
bx lr
}
4. 链接文件
MMU表是在进入C入口前初始化好的,由启动文件调用,因此放在最前面的8K代码空间 (启动时cpu会自动把用户最前面8k代码读取到steppingstone中。 8KB=8*1024B=8192B=0x2000B)。
链接文件内容如下:
; *************************************************************
; ***Scatter-Loading Description File generated by uVision ***
;*************************************************************
LR_IROM10x30000000 { ; load region size_region
;启动代码8k在steppingstone中执行,启动代码相关的代码必须链接在8k范围
;内,并且是与地址无关的,可链接到任意地址
;SDRAM的BANK0起始地址为0x3000 0000,前8KB就是0x2000(B)
ER_ROM0 0x30000000 0x2000 { ; load address = execution address
s3c2416.o (RESET, +First)
LowLevelInit.o
NAND.o
MMU.o
}
ER_ROM1 +0 0x2000000-0x2000 {
*(InRoot$$Sections)
.ANY(+RO)
}
;64MB=67,108,864=0x0400 0000(B)
;16KB=16384=0x4000(B)
; RAM的最后16k分配给MMU页表
RW_RAM 0x32000000 0x2000000-0x4000 { ; RWdata
.ANY (+RW +ZI)
}
;MMU页表在编译器初始化代码之前调用分配初始化,不应再让编译器初始化
RW_MMU +0 UNINIT { ; ZI data does not get initializedto zero
.ANY (MMU_Mem)
}
}
5. 附录
MMU.h / MMU.c,MMU模块接口头文件以及MMU页表初始化实现。
源码下载: http://pan.baidu.com/s/1c09YSUG