walnutcy

ARM程序由于字节对齐引起的问题深入分析 (转)

0
阅读(2078)

原文地址:http://blog.ednchina.com/cllzs/49740/message.aspx

首先说说,什么叫对齐。如果一个数据是从偶地址开始的连续存储,那么它就是半字对齐,否则就是非半字对齐;半字对齐的特征是bit0=0,其他位为任意值。字对齐的特征是bit1=0,bit0=0,其他位为任意值。如果一个数据是以能被4整除的地址开始的连续存储,那么它就是字对齐,否则就是非字对齐。举例说明四字节对齐:对内存进行操作时,被访问的地址必须为4的倍数。如果分配到的地址的地址不是4的倍数时,CPU实际访问的地址还是按照字对齐的方式来操作。也就是自动屏蔽bit1和bit0.

用ADS的ARMCComplier下OptimizationLevel可能引起问题,其中的一个问题就是字节对齐的问题。下面讲讲问题的现象及实质

当时问题的现象是:程序使用一公共变量Buf创建队列,如果ADS编译优化选项采用Minium则软件工作正常;源码不变,如果采用ALL优化,则不正常,数据紊乱且无法工作。为了发现问题,我们分别用Minium和ALL编译,在反汇编条件下单步跟踪程序,观察CPU寄存器和内存变量的变化情况。发现在Minium模式下,编译器把队列内存块Uart0TxBuf分配到的地址是0x400015cc,这个地址是一个4字节对齐的地址,而在ALL模式下,编译器把Buf分配的地址是0x400015c2,这个地址是一个非4字节对齐的地址。正是由于这个非4字节对齐的地址导致了问题的发生。

问题发生在QueueCreate(void*Buf,uint32SizeOfBuf,uint8(*ReadEmpty)(),uint8(*WriteFull)())这个函数里,问题是如何发生的,

在了解问题发生的机理前,先了解QueueCreate这个函数的工作原理。QueueCreate工作原理是,首先把buf指向的内存初始化为DataQueue格式的结构体。DataQueue的结构体格式如下:

typedefstruct{
QUEUE_DATA_TYPE*Out;/*指向数据输出位置*/
QUEUE_DATA_TYPE*In;/*指向数据输入位置*/
QUEUE_DATA_TYPE*End;/*指向Buf的结束位置*/
uint16NData;/*队列中数据个数*/
uint16MaxData;/*队列中允许存储的数据个数*/

uint8(*ReadEmpty)();/*读空处理函数*/
uint8(*WriteFull)();/*写满处理函数*/
QUEUE_DATA_TYPE*Buf;/*存储数据的空间*/
}DataQueue;

从结构体可以看出,结构体字节类型在内存分配为:4字节指针变量(*Out)、4字节指针变量(*In)、4字节指针变量(*End)、2字节变量NData、2字节变量MaxData、4字节函数指针变量ReadEmpty()、4字节函数指针变量(WriteFull())
观察结构体起始地址放在非对齐时会出现什么情况。

起始地址为0x400015c2时的由编译器分配得到的地址实际操作地址
*Out0x400015c2~0x400015c50x40015c0~0x400015c3
*In0x400014c6~0x400015c9x400014c4~0x400015c7
*End0x400015ca~0x400015cd0x400015c8~0x400015cb

从表中可以看出,实际操作的地址按照4字节对齐格式得到。例如,当执行*Out进行操作时,自动屏蔽bit1和bit0,因此实际发生变化的是0x40015c0~0x400015c3,而不是0x400015c2~0x400015c5,由于实际操作地址和编译器分配地址互相覆盖,当对*In操作时,会导致*Out一起变化,对*End操作时,*In也跟着变化。正是由于非对齐的原因导致创建队列和对列操作完全错误。

当内存起始地址为4字节对齐地址的情况时,编译器分配地址和实际地址一致,因此不存在上述问题。

结论:

在ARM嵌入式系统中,当把一个内存区域初始化为某个结构体时,必须注意字节对齐的情况。如果该内存起始地址为非对齐地址,不仅得不到预期的结果,还可能导致一些很奇怪的让人无法理解表面问题。在C层面上不太容易观察到这些问题的实质,只有深入到汇编一层去分析程序,才可能理解这些现象的深层原因。

Baidu
map