网上找到了一篇文章关于高效c代码的编写,在这里贴出来,供大家参考吧。可能大家使用的平台不同,但是总体来说还是有借鉴意义的。
* 编程经验—随着程序员编程经验的增长,优化代码的技术也会相应提高。
* 对指令集映射的理解—
单片机的内核不同其架构和特性也不相同。必须清楚C语言和汇编语句之间的映射关系,即这句C语句生成了哪几句汇编语句。
* 对编译器/连接器特性的了解—单片机不同其编译器也不同,即使是同一内核的单片机,不同编译器的代码效率和优化方法也是不同的。
* 清楚地认识系统—除了要了解与系统成本相关的内存,也要了解系统中其他重要的部分,比如对系统运行时间和运行速度的控制、哪些存储资源有限(RAM、ROM/Flash 和堆栈等) 以及系统的可读性等等。
从减少ROM、RAM和堆栈空间的消耗以及提高系统执行速度的角度来说,优化代码的方法有许多种。这里不可能给出所有的方法,只是将一些能显著提高代码效率的方法罗列出来。
变量的定义
要写出好的程序,变量起了很重要的作用,因为大部分的代码都是和数据有关的操作。即使是在以硬件控制为主的系统中,变量也起了很大的作用,MCU的大部分工作是在把外部硬件(如传感器,按钮等)的数值读进来,进行运算处理(和存储)之后输出相应的结果,用以驱动外围硬件。在使用变量的时候,以下几点需要注意:
(1)变量的大小
不同架构的MCU中,数据类型的长度是不同的,这对于代码效率有很大的影响。在8位机中,例如HC(S)08系列单片机,8bit数据的执行效率是最高的,因为大部分的指令都以字节为运算单位。在台式机环境下,我们通常用int(整型)作为数据类型,但是int数据的长度在不同的机器和编译器中是不同的。所以,要得到高效的C语言程序,我们应该使用类型定义(typedef)的方式规定各种数据类型的长度,尽可能的采用8位数据长度。例如,用uint8_t表示一个无符号8位整型数据(一个字节),用uint16_t表示一个无符号16位整型数据。在运算表达式中,采用类型转换方式把表达式结果值的数据长度缩减到最低所需。表1给出了零页地址内不同数据长度的两个变量相加得到不同数据长度结果所需代码的多少。从中我们可以看出,数据类型长度的选择对于代码效率的影响是很大的。
(2)无符号数和定点数
除了数据长度,数据是否是有符号数也会影响代码效率。比如两个8位长度的有符号数相加,得到一个16位长度的有符号数,这需要31个字节的代码,有符号数与无符号数进行比较运算所需的代码也比两个都是无符号数运算所需的代码要多。对于运算复杂、精度要求较高的场合,常常需要用到浮点运算。如果控制器硬件上带有浮点运算单元的话,执行起来效率会比较高。但是,大多数8位MCU只支持整数运算。对于浮点运算,既要得到精确的计算结果又不降低代码效率的话,我们可以先把数据按比例放大,运算结束后再按相同比例缩小。例如,要进行十进制小数的运算,可以用101表示10.1,待运算结束后,再用除法得到我们所需的浮点值。因为HC(S)08系列单片机的乘除运算效率很高,把浮点数转成定点数运算,能提高代码效率。此外,还可以用移位的方法来替代乘除运算,Codewarrior支持用移位来替代2的倍数的乘除运算。当然,是否采用移位方式由程序员自己决定。当然,在这个过程中需要考虑是否有溢出、取整是否合理等问题,否则不但可能得到错误的结果,还有可能需要大的数据长度(比如32位的数据)来存储中间值,反而降低了代码效率。
(3)全局变量、静态变量和局部变量
在嵌入式系统中,全局变量的使用可以有效地提高代码效率。全局变量一般会有一个固定的存储位置,如果把它放在零页地址中,代码效率将大大提高。给零页地址中的全局变量赋值可以采用MOV指令,只有3个字节的代码。而给非零页地址中的全局变量赋值就需要用LDA和STA指令,这需要5个字节的代码。如果用局部变量,因为它是存放在堆栈中的,所以在某些情况下需要用到H:X寄存器,而把堆栈指针放到H:X寄存器中去需要4到6个字节的代码(如果堆栈是在零页地址内)。在全局资源有限的情况下,使用局部变量反而代码效率更高。这里的建议是把那些要频繁使用的或者有位操作的变量定义为全局变量放置在零页地址内,这样能极大的提高代码效率。使用静态变量也是一种非常有用的方法,可以在把变量存储在全局地址范围的同时保持代码的可移植性和再使用性。但是,用来存放静态变量的RAM空间不能释放出来给其他子程序使用。
静态函数
把函数定义成静态函数对于提高代码效率是很有必要的。因为模块内的静态函数只能被模块中的函数所调用,不能被模块以外的函数调用。因此,编译器会有意识的把静态函数放置在靠近其调用者的地方,这样就可以用代码少且执行速度快的指令去访问静态函数。比如用BSR(短调用指令)而不是JSR(长调用指令)。BSR是双字节指令,花费4个总线周期;JSR指令一般占用1~3个字节(跳转到H:X寄存器所指的地址占用一字节,但把地址移入H:X寄存器需要几个字节的代码)和4~6个总线周期。
数组和指针
当需要访问一系列数据的时候,在C语言中通常使用数组或者指针的方式。用固定序号的访问方式(如Array[0])生成的代码最少,执行速度也比递增索引方式(如Array[i++])快。在有些应用场合,数组指针(*(Array++))比数组具有更好的灵活性,因为它可以间接的存取数据。但是,采用数组指针的话会占用较多的ROM(额外的代码用于指针的初始化和使用过程中)和RAM(可能需要其他指针指向数组)。数组和指针除了用于数据的存取也可用于对函数的访问。在嵌入式系统中,不同情况下经常需要调用不同的函数。例如,在通讯中要根据不同的输入数据给出相对应的处理和应答。在C中一般有三种方式来处理这类情形:嵌套if语句、"Switch-case"语句、函数指针。下面是这三种方法的例子,根据状态寄存器中不同的状态值调用相应的响应函数。
i) 嵌套的if语句:
if (STATUS = = A) React_A();
else if (STATUS = = B) React_B();
else if ....
ii) switch-case语句:
switch (STATUS)
case (A): React_A(); break;
case (B): React_B(); break;
...
iii) 函数指针: (假定状态A, B, ... 是顺序编号的值,或是枚举类型值)
void React_Func[] = {React_A, React_B, ...};
...
React_Func[STATUS]();
具体采用哪种方式,依据反复次数而定。表2给出了不同方法对ROM和RAM空间的占用情况。从中可看出“switch”方式的可读性最强,但在反复次数少(函数个数少)的情况下,占用的空间最大。
“if”方式的可读性较好,占用的空间也比较小。而“pointer”方式占用ROM的空间相对变化不大,但占用许多RAM空间。
存储模式和零页的使用
不同的MCU有不同的存储模式。在CodeWarrior for HC(S)08 (V3.1)中,建立工程的时候有small和
tiny两种模式可供选择:SMALL模式,如果没有特殊的说明,所有的指针和函数地址都被假定为16位的地址,此模式中代码和数据都被存储在64k的地址空间内;TINY 模式,所有的数据包括堆栈都分配在零页地址空间内,如果没用关键字_far作特殊说明,所有数据指针都被假定为8位地址,但是代码的地址空间仍然是64k,函数指针也仍是16位的长度。
前面讨论中说过,变量放在零页地址内生成的代码较少,而且能有效的支持位运算。在HC(S)08系列单片机中,外围寄存器一般占用$00-$3F的地址空间,所以留给RAM的零页地址空间是有限的。为了缩减生成的代码,就要把频繁使用的变量放在零页内。要根据子程序、函数参数和局部变量使用的情况,确定堆栈的使用频率,如果频率高就把堆栈放置在零页地址内。减少生成的代码,我们也要减少子程序中的参数(因为要用到A和HX寄存器),把经常使用的临时变量定义成全局变量放在零页地址中。当然,全局变量是共享的,所以用的时候我们要格外小心。下面的例程中,在Calc()函数中,可以改变全局变量gTemp2和gTemp3的值,但不能改变变量gTemp1的值,因为一开始就对子程序进行了这个设定。通常,好的变量名可以帮我们清楚的区分变量的作用范围。比如分别以1、2、3结尾的变量,可以设定等级1的子程序只能用1结尾的变量,等级2的子程序只能用2、3结尾的变量。
uint8_t gTemp1, gTemp2, gTemp3; // 存放临时数据的全局变量,所有函数都可以访问
void_t Calc( uint8_t in) {
gTemp3 = 0 ;
for (gTemp2 = 5 ; gTemp2 !=0 ; gTemp2--) gTemp3 += ADCR * t_in;
}
void main( ) {
...
for (gTemp1 = 0; gTemp1 < 3; gTemp1++)
Calc(array[gTemp1]) ;
...
}
初始化的优化
在CodeWarrior中,每个工程都有一个模板,Start-up启动函数已经预先写好,我们可以在建工程的时候选择是否采用ANSI标准初始化程序。通常,标准初始化程序的代码效率并不高(可以参看start08.c文件中的源程序)。为了减少生成的代码,我们应该采用非ANSI标准的初始化程序,由用户自行编写。比如,仅做堆栈指针初始化、RAM清空和跳转到main函数三项工作,用如下汇编代码实现。
asm {
clra ; 得到清零数据
ldhx #MAP_RAM_last ; 指向RAM的尾部
stx MAP_RAM_first ; 使得RAM起始地址内的数值非零
txs ; 初始化堆栈指针
ClearRAM:
psha ; 清空当前RAM地址
tst MAP_RAM_first ; 检测是否完成RAM的清空
bne ClearRAM ; 没有完成就继续
txs ; 初始化堆栈指针
jmp main ; 跳转到main()函数
}
除了这些通用的起始程序,还需要对硬件和变量进行初始化。尽管寄存器都有默认值,但仍要培养用软件对硬件初始化的好习惯。对于变量,最好初始值为零,因为清空RAM代码已经完成了这个工作。为了防止代码臃肿,建议把相同初始值的变量归为一组,这样可以用循环的方式对它们进行初始化。在优化代码的时候,要特别注意那些可变型volatile变量(比如寄存器),因为编译器是不会对这些变量进行优化的。
结语
本文简述了一些优化代码的方法,包括变量的选择、使用静态类型、数组和指针的挑选、如何使用存储模式和如何进行初始化等。但是,这仅是所有方法的一部分。一个高效的C语言程序,不仅要代码少、执行速度快,而且要清楚、简洁、准确和易注释。此外,程序要有一个好的架构,便于移植和维护。代码的再使用性(reuse)也是一个关键因素,这不在于代码本身,而在于它能减少开发调试时间。所以说,高效的C语言程序是各种因素的综合体,需要我们全面考量。
5