发 帖  
原厂入驻New

[经验] 怎样写出高效的嵌入式C程序

2020-4-3 17:11:05  2379 嵌入式
分享
1
怎样写出高效的嵌入式C程序
编写高效简洁的c语言代码,是许多软件工程师追求的目标。本文就工作中的一些体会和经验做相关的阐述,不对的地方请各位指教。
file:///C:\Users\Administrator.WIN-STED6B9V5UI\AppData\Local\Temp\ksohtml16320\wps1.jpg
1 招:以空间换时间
file:///C:\Users\Administrator.WIN-STED6B9V5UI\AppData\Local\Temp\ksohtml16320\wps2.png
计算机程序中最大的矛盾是空间和时间的矛盾,那么从这个角度出发逆向思维来考虑程序的效率问题,我们就有了解决问题的第1--以空间换时间。
file:///C:\Users\Administrator.WIN-STED6B9V5UI\AppData\Local\Temp\ksohtml16320\wps3.png
例如:字符串的赋值。
从上面的例子可以看出,AB的效率是不能比的。在同样的存储空间下,B直接使用指针就可以操作了,而 A 需要调用两个字符函数才能完成。B的缺点在于灵活性没有 A好。在需要频繁更改一个字符串内容的时候,A 具有更好的灵活性;如果采用方法 B,则需要预存许多字符串,虽然占用了大量的内存,但是获得了程序执行的高效率。
如果系统的实时性要求很高,内存还有一些,那我推荐你使用该招数。该招数的边招--使用宏函数而不是函数。举例如下:
   
file:///C:\Users\Administrator.WIN-STED6B9V5UI\AppData\Local\Temp\ksohtml16320\wps4.png
函数和宏函数的区别就在于,宏函数占用了大量的空间,而函数占用了时间。大家要知道的是,函数调用是要使用系统的栈来保存数据的,如果编译器里有栈检查选项,一般在函数的头会嵌入一些汇编语句对当前栈进行检查;同时,CPU也要在函数调用时保存和恢复当前的现场,进行压栈和弹栈操作,所以,函数调用需要一些CPU时间。而宏函数不存在这个问题。宏函数仅仅作为预先写好的代码嵌入到当前程序,不会产生函数调用,所以仅仅是占用了空间,在频繁调用同一个宏函数的时候,该现象尤其突出。
D方法是我看到的最好的置位操作函数,是 ARM 公司源码的一部分,在短短的三行内实现了很多功能,几乎涵盖了所有的位操作功能。C方法是其变体,其中滋味还需大家仔细体会。
file:///C:\Users\Administrator.WIN-STED6B9V5UI\AppData\Local\Temp\ksohtml16320\wps5.jpg
2 招:数学方法解决问题
file:///C:\Users\Administrator.WIN-STED6B9V5UI\AppData\Local\Temp\ksohtml16320\wps6.png
现在我们演绎高效C 语言编写的第二招--采用数学方法来解决问题。数学是计算机之母,没有数学的依据和基础,就没有计算机的发展,所以在编写程序的时候,采用一些数学方法会对程序的执行效率有数量级的提高。
举例如下,求 1100 的和。
   
file:///C:\Users\Administrator.WIN-STED6B9V5UI\AppData\Local\Temp\ksohtml16320\wps7.png
这个例子是我印象最深的一个数学用例,是我的计算机启蒙老师考我的。当时我只有小学三年级,可惜我当时不知道用公式 Nx(N+1)/2来解决这个问题。方法E 循环了 100次才解决问题,也就是说最少用了 100个赋值、100个判断、200个加法(Ij);而方法F仅仅用了 1 个加法、1个乘法、1 次除法。效果自然不言而喻。所以,现在我在编程序的时候,更多的是动脑筋找规律,最大限度地发挥数学的威力来提高程序运行的效率。
file:///C:\Users\Administrator.WIN-STED6B9V5UI\AppData\Local\Temp\ksohtml16320\wps8.png
3 招:使用位操作
file:///C:\Users\Administrator.WIN-STED6B9V5UI\AppData\Local\Temp\ksohtml16320\wps9.png
实现高效的C 语言编写的第三招--使用位操作,减少除法和取模的运算。在计算机程序中,数据的位是可以操作的最小数据单位,理论上可以用位运算来完成所有的运算和操作。一般的位操作是用来控制硬件的,或者做数据变换使用,但是,灵活的位操作可以有效地提高程序运行的效率。举例台如下:
file:///C:\Users\Administrator.WIN-STED6B9V5UI\AppData\Local\Temp\ksohtml16320\wps10.png
在字面上好象 HG麻烦了好多,但是,仔细查看产生的汇编代码就会明白,方法 G调用了基本的取模函数和除法函数,既有函数调用,还有很多汇编代码和寄存器参与运算;而方法H则仅仅是几句相关的汇编,代码更简洁、效率更高。当然,由于编译器的不同,可能效率的差距不大,但是,以我目前遇到的MS C,ARM C来看,效率的差距还是不小。相关汇编代码就不在这里列举了。运用这招需要注意的是,因为 CPU 的不同而产生的问题。比如说,在 PC 上用这招编写的程序,并在 PC 上调试通过,在移植到一个 16位机平台上的时候,可能会产生代码隐患。所以只有在一定技术进阶的基础下才可以使用这招。
file:///C:\Users\Administrator.WIN-STED6B9V5UI\AppData\Local\Temp\ksohtml16320\wps11.jpg
4 招:必杀技——嵌入汇编
file:///C:\Users\Administrator.WIN-STED6B9V5UI\AppData\Local\Temp\ksohtml16320\wps12.png
在熟悉汇编语言的人眼里,C语言编写的程序都是垃圾。这种说法虽然偏激了一些,但是却有它的道理。汇编语言是效率最高的计算机语言,但是,不可能靠着它来写一个操作系统吧?所以,为了获得程序的高效率,我们只好采用变通的方法--嵌入汇编、混合编程。
   
举例如下,将数组一赋值给数组二,要求每一个字节都相符。char string1[1024], string2[1024];
file:///C:\Users\Administrator.WIN-STED6B9V5UI\AppData\Local\Temp\ksohtml16320\wps13.png
file:///C:\Users\Administrator.WIN-STED6B9V5UI\AppData\Local\Temp\ksohtml16320\wps14.png
方法 I是最常见的方法,使用了 1024次循环;方法J则根据平台不同做了区分,在 ARM 平台下,用嵌入汇编仅用 128次循环就完成了同样的操作。这里有朋友会说,为什么不用标准的内存拷贝函数呢?这是因为在源数据里可能含有数据为0 的字节,这样的话,标准库函数会提前结束而不会完成我们要求的操作。这个例程典型应用于 LCD数据的拷贝过程根据不同的 CPU,熟练使用相应的嵌入汇编,可以大大提高程序执行的效率。
虽然是必杀技,但是如果轻易使用会付出惨重的代价。这是因为,使用了嵌入汇编,便限制了程序的可移植性,使程序在不同平台移植的过程中,卧虎藏龙、险象环生!同时该招数也与现代软件工程的思想相违背,只有在迫不得已的情况下才可以采用,切记。
这么说教太枯燥了,更多内容欢迎q一起讨论3250395686我们来看一个例子。以一个LED 闪烁的程序为例。
include<reg52.h>//包含头文件sbit led=P2^0;//定义位变量led,使其关联单片机管脚P2.0void Delayms(unsigned int t);//定义延时函数int main(void)//主函数(C 语言程序入口函数){while(1){led=0;//P2.0 拉低,点亮LEDDelayms(500);//调用延时函数,延时500 毫秒led=1;//P2.0 拉高,熄灭LEDDelayms(500);//调用延时函数,延时500 毫秒}return 0;}void Delayms(unsigned int t)//延时函数{unsigned int i,j;for(i=0;i<t;i++)for(j=0;j<120;j++);//大约延时1 毫秒}
这是指示灯LED 闪烁的C 源码,这个源码在Keil UVision4 生成的程序代码是67 个字节。下面就采用几个方法来提高这个程序的效率。
1、尽量定义局部变量
单片机程序的全局变量一般是放在通用数据存储器RAM)中,而局部变量一般是放在特殊功能寄存器当中。处理寄存器数据的速度比处理RAM 数据要快,如果在一个局部函数里调用一个全局变量将会多生成好几个代码出来。所以,少定义全局变量,多定义局部变量。如上例中,如果把延时函数里的i j 定义为全局变量,编译后程序代码会增加到79 个字节,多了12 个字节。
2、省略函数定义
在一个单片机程序里我们习惯在main 函数的前面先定义被调用函数,然后在mian 函数的下面再实现被调用函数。这样的写法固然是一个好习惯,但每定义一个函数会增加几个代码,而且函数形参数据类型越大、形参越多增加的代码就越多,显然这不是什么好事。如果不定义编译器又报错,怎么办?C 编译器的编译顺序是从上往下编译,只要被调用的函数在主调函数调用之前实现就没有问题了。所以,笔者的习惯写法是不用定义函数,但要按先后顺序(被调用函数一定要在主调函数之前写好)来写函数实现,到最后再写main 函数。这样做编译器不但不会报错,而且代码得到精简了。如上例中,把延时函数的定义删除了,然后把延时函数的实现搬到main 函数的上面,编译后程序代码减少到63 个字节,减少了4 个字节。
3、省略函数形参
函数带形参,是为了在函数调用时传递实参,不但可以避免重复代码出现,还可以通过传递不同的实参值多次调用函数且实现不同的函数功能,总体代码也会得到精简。在实际编程的时候,我们只要注意,还可以进一步精简代码。对于不是多次调用或者多次调用但实参值不变的函数我们可以省略函数形参。如上例中的延时函数,我们把它改成不带形参的函数:
void Delayms()//延时函数{unsigned int i,j;for(i=0;i<500;i++)for(j=0;j<120;j++);//大约延时1 毫秒}
编译后,程序代码变成了56 个字节,精简了11 个字节。
4、改换运算符
也许您可能没有注意到C 运算符的运用也会影响程序代码的数量。如上例中,把延时函数里的自加运算符改成自减运算符后,如:
void Delayms(unsigned int t)//延时函数{unsigned int i,j;for(i=t;i>0;i--)for(j=120;j>0;j--);//#p#分页标题#e#大约延时1 毫秒}
编译后,程序代码变成了65 个字节,精简了2 个字节。
通过改换运算符能达到精简代码的例子还有:
⑵ ⑷把求余运算表达式改为位与运算表达式。如:b=a%8 可以改为:b=a&7
把乘法运算表达式改为左移运算表达式。如:b=a*8 可以改为:b=a<<3
⑶  把除法运算表达式改为右移运算表达式。如:b=a/8 可以改为:b=a>>3
5、选择合适的数据类型
C 语言里选择变量的数据类型很讲究,变量的数据类型过小满足不了程序的要求,变量的数据类型过大会占用太多的RAM 资源。您可能还没有注意到数据类型定义也影响程序代码的大小,而且这个影响还不小。如上例中,延时函数里的局部变量j 定义的数据类型明显偏大,如果把它由unsigned int 改成unsigned char 。编译后,程序代码变成了59 个字节,精简了8 个字节。
6、直接嵌入代码
在您的程序里如果某个函数只调用一次,而您又要求代码提高执行速度,建议您不要采用调用函数的形式,而应该将该函数里的代码直接嵌入主调函数里,代码执行效率会大大提高。
7、使用效率高的C 语句
C 语言里有一个三目运算符,俗称问号表达式。很多程序员都很喜欢使用,因为它逻辑清晰表达简洁。
看这个问号表达式:c=(a>b) ? a+1 : b+1;实际上等效于以下的IF…else 结构:
if (a>b) c=a+1;else c=b+1;
可以看到,使用问号表达式,语句相当简洁,但它的执行效率却很低,远没有if…else 语句效率高。所以,当您的程序要求提高执行速度的话,建议您不要使用问号表达式了。
另外,do…while 语句也比while 语句的效率高。
代码的效率问题,不是我们编程中的主要问题,除了程序要求较高的执行速度或者单片机的ROM RAM 不够用的时候才会考虑。一般情况下,我们不用在乎。如果您一味追求高效率的代码,可能会影响代码的可读性和可维护性。

评论

高级模式
您需要登录后才可以回帖 登录 | 注册

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容图片侵权或者其他问题,请联系本站作侵删。 侵权投诉
发经验
关闭

站长推荐 上一条 /7 下一条

快速回复 返回顶部 返回列表