2013年5月2日星期四

[转] bzero & memset 置零的性能比较

原始链接不详,请见谅.

关于字符数组的初始化,在项目的压力测试中,发现性能明显下降,变怀疑在程序中的若干临时字符数组的初始化(使用bzero)身上。于是修改为首个字符置零的方式而非全部置零的方式初始化,响应得到明显的提升。原来在mp3检索的每一条结果都要进行bzero对临时数组初始化,每一个请求需要30次的bzero对临时数组的置零。于是想到了,在非必要的情况下,只对临时数组的第一个(或前几个)字符置零的初始化方式对比与使用bzero的话,能够明显提高性能。

在此之外,又想起另外两种对数组所有字节都置零的方式,顺便比较一下他们之间的性能,写个简单的程序如下:

#include
#include
#include

#define TIMEDIFF(s, e) (((e.tv_sec)-(s.tv_sec))*1000000 + (e.tv_usec) - (s.tv_usec))

int main()
{
    struct timeval s, e;
    char a[1024], b[1024*1024], c[1024*1024*4];

    gettimeofday(&s, NULL);
    bzero(a, sizeof(a));
    gettimeofday(&e, NULL);
    printf("bzero 1k: %d\n", TIMEDIFF(s, e));

    gettimeofday(&s, NULL);
    bzero(b, sizeof(b));
    gettimeofday(&e, NULL);
    printf("bzero 1m: %d\n", TIMEDIFF(s, e));

    gettimeofday(&s, NULL);
    bzero(c, sizeof(c));
    gettimeofday(&e, NULL);
    printf("bzero 4M: %d\n", TIMEDIFF(s, e));

    gettimeofday(&s, NULL);
    memset(a, 0, sizeof(a));
    gettimeofday(&e, NULL);
    printf("memset 1k: %d\n", TIMEDIFF(s, e));

    gettimeofday(&s, NULL);
    memset(b, 0, sizeof(b));
    gettimeofday(&e, NULL);
    printf("memset 1M: %d\n", TIMEDIFF(s, e));

    gettimeofday(&s, NULL);
    memset(c, 0, sizeof(c));
    gettimeofday(&e, NULL);
    printf("memset 4M: %d\n", TIMEDIFF(s, e));

    gettimeofday(&s, NULL);
    for(int i=0; i        a[i]=0;
    gettimeofday(&e, NULL);
    printf("for 1k: %d\n", TIMEDIFF(s, e));

    gettimeofday(&s, NULL);
    for(int i=0; i        b[i]=0;
    gettimeofday(&e, NULL);
    printf("for 1M: %d\n", TIMEDIFF(s, e));

    gettimeofday(&s, NULL);
    memset(c, 0, sizeof(c));
    gettimeofday(&e, NULL);
    printf("memset 4M: %d\n", TIMEDIFF(s, e));

    gettimeofday(&s, NULL);
    for(int i=0; i        a[i]=0;
    gettimeofday(&e, NULL);
    printf("for 1k: %d\n", TIMEDIFF(s, e));

    gettimeofday(&s, NULL);
    for(int i=0; i        b[i]=0;
    gettimeofday(&e, NULL);
    printf("for 1M: %d\n", TIMEDIFF(s, e));

    gettimeofday(&s, NULL);
    for(int i=0; i        c[i]=0;
    gettimeofday(&e, NULL);
    printf("for 4M: %d\n", TIMEDIFF(s, e));
}

运行的结果基本上是,在数组较小的情况下,bzero的效率比memset高;当数组超过一定大小之后,bzero的效率开始比memset低;数组越大,memset的性能优势越明显。而在数组较小的情况下,memset的性能甚至不如直接for循环对数组中的每一个字节置零的方法。

以下的运行结果的数值单位是微秒(gettimeofday的默认单位)。

第一次运行:
bzero 1k: 6
bzero 1m: 2168
bzero 4M: 9136
memset 1k: 11
memset 1M: 1303
memset 4M: 5483
for 1k: 12
for 1M: 4934
for 4M: 21313

再一次运行:
bzero 1k: 6
bzero 1m: 2160
bzero 4M: 9067
memset 1k: 17
memset 1M: 1257
memset 4M: 5115
for 1k: 11
for 1M: 4866
for 4M: 19201

此后,又写了个小程序,测试在堆上的数组中,bzero和memset的效率,发现两者差不多。可能由于,里面原来的数据就比较有规则,不管是否先对数组置一随机值。(malloc开辟字符数组空间时,会清零的。)

#include
#include
#include
#include
#include

没有评论: