【摘要】 实现memcpy函数
首先是函数接口的实现:
void mymemcpy(void* dst, const void* src, size_t num)
1
这里使用了void*作为指针类型,接口更加通用;另一方面src地址使用const,保证src的值不会被改变。
1. 瑕疵版本:
void mymemcpy(void* dst, const void* s…
实现memcpy函数
首先是函数接口的实现:
void mymemcpy(void* dst, const void* src, size_t num)
这里使用了void*作为指针类型,接口更加通用;另一方面src地址使用const,保证src的值不会被改变。
1. 瑕疵版本:
void mymemcpy(void* dst, const void* src, size_t num) { assert((dst != nullptr) && (src != nullptr)); const char* psrc = (const char*)src;//因为void*是无法完成‘++’或'--'的 char* pdst = (char*)dst; while (num--) { *pdst++ = *psrc++; }
}
上面的代码实现基本实现了函数,但是并没有考虑到内存重叠的问题。
当src和dst内存如下图不重叠时,这一代码我们从前向后拷贝是没有问题的。
我们再看一下,内存重叠的情况,如下图dst在src内存的前面,但有内存重叠,这种情况下,我们从前向后拷贝,其实也没问题。但是重叠的部分可以有两种实现方式:1. 复制后的dst将src重叠的部分直接覆盖掉;2. 判断到这种情况的时候报错。具体怎么写的话,如果是面试,可以和面试官沟通一下。
瑕疵版本的代码的处理就是直接覆盖,判断这种情况进行报错的话可以加一句判断:assert(pdst < (const char*)src);
完整代码可以是:
void mymemcpy(void* dst, const void* src, size_t num) { assert((dst != nullptr) && (src != nullptr)); const char* psrc = (const char*)src;//因为void*是无法完成‘++’或'--'的 char* pdst = (char*)dst; while (num--) { *pdst++ = *psrc++; assert(pdst < (const char*)src);//代码重叠,报错 }
}
下面我们再看一种代码重叠的情况,如下图,src在dst前面,二者有内存重叠。这个时候我们从前向后拷贝就有问题了。
这种情况下,我们可以从后向前拷贝。
代码上我们可以分情况讨论,出现情况3,我们从后向前拷贝,否则我们从前向后拷贝。
2. 完善版本
代码可以如下:
void mymemcpy(void* dst, const void* src, size_t num) { assert((dst != nullptr) && (src != nullptr)); const char* psrc = (const char*)src;//因为void*是无法完成‘++’或'--'的 char* pdst = (char*)dst; if (pdst > psrc && pdst < psrc + num) { for (size_t i = num - 1; i >= 0 && i < num; --i) { pdst[i] = psrc[i]; } } else { for (size_t i = 0; i < num; ++i) { pdst[i] = psrc[i]; } }
}
如何进行优化?
上面的代码是一个字节一个字节去拷贝,实际上可以多个字节进行拷贝,这样能有一个常数倍的优化,如果每次4个字节拷贝,会比原先快4倍。
下面代码进行4个字节一次拷贝,其实在32位机器中,CPU处理时应该也是一个字(4个字节)一个字进行处理的。
代码如下:
void mymemcpy(void* dst, const void* src, size_t num) { assert((dst != nullptr) && (src != nullptr)); int wordnum = num / 4; int slice = num % 4; const int* pintsrc = (const int*)src; const char* pcharsrc = (const char*)src; int* pintdst = (int*)dst; char* pchardst = (char*)dst; if (pchardst > pcharsrc && pchardst < pcharsrc + num) { for (size_t i = num - 1; i >= 4 * wordnum; --i) { pchardst[i] = pcharsrc[i]; } for (size_t i = wordnum - 1; i >= 0 && i < wordnum; --i) { pintdst[i] = pintsrc[i]; } } else { for (size_t i = 0; i < wordnum; ++i) { pintdst[i] = pintsrc[i];//4字节拷贝 } for (size_t i = 4 * wordnum; i < num; ++i) { pchardst[i] = pcharsrc[i];//1字节拷贝 } }
}
文章来源: blog.csdn.net,作者:月光刺客是小丑,版权归原作者所有,如需转载,请联系作者。
原文链接:blog.csdn.net/phdongou/article/details/116696553