4

如何用C/C++实现去除字符串头和尾指定的字符 - 一只会铲史的猫

 2 years ago
source link: https://www.cnblogs.com/softlee/p/16194750.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

编程时我们经常需要对字符串进行操作,其中有一项操作就是去除字符串的头(尾)指定的字符,比如空格。通常我们会使用封装好的库函数或者类函数的Trim方法来实现,如果自己动手写一个TrimHead和TrimTail函数该如何实现呢?

本文针对字符串头(尾)部指定的字符的去除,分别给出两个实现方法。并分别比较一下改进后的性能如何?

一、从头部开始去除指定字符

首先从头遍历,直到遇见第一个非指定字符,此后将后续字符按顺序逐一前移。

// 实现方式一
void TrimHead(char* pszSrc, char chTrim)
{
	if(NULL == pszSrc)
		return;
	
	// 从头部开始跳过chTrim指定的字符
	char* psz = pszSrc;
	while (*psz && *psz == chTrim) 
		psz++;
	
	// 将后面字符逐一拷贝到前面
	int i = 0;
	while(*psz)
	{
		*(pszSrc+i) = *psz;
		i++;
		psz++;
	}
	*(pszSrc+i) = 0;
}

上述函数中,在找到第一个非指定字符后,通过while函数逐一前移字符,如果后续字符串很长的话,性能是不是会比较低?我们改进一下,使用memmove函数替换while操作,下面是实现方法,代码更加简洁易读。

// 实现方式二
void TrimHeadEx(char* pszSrc, char chTrim)
{
	if(NULL == pszSrc)
		return;

	// 从头部开始跳过chTrim指定的字符
	int iStrLen = strlen(pszSrc);
	char* psz = pszSrc;
	while (*psz && *psz == chTrim) 
		psz++;

	// psz指向第一个非指定字符的位置
	if(psz != pszSrc)
	{
		// 计算新字符串长度
		iStrLen = iStrLen - (psz - pszSrc);
		memmove(pszSrc, psz, (iStrLen+1));	// +1表示将末尾的0也一并拷贝
	}
}

方法二的代码要比方法一的简洁,那么它的速度会比方法一的快么?文末会给出答案。

二、去除尾部指定的字符

// 实现方式一
void TrimTail(char* pszSrc, char chTrim)
{
	if(NULL == pszSrc)
		return;

	char* psz = pszSrc;
	char* pszLast = NULL;
	
	// 从头开始遍历直到整个字符串结束
	while(*psz)
	{
		// 遇到指定字符,则用pszLast记住该位置
		if(*psz == chTrim)
		{
			if(NULL == pszLast)
				pszLast = psz;
		}
		else
			pszLast = NULL;
		psz++;
	}
	
	// 如果找到末尾的第一个指定字符,则作为字符串的结尾
	if(pszLast != NULL)
		*pszLast = 0;
}

上述方法中,我们需要遍历完整个字符串,如果字符串很长的话,或者遇到极端情况,就是结尾没有指定字符时,也要将整个字符串遍历完毕。显然这种实现方式的效率并不高。 那么我们改进一下算法,从字符串的尾部进行遍历。

// 实现方式二
void TrimTailEx(char* pszSrc, char chTrim)
{
	if(NULL == pszSrc)
		return;

	// 从尾部开始跳过chTrim指定字符
	int iStrLen = strlen(pszSrc);
	char* pszStr = pszSrc;
	int iLastIdx = iStrLen - 1;
	while(iLastIdx >= 0 && *(pszStr+iLastIdx) == chTrim)
		iLastIdx--;
	
	// 计算新字符串长度并在结尾赋值为0
	iStrLen = iLastIdx+1;
	*(pszSrc+iStrLen) = 0;
}

上述实现方式是从字符串的尾部进行遍历,实现的方式也更加的简洁。如果结尾没有指定字符,该函数会在遍历第一个字符后就退出,性能显然要好过方式一。

那么对于TrimHead和TrimTail的两种实现,方式二和方式一到底谁快呢?是不是和我们想象的一样有差距或者差距很大呢?

三、测试比较

这里写了一个测试函数TestSpeedTrim,为了让时间更加明显,在该函数中设置的循环次数为10000000。大家可以亲自运行测试一下,看看debug和release两个版本的差异,结果一定会让你吃惊,可能和你想的并不一样哦。

#include <time.h>
#include <stdio.h>
#include <string.h>
#include <stdlib.h>
void TestSpeedTrim(bool bTrimHead)
{
	char szTrim1[256] = {0};
	char szTrim2[256] = {0};
	
	char* pszOrigin = "     This is a trim test head/tail    ";
	strcpy(szTrim1, pszOrigin);
	strcpy(szTrim2, pszOrigin);
	
	int i = 0;
	int iCount = 10000000;
	clock_t cStart = 0;
	
	// 第一种Trim方法
	cStart = clock();
	for(i = 0; i < iCount; i++)
	{
		bTrimHead ? TrimHead(szTrim1, ' ') : TrimTail(szTrim1, ' ');
	}
	clock_t cSpan1 = clock() - cStart;
	
	// 第二种Trim方法
	cStart = clock();
	for(i = 0; i < iCount; i++)
	{
		bTrimHead ? TrimHeadEx(szTrim2, ' ') :	TrimTailEx(szTrim2, ' ');
	}
	clock_t cSpan2 = clock() - cStart;
	
	printf("cSpan1 = %d, cSpan2 = %d\r\n", cSpan1, cSpan2);
	printf("szTrim1=[%s]\r\n", szTrim1);
	printf("szTrim2=[%s]\r\n", szTrim2);
}

int main(int argc, char* argv[])
{
	// 测试头
	printf("删除头部的空字符:\r\n");
	TestSpeedTrim(true);

	// 测试尾
	printf("\r\n删除尾部的空字符:\r\n");
	TestSpeedTrim(false);

	getchar();
	return 0;
}

这里就不给出比较结果了,因为只有自己亲自动手实现并跑一遍后,才会记得更加牢靠。


Recommend

About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK