c++实现split函数
博客专区 > D-dragon 的博客 > 博客详情
c++实现split函数
D-dragon 发表于1年前
c++实现split函数
  • 发表于 1年前
  • 阅读 15
  • 收藏 0
  • 点赞 0
  • 评论 0

【腾讯云】买域名送云解析+SSL证书+建站!>>>   

C++标准库里面没有split这个函数,原因是有其它函数提供了类似的功能,或者说用其它函数很容易实现这个功能,大体的方式有以下几种:

一,最基础的istringstream类,istringstream是从string对象中读取内容,由istream派生而来。

void split1(const string& sentence){
	istringstream iss(sentence);
	do{
        string sub;
        iss >> sub;
        cout << sub << endl;
    } while (iss);
}

这个istringstream读取的是一行字符串,分隔的标准是空格,通过do...while循环遍历出各个元素,为什么用do...while?因为至少应该有一个字符串。

二,使用copy函数。

void split2(const string& sentence){
	istringstream iss(sentence);
    std::copy(istream_iterator<string>(iss),istream_iterator<string>(),ostream_iterator<string>(cout, " "));
}

void split3(const string& sentence){
	istringstream iss(sentence);
	vector<string> tokens;
	std::copy(istream_iterator<string>(iss),istream_iterator<string>(),back_inserter(tokens));
}

这个copy函数,格式如下:

copy (InputIterator first, InputIterator last, OutputIterator result );

第一参数代表需要复制的迭代器起始处,第二个参数代表截止位置。而istream_iterator类型有一个默认值,这个默认值有一个性质,也就是istream_iterator一旦遇到文件结束标志或者在错误状态中,就会与这个默认值相等。因此,我们可以使用这个默认值来为copy函数表示“末尾元素的第一个位置”的惯例。第三个参数表示复制元素的存储位置。但是我们不能用tokens.end(),因为tokens.end()这个位置上并没有元素,这会出现很隐蔽的错误。而back_inserter会根据参数,生成一个迭代器,当这个迭代器作为一个目的地时,就会在容器的末尾添加元素。

三,手动指定分隔符。主要是使用了getline这个函数的delim参数。stringstream是对string对象进行读写,由iostream派生而来。

template<class Out>
void split(const string &s, char delim, Out result) {
    stringstream ss(s);
    string item;
    while (std::getline(ss, item, delim)) {
        *(result++) = item;
    }
}

vector<string> split(const string &s, char delim) {
    vector<string> elems;
    split(s, delim, back_inserter(elems));
    for(std::vector<string>::const_iterator it = elems.begin();it != elems.end();++it){
		cout << *it << endl;
    }
    return elems;
}

注意,参数delim是char型,实际上分隔符基本上都是一个字符。for循环时采用++it(即前置自增),比后置自增(it++)好一点,因为后置自增或自减需要对表达式的值(这里就是it)进行一次拷贝,会消耗更多的资源。

四,使用find_if函数。

bool space(char c){
	return isspace(c);
}
bool not_space(char c){
	return !isspace(c);
}
vector<string> split(const string& str){
	typedef string::const_iterator iter;
	vector<string> ret;
	iter i = str.begin();
	while (i != str.end()) {
		// ignore leading blanks
		i = find_if(i, str.end(), not_space);
		// find end of next word
		iter j = find_if(i, str.end(), space);
		// copy the characters in `[i,' `j)'
		if (i != str.end())
			ret.push_back(string(i, j));
		i = j;
	}
	return ret;
}

上面四种方式,基本上概括了类似split函数的各种实现。虽然没有一个现成的split函数,但是却有很多种类似的实现,单从表面上看,不提供split是一种缺陷,实际深入一点思考的话会发现,我们很少有直接单独使用split函数的功能,除非是拿来举例子。实际应用都是要和其它程序代码结合使用的,上面的代码就是实际时,完全可以根据业务选择具体的分隔要求,不一定非得有一个split才能达到业务要求。

  • 打赏
  • 点赞
  • 收藏
  • 分享
共有 人打赏支持
粉丝 6
博文 37
码字总数 35890
×
D-dragon
如果觉得我的文章对您有用,请随意打赏。您的支持将鼓励我继续创作!
* 金额(元)
¥1 ¥5 ¥10 ¥20 其他金额
打赏人
留言
* 支付类型
微信扫码支付
打赏金额:
已支付成功
打赏金额: