文档章节

字符串与其他基本类型的转换——从C到C++11

人不知
 人不知
发布于 2014/09/19 14:07
字数 2316
阅读 2143
收藏 8

转自 IBM 编译器中国开发团队的《C++11中的string - atoi/itoa》

在C++11中,由于右值引用的引入,常为人所诟病std::string的性能问题得到了很大的改善。另外一方面,我们也可以看到新语言为std::string类增加了很多新的api。比较引人注意的就是std::string的成员函数stoi系列,以及std::to_string全局函数。这两种API虽然很不起眼,却为C++11的格式化输出(formatted I/O)增加了一种实用的手段。我们可以依序会议一下C,C++98,C++11中我们是如何处理atoi/itoa的问题的:

在C时代,通常我们遇到atoi(字符串到数值转换)的问题的时候我们会使用<stdlib.h>中的atoi函数:

int num = atoi(cstr);

这里的cstr通常为char或者const char类型的字符串。函数返回的结果则是该字符串所表示的一个十进制的integer。函数的整个效果则等同于<stdlib.h>中的另外一个函数strtol:

int num = strtol(cstr, NULL, 10);

相比于atoi,strtol多了最后一个参数"radix"表明函数采用的是几进制(这个进制数可以从2到34,这个数值范围的原因显而易见)。除去strtol会在出错时设置全局的errno外,其效果与atoi系列中的atol则几乎是完全等同的。

而C时代解决itoa(数值到字符串的转换)的时候,则采用了sprintf函数:

int myint; char buf[SIZE]; sprintf(buf, "my data is %d", myint);

这里字符的输出控制交给了"%d"这样的特殊字符。通过特殊字符以及变长参数的配合(sprintf是变长参数函数),我们获得预期的formatted I/O的输出。 这里我们可以看到C中对atoi/itoa的处理的特点,基本可以归纳如下:

  1. atoi不检查字符串中错误。这对使用API的程序员而言意味着他必须检查错误,或者必须判断出错误在实际使用中总是不存在或者是可以被程序忍受的。
  2. atoi的替代版本strtol检查字符串的错误,但使用的是POSIX中的标准方式,设置errno。这意味着使用strtol的程序员如果要检测字符串中的错误,需要在调用strtol后检测全局变量errno。
  3. sprintf不负责任何的内存管理。通常情况下,程序员都会被告诫使用snprintf或者其它有内存边界检查的版本替代sprintf。这样一来会减少发生缓冲区溢出的可能性。不过总的来说这只是一种编程中的防御手段,从程序员的角度而言,内存管理的烦恼依然存在。
  4. sprintf跟printf一样,不检查参数类型(因为是以变长函数的方式实现的),所以如果参数和escape character不匹配的话,会在运行时才发现不匹配的输出。不过相对于其它三点,这种错误是最容易修正的。 所以说C中的atoi/itoa问题的解决方式并算不得让程序员愉悦。在坏的输入情况下,程序员必须小心处理各种异常,以防程序误入歧途。不过反过来看,C中的atoi/itoa的处理也非常直观,易于理解,所以即使在C++中这样的代码也并非少见。

到了C++98时代,atoi/itoa可以使用新的C++标准库来完成。具体地就是使用C++的流(stream)模板类。值得注意的是,在C++98代码中,虽然字符串的存储使用字符串数组也是完全可以的,但在C++代码中使用std::string类型,内存可以自行有效地管理,而且成员函数可以抛出异常,所以更适用于C++代码。而关于std::string类型的流模板类型就是std::stringstream。通过全局重载的operator <<以及operator >>,std::stringstream可以很轻松地完成atoi或者是itoa的任务,比如:

ostringstream oss; oss << 15 << " is int, " << 3.14f << " is float." << endl; cout << oss.str();

oss就是一个字符串流对象,可以用于itoa的工作。而

istringstream iss("12 14.1f"); int a; float b; iss >> a >> b; cout << a << " " << b << endl;

上面代码中的iss字符串流对象,则可用作atoi。 从设计上讲,std::stringstream算得上是一种好的设计。这是由于使用std::stringstream的代码看起来非常地直观。而且由于其来自于C++库,程序员通常也不太关心是否会有exception抛出--因为如果代码没有try-catch block的话,exception一旦抛出,程序就会直接直接终止(调用std::terminate)。这种解决出错的方式对于程序员来说更为爽快,因为程序在问题点终止,就很容易找到出问题的代码位置。而C时代的atoi/itoa,如同我们讲到的,需要程序员关注异常,如果漏过处理异常之后(其实这很常见),程序可能带病运行。当然,由于stringstream总是"附着"于一个内存可以自行管理的string对象,所以程序员通常也不必担心任何的内存分配问题。 从设计角度出发看,std::stringstream几乎无可挑剔。但在实际使用中,如我们在上面提到的,很多人还是愿意使用C中的处理方法来完成atoi/itoa。这大概有两方面的原因:

  1. std::stringstream在概念上的间接性。这点间接性来源于std::stringstream和std::string间的关联。通常情况下,一个std::stringstream对象总是会与其"附着"的std::string对象发生联系。或者其是从一个string对象(上例中的iss("12 14.1f"))构造而来以使用,或者其必须转化为一个string对象(上例中的oss.str())而使用。而新手常会会直觉地写出string a << 12 << " is int";这样的错误代码。
  2. 格式化输出的不便利性。相比于sprintf,std::stringstream是一个流对象,意味着其也有了更高的学习代价。简单的sprintf,只需要翻查escape character的手册,就能漂亮地进行格式化的输出。而使用流进行格式化输出的话,则需要控制一个状态机。很多时候,程序员需要关心上一状态对现有输出的影响。而且通常也意味着需要输入更多的代码。很多时候程序员都会觉得非常麻烦。所以即使sprintf在C++代码中缺失了类型匹配、异常处理、内存管理等等,程序员依然义无反顾地使用了它。(关于这一点,boost::format可能给出了一种跨平台的中间的解决方案) 从以上两个方面看,使用std::stringstream完成atoi/itoa虽然是更为C++风格地、功能完备方式,但由于学习代价的增高以及格式化输出中的不便利性,其在实际场景中的应用也大大受限。

到了C++11中,标准委员会可能是注意到这种"简单比完备"更重要的情况,于是在C++11中,标准增加了全局函数std::to_string,以及std::stoi/stol/stoll等等函数。(最初的paper称之为simple numeric access,N1982)其用法非常简单:

string s; s += to_string(12) + " is int, "; s += to_string(3.14f) + " is float."; cout << s << endl;

这里的to_string会根据参数的类型完成相应类型地转换。而:

string s("12"); int i = stoi(s); cout << i << endl;

这样的代码则可以顺利完成atoi的任务。由于其是C++11引入的函数,所以具备C所不具备的所有的C++库代码特征:根据类型的处理,抛出异常,以及自动内存管理。

可以看到,std::to_string在实际使用中可能会涉及一些字符串的连结。如我们在文章一开始提到的,C++98中字符串连结一直是C++语言被诟病性能低于C的一个重要方面。而这在C++11引入了右值引用后得到了很大的缓解。因此此时std::to_string这样的函数的实用性就大大增强了。不过std::to_string并不是itoa的一种终极方式。以浮点数为例,to_string甚至连浮点数小数位显示控制这样基本的控制功能都不具备,因此其最大地特点还是突出在其易用性上。C++程序员不必定义一个std::stringstream对象就可以完成安全有效且不必关心任何内存的itoa工作。 而std::stoi/stol/stoll...系列更是简单到只能完成一个数值的转换,比起总是返回std::stringstream &的operator >>比起来功能性就差很远了。后者能在一行代码中转化出多个数值。但前者最大地特点仍然突出在易用性上,不必"附着"一个std::stringstream类型。这对很多无需复杂atoi的程序而言也就足够了。

本文转载自:https://www.ibm.com/developerworks/community/blogs/12bb75c9-dfec-42f5-8b55-b669cc56ad76/entry/c_1...

人不知
粉丝 12
博文 82
码字总数 19447
作品 0
深圳
后端工程师
私信 提问
加载中

评论(2)

maplewang
maplewang
好,不错
徐永强
徐永强
ss威武
C++ Primer Plus(三)——处理数据

面向对象编程OOP的本质是设计并扩展自己的数据类型。 内置的C++数据类型分为两组:基本类型和符合类型,其中基本类型仅仅包括整数与浮点数。 1. 要把信息存储在计算机中,程序必须记录3个基本...

吃一堑消化不良
2015/09/02
68
0
C++ Primer Plus(四)——复合类型

只能在定义数组时才能初始化,不能将一个数组赋值给另一个数组,但可以使用下标分别赋值给数组元素,但可以将一个string对象赋值给另一个string对象 如果只对数组的一部分初始化,其他元素自...

吃一堑消化不良
2015/11/06
120
0
【C++】第3章 处理数据 知识总结

《C++ Primer Plus》第3章知识点总结 内置的C++类型分两组:基本类型和复合类型。本文将介绍基本类型,即整数和浮点数 简单变量 变量名的命名规则 (1)在名称中只能使用字母字符、数字和下划...

qq_37792173
2017/09/19
0
0
正则表达式 (C++) (施工中)

先来看一个例子,要求写一段代码,实现如下功能: 从标准输入中读取一行字符串, 从中读取所有邮箱的格式; 对于这个问题,用传统的方式是可以解决的: 我们可以用解析字符串的方式实现,需要...

shangluyi
2016/12/24
0
0
JS各种基本数据类型常用方法总结(看这篇就够了)

所有语言的基本数据类型就是那么几种,因为之前一直从事移动端,在学习js的过程中,总结一下js的基本类型及用法。 JavaScript 数据类型:字符串、数字、布尔,对象、Null、Undefined 1.Strin...

honey缘木鱼
2018/11/10
0
0

没有更多内容

加载失败,请刷新页面

加载更多

前端技术之:Prisma Demo服务部署过程记录

安装前提条件: 1、已经安装了docker运行环境 2、以下命令执行记录发生在MackBook环境 3、已经安装了PostgreSQL(我使用的是11版本) 4、Node开发运行环境可以正常工作 首先需要通过Node包管...

popgis
今天
5
0
数组和链表

数组 链表 技巧一:掌握链表,想轻松写出正确的链表代码,需要理解指针获引用的含义: 对指针的理解,记住下面的这句话就可以了: 将某个变量赋值给指针,实际上就是将这个变量的地址赋值给指...

code-ortaerc
今天
4
0
栈-链式(c/c++实现)

上次说“栈是在线性表演变而来的,线性表很自由,想往哪里插数据就往哪里插数据,想删哪数据就删哪数据...。但给线性表一些限制呢,就没那么自由了,把线性表的三边封起来就变成了栈,栈只能...

白客C
今天
43
0
Mybatis Plus service

/** * @author beth * @data 2019-10-20 23:34 */@RunWith(SpringRunner.class)@SpringBootTestpublic class ServiceTest { @Autowired private IUserInfoService iUserInfoS......

一个yuanbeth
今天
5
0
php7-internal 7 zval的操作

## 7.7 zval的操作 扩展中经常会用到各种类型的zval,PHP提供了很多宏用于不同类型zval的操作,尽管我们也可以自己操作zval,但这并不是一个好习惯,因为zval有很多其它用途的标识,如果自己...

冻结not
昨天
6
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部