文档章节

显示12个字节

laichendong
 laichendong
发布于 2014/06/25 09:27
字数 1304
阅读 30
收藏 0
点赞 0
评论 0
如果你看到这篇文章的标题,隐约或者明确觉得不对劲儿。那,恭喜你!你知道我接下来要说什么了。 听我们的PM 美眉和研发同事在讨论问题,PM说到: “这里展示12个字节”。我一听怎么那么别扭呢?然后就问PM同事说怎么怎么回事。然后PM同事说是这么这么回事。(此处省略若干字……)最终确定这就是一个混沌的说法。因为当时我们的PM和研发同事都没有弄明白下面两个问题。才会产生这样的说法(和做法)。
  1. 中英文(不同编码)间,每个字符存储起来占用的空间不一样
  2. 中英文(不同字符)间,每个字符显示出来占用的宽度不一样
先说第一个问题。上面说的也还是比较笼统的。更加严谨的说法应该是, 同一个字符,采用不同的编码方式表示所占用的空间是可能不一样的比如:
System.out.println(Arrays.toString("东".getBytes(Charset.forName("UTF-8")))); // [-28, -72, -100]
System.out.println(Arrays.toString("东".getBytes(Charset.forName("GBK")))); // [-74, -85]
同样东东的的“东”字,用UTF-8编码表示,占用了3个字节的长度,用GBK编码表示,占用了两个字节的长度。 同一种编码方式,表示不同的字符所占用的空间也是可能不一样的。比如:
System.out.println(Arrays.toString("东".getBytes(Charset.forName("GBK")))); // [-74, -85]
System.out.println(Arrays.toString("D".getBytes(Charset.forName("GBK")))); // [68]
同样是GBK编码,表示“东”字用了2个字节,而表示大写字母“D”则只用了1个字节。这恐怕就是 流毒无穷的“ 一个中文字符算两个长度”说法的来源了。别再这样说,这是错的!如果你用的UTF-8编码,则可能是一个中文占3个甚至4个长度! 如果你用的Oracle数据库,相信会有一定的体会。Oracle对varchar类型的字段长度是按照 字节来指定的。所以一个长度为100的varchar字段,最多能存储一个str.length()==100的英文字符串。却只能存储str.length()==50(GBK编码)或str.length()==33(UTF-8编码)的中文字符串。这时候需要在数据录入时控制长度就比较悲催了。就有人出了“ 一个中文字符算两个长度”的馊主意。正确的做法应该是使用相应的编码将字符串转换成字节数组,看字节数组的长度。遗憾的是JavaScript没有提供原生的编码解码实现。 如果你使用的是varchar2类型或者是MySQL数据库,就比较开心了。他们使用的是以字符为单位指定字段的长度。所以数据库长度为100时,前端只要str.length()<=100就一定不会超长了。 关于字符编码,可以看看 维基百科的解释。 再说第二个问题,不同的字符,显示出来占用的宽度不一样。同样,上面的说法也是比较笼统的, 一个字符在屏幕上显示的宽度,同时受字号(font-size)和字体(font-family)的影响。 先说字号。一般情况我们会写:
font-size:12px;
一个字符显示在屏幕上。是一个二维的概念,有宽度和高度,那这个12px到底是说这个字符的宽度为12px还是高度为12px呢?都不是!font-size实际上设置的是字体中字符框的高度;实际的字符字形可能比这些框高或矮(通常会矮)。
<style type="text/css">
p {font-size: 80px}
</style>

<p>aaaAAA222中中中</p>
DeepinScrot-4323   可以看到,font-size设置为80px时,中文,英文,数字的实际高度都没有超过80。具体会有多高其实不用太关心,只要知道font-size越大,展示出来的字也越大就可以了。显示上的事是一个主观感受上的事。再看宽度,同样是80px的字号,小写字母,大写字母,数字和中文占的宽度也不一样,上图应该能比较明显的看出来,就不做对比图了。 再说字体,比如:
<style type="text/css">
p {font-size: 30px}
.p1{font-family:serif}
.p2{font-family:monospace}
</style>

<p class="p1">abcdefghijklmn</p>
<p class="p2">abcdefghijklmn</p>
DeepinScrot-0503 同样的内容“abcdefghijklmn ”,同样的字号“30px”,不同的字体“serif”和“mogospace”. 所占用的宽度是不一样的。由这点可以看出用str.subString(0, n) + "..." 的方式来实现“文本超长则用省略号表示”是不靠谱的。正确的做法应该是用css在展示的时候实现。
<style type="text/css">
p {
    width:100px;
    overflow: hidden;
    white-space: nowrap;
    text-overflow: ellipsis;
}
</style>

<p>我很长,我真的很长</p>
关于文本溢出问题,推荐阅读 这篇文章。其实拿大腿想想也是这样的,文本溢出是显示上的问题,按照“职责分配原则”中的“专家原则”也不能将显示的事儿交给数据处理去做。 好吧,就到这吧。希望看完这篇文章的同学不会再说出“一个中文算两个长度”和“这里显示12个字节”这样的话了。那我就功德圆满了。

© 著作权归作者所有

共有 人打赏支持
laichendong
粉丝 8
博文 85
码字总数 71483
作品 0
朝阳
程序员
linux命令--df命令&du命令

df命令是用来查看linux文件系统的磁盘占用情况,可以看到目前磁盘占用多少空间及还剩多少空间 其中几个常用的命令如下 命令1 df默认显示大小是以kb为单位的,可以用参数-k 1024字节为单位,-...

王小明123
2015/08/17
0
0
《超实用的Node.js代码段》连载一:获取Buffer对象字节长度

我们知道Node.js框架下的Buffer对象能够对二进制数据提供很好的支持,那么获取一个Buffer对象真实的字节长度则是必须要用到的功能了。Node.js框架为开发人员提供了一个Buffer.byteLength()方...

woiwoi
2016/04/12
46
0
MSP430学习笔记9-PS2键盘解码

PS2键盘解码的基本原理是通过外部中断读取键盘输出的串行信号,在根据扫描码进行查表解码。键盘发送往主机的信号总是在时钟的下降沿因此此中断是在下降沿触发,且时钟信号是由键盘给出,因此...

文艺小青年
2017/06/01
0
0
Oracle 中的 sql语句

1、 上面的语句不能使用 来查找(当数据库中isKeepOnPBS存在1,0,null三种情况时),否则null值的查不出来,<>和!=都是不等于,都可以使用 2、 3、 4、查询当天的记录 5、sql查询当前时间 6、...

土龙
2014/10/18
0
0
Oracle varchar2或char类型的byte和char的区别

Oracle定义字符串类型VARCHAR2和CHAR指定长度的用法如下: varchar2( ) 是介于1~4000之间的一个数,表示最多占用4000字节的存储空间。 char( ) 是介于1~2000之间的一个数,表示最多占用2000字...

技术小胖子
2017/11/14
0
0
SQL Server基础知识 -- SQL 用于各种数据库的数据类型

SQL 用于各种数据库的数据类型 转载: http://www.runoob.com/sql/sql-datatypes.html SQL 用于各种数据库的数据类型 Microsoft Access、MySQL 和 SQL Server 所使用的数据类型和范围。 Micr...

chenhao_asd
03/19
0
0
little endian和big endian的概念解释,判定与用途

转贴地址:http://www.chinaunix.net/jh/23/823662.html ####################### //声明: 1 本帖作者是:converse ,至此感谢! 2 红色背景字体为本人添加内容! 3 黄色背景为个人阅读重点...

ll124884135
2012/04/05
0
0
每天一个linux命令(14):head 命令

head 与 tail 就像它的名字一样的浅显易懂,它是用来显示开头或结尾某个数量的文字区块,head 用来显示档案的开头至标准输出中,而 tail 想当然尔就是看档案的结尾。 1.命令格式: head [参...

长平狐
2013/06/17
62
0
MySQL数据表类型 数据类型

MySQL数据表类型 数据类型 发表于: 2008-11-27,修改于: 2008-12-02 22:12 已浏览1968次,有评论0条 推荐 投诉

九爷
2011/05/30
0
2
Mysql数据类型

我们要把现实世界中的各种信息转换成计算机能理解的东西,这些转换后的信息就形成了数据。例 如,某人的出生日期是“1987年5月23日”,他的身高是170厘米,等等。数据不仅包括数字、字母、文...

长平狐
2013/01/06
66
0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

Python PIPEs

https://www.python-course.eu/pipes.php https://www.tutorialspoint.com/python/os_pipe.htm

zungyiu
1分钟前
0
0
gRPC学习笔记

gRPC编程流程 1. proto文件定义 proto文件用于定义需要通过gRPC生成的接口,可以理解为接口定义文档 2. 通过构建工具生成服务基类代码-Maven或Gradle 3. 服务端开发 服务端实现类须实现通过构...

OSC_fly
21分钟前
0
0
Docker Mac (三) Dockerfile 及命令

Dockerfile 最近学习docker的时候,遇到一件怪事,关于docker镜像可能会被破坏,还不知道它会有此措施 所以需要了解构建Dockerfile的正确方法 Dockerfile是由一系列命令和参数构成的脚本,这些命...

___大侠
48分钟前
0
0
Android Studio+NDK+Cmake 移植FFmpeg-4.0.2命令行工具

一、编译 参考大神的帖子,亲测一次编译成功:https://blog.csdn.net/bobcat_kay/article/details/80889398 鉴于以前查文档的经验,这里附上编写例子的时间:2018年7月22日 我用的是ubantu,...

她叫我小渝
48分钟前
0
0
mysql创建数据库

登录MYSQL mysql -u root -p 脚本创建数据库WeChat,并制定默认的字符集是utf8mb4。 CREATE DATABASE Wechat DEFAULT CHARSET utf8mb4 COLLATE utf8mb4_general_ci; 授权 grant all......

niithub
今天
0
0
svn: Unable to connect to a repository URL 的解决方案

错误图示: 解决办法:清除本地保存的授权信息; 1:右键点击本地文件夹,选择设置; TortoiseSVN -> Settings 2:在弹出的对话框中选择 Saved Data, 右侧选择:授权地方清理所有。 然后点确...

宁哥实战课堂
今天
1
0
sleep与wait的区别

Thread.sleep(XXX)方法消耗CPU吗? 这个知识点是我之前认识一直有错误的一个知识点,在我以前的认识里面,我一直认为Thread.sleep(1000)的这一秒钟的时间内,线程的休眠是一直占用着CPU的时间...

码代码的小司机
今天
1
0
20位活跃在Github上的国内技术大牛 leij 何小鹏 亚信

本文列举了20位在Github上非常活跃的国内大牛,看看其中是不是很多熟悉的面孔? 1. lifesinger(玉伯) Github主页: https://github.com/lifesinger 微博:@ 玉伯也叫射雕 玉伯(王保平),...

海博1600
今天
1
0
Mybatis收集配置

一、Mybatis取Clob数据 1、Mapper.xml配置 <resultMap type="com.test.User" id="user"> <result column="id" property="id"/> <result column="json_data" property="jsonData" ......

星痕2018
今天
1
0
centos7设置以多用户模式启动

1、旧版本linux系统修改inittab文件,在新版本执行vi /etc/inittab 会有以下提示 # inittab is no longer used when using systemd. # # ADDING CONFIGURATION HERE WILL HAVE NO EFFECT ON......

haha360
今天
1
0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

返回顶部
顶部