文档章节

显示12个字节

laichendong
 laichendong
发布于 2014/06/25 09:27
字数 1304
阅读 80
收藏 0

精选30+云产品,助力企业轻松上云!>>>

如果你看到这篇文章的标题,隐约或者明确觉得不对劲儿。那,恭喜你!你知道我接下来要说什么了。 听我们的PM 美眉和研发同事在讨论问题,PM说到: “这里展示12个字节”。我一听怎么那么别扭呢?然后就问PM同事说怎么怎么回事。然后PM同事说是这么这么回事。(此处省略若干字……)最终确定这就是一个混沌的说法。因为当时我们的PM和研发同事都没有弄明白下面两个问题。才会产生这样的说法(和做法)。
  1. 中英文(不同编码)间,每个字符存储起来占用的空间不一样
  2. 中英文(不同字符)间,每个字符显示出来占用的宽度不一样
先说第一个问题。上面说的也还是比较笼统的。更加严谨的说法应该是, 同一个字符,采用不同的编码方式表示所占用的空间是可能不一样的比如:
System.out.println(Arrays.toString("东".getBytes(Charset.forName("UTF-8")))); // [-28, -72, -100]
System.out.println(Arrays.toString("东".getBytes(Charset.forName("GBK")))); // [-74, -85]
同样东东的的“东”字,用UTF-8编码表示,占用了3个字节的长度,用GBK编码表示,占用了两个字节的长度。 同一种编码方式,表示不同的字符所占用的空间也是可能不一样的。比如:
System.out.println(Arrays.toString("东".getBytes(Charset.forName("GBK")))); // [-74, -85]
System.out.println(Arrays.toString("D".getBytes(Charset.forName("GBK")))); // [68]
同样是GBK编码,表示“东”字用了2个字节,而表示大写字母“D”则只用了1个字节。这恐怕就是 流毒无穷的“ 一个中文字符算两个长度”说法的来源了。别再这样说,这是错的!如果你用的UTF-8编码,则可能是一个中文占3个甚至4个长度! 如果你用的Oracle数据库,相信会有一定的体会。Oracle对varchar类型的字段长度是按照 字节来指定的。所以一个长度为100的varchar字段,最多能存储一个str.length()==100的英文字符串。却只能存储str.length()==50(GBK编码)或str.length()==33(UTF-8编码)的中文字符串。这时候需要在数据录入时控制长度就比较悲催了。就有人出了“ 一个中文字符算两个长度”的馊主意。正确的做法应该是使用相应的编码将字符串转换成字节数组,看字节数组的长度。遗憾的是JavaScript没有提供原生的编码解码实现。 如果你使用的是varchar2类型或者是MySQL数据库,就比较开心了。他们使用的是以字符为单位指定字段的长度。所以数据库长度为100时,前端只要str.length()<=100就一定不会超长了。 关于字符编码,可以看看 维基百科的解释。 再说第二个问题,不同的字符,显示出来占用的宽度不一样。同样,上面的说法也是比较笼统的, 一个字符在屏幕上显示的宽度,同时受字号(font-size)和字体(font-family)的影响。 先说字号。一般情况我们会写:
font-size:12px;
一个字符显示在屏幕上。是一个二维的概念,有宽度和高度,那这个12px到底是说这个字符的宽度为12px还是高度为12px呢?都不是!font-size实际上设置的是字体中字符框的高度;实际的字符字形可能比这些框高或矮(通常会矮)。
<style type="text/css">
p {font-size: 80px}
</style>

<p>aaaAAA222中中中</p>
DeepinScrot-4323   可以看到,font-size设置为80px时,中文,英文,数字的实际高度都没有超过80。具体会有多高其实不用太关心,只要知道font-size越大,展示出来的字也越大就可以了。显示上的事是一个主观感受上的事。再看宽度,同样是80px的字号,小写字母,大写字母,数字和中文占的宽度也不一样,上图应该能比较明显的看出来,就不做对比图了。 再说字体,比如:
<style type="text/css">
p {font-size: 30px}
.p1{font-family:serif}
.p2{font-family:monospace}
</style>

<p class="p1">abcdefghijklmn</p>
<p class="p2">abcdefghijklmn</p>
DeepinScrot-0503 同样的内容“abcdefghijklmn ”,同样的字号“30px”,不同的字体“serif”和“mogospace”. 所占用的宽度是不一样的。由这点可以看出用str.subString(0, n) + "..." 的方式来实现“文本超长则用省略号表示”是不靠谱的。正确的做法应该是用css在展示的时候实现。
<style type="text/css">
p {
    width:100px;
    overflow: hidden;
    white-space: nowrap;
    text-overflow: ellipsis;
}
</style>

<p>我很长,我真的很长</p>
关于文本溢出问题,推荐阅读 这篇文章。其实拿大腿想想也是这样的,文本溢出是显示上的问题,按照“职责分配原则”中的“专家原则”也不能将显示的事儿交给数据处理去做。 好吧,就到这吧。希望看完这篇文章的同学不会再说出“一个中文算两个长度”和“这里显示12个字节”这样的话了。那我就功德圆满了。
laichendong
粉丝 10
博文 85
码字总数 71483
作品 0
朝阳
程序员
私信 提问
加载中
请先登录后再评论。
王爽《汇编语言》实验9

题目:在屏幕中间分别显示绿色、绿底红色、白底蓝色的字符串’welcome to masm!’. 分析:根据所给材料可知,DOS全屏模式下,一屏最多可显示内容为8025个字符,即显示25行,每行80个字符;显...

websoft
2012/09/05
744
1
HHF_MySQL数据类型_简述

1.整数类型   TINYINT、SMALLINT、MEDIUMINT、INT(INTEGER)、BIGINT,存储需求分别是1字节、2字节、3字节、4字节、8字节,整数类型字段属性可以添加AUTO_INCREMENT 自增约束条件。指定整数...

osc_v8gts6gd
2019/03/15
7
0
Mysql中的一些类型

列类型 --整数类型 Tinyint:迷你整形 一个字节=8位 最大能表示的数值是0-255 实际区间 -128~127 Smallint:小整形 两个字节 能表示0-65535 Mediumint:中整型 三个字节 Int:整型 四个字节 Bigi...

osc_mgt0rm0m
02/15
2
0
oracle 数据类型 -- 字符和二进制串类型

1 Oracle数据类型概述 CHAR:这是一个定长字符串,会用空格填充来达到其最大长度。非null的CHAR(2) 总是包含2字节信息(使用了默认国家语言支持National Language Support,NLS设置)。CHAR字...

Annabelle319
2018/08/21
34
0
linux命令--df命令&du命令

df命令是用来查看linux文件系统的磁盘占用情况,可以看到目前磁盘占用多少空间及还剩多少空间 其中几个常用的命令如下 命令1 df默认显示大小是以kb为单位的,可以用参数-k 1024字节为单位,-...

王小明123
2015/08/17
150
0

没有更多内容

加载失败,请刷新页面

加载更多

目标检测算法-YOLO算法纵向对比理解

目标检测算法-YOLO算法纵向对比理解 DeepLearning的目标检测任务主要有两大类:一段式,两段式 其中两段式主要包括RCNN、FastRCNN、FasterRCNN为代表, 一段式主要包括YOLO,SSD等算法 由于一...

osc_qnf5stcu
34分钟前
14
0
Spring+MyBatis+SpringMvc+Mysql+Druid+PageHelper分页实现

我是阿福,公众号「阿福聊编程」作者,一个在后端技术路上摸盘滚打的程序员,在进阶的路上,共勉!文章已收录在 JavaSharing 中,包含Java技术文章,面试指南,资源分享。 思路分析 MyBatis的...

阿福聊编程
34分钟前
16
0
HP M154nw彩色打印机 打印WORD故障排查过程

HP M154nw彩色打印机 打印WORD故障排查过程 问题描述: 用户打印某WORD文档(文档主要内容为文字及图片),打印失败,且WORD呈现无响应假死状态,更换公司其他电脑均出现该问题,office与WPS 均产...

osc_3hevjybf
35分钟前
11
0
二分查找算法(Python)

介绍 二分查找也称折半查找(Binary Search),它是一种效率较高的查找方法。但是,折半查找要求线性表必须采用顺序存储结构,而且表中元素按关键字有序排列。 前提 必须待查找的序列有序 时...

osc_8qovbqi5
36分钟前
6
0
服务器出现故障问题应该怎么办?

1.网络故障 服务器托管是放置在服务商的机房里面,在接入网络供用户进行访问。当服务器出现网络故障以后,会由服务商技术人员进行处理,保障服务器的正常访问。 2.服务器硬件故障 服务器是精...

osc_g1xnlmh8
37分钟前
14
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部