文档章节

asci、unicode、utf-8

enet01
 enet01
发布于 2016/10/31 17:02
字数 60
阅读 11
收藏 0

1.asci占用一个字节gb2312是扩展

2.unicode 汉字占用两个字节

3.utf-8 汉字占三个字节

>>> name=u'中国'
>>> name
u'\u4e2d\u56fd'         #unicode
>>> print name
中国

>>> name.encode('utf-8')
'\xe4\xb8\xad\xe5\x9b\xbd'    #utf-8

 

© 著作权归作者所有

enet01
粉丝 1
博文 11
码字总数 3402
作品 0
西安
项目经理
私信 提问
pathinfo函数获取非UTF-8字符集文件名的问题

看下面两句话: 在如果文件名是GBK、GB2312等非UTF-8或ASCI字符集编码时,获取的filename属性是错误的。因此,如果要获取争取的属性,应当先对字符集进行编码。

sendoffice
2017/12/13
0
0
转-How to Use UTF-8 with Python

from: http://www.evanjones.ca/python-utf8.html Tim Bray describes why Unicode and UTF-8 are wonderful much better than I could, so go read that for an overview of what Unicode i......

玉龙
2012/03/16
491
0
字符编码问题:Unicode 和 UTF-8

Unicode Unicode 是一种编码,它将世界上所有的符号都纳入其中。每一个符号都给予一个独一无二的编码。这样乱码问题就会消失。这就是 Unicode,就像它的名字都表示的,这是一种所有符号的编码...

cooffeelis
2017/11/18
0
0
好程序员web前端分享HTML字符集

如需正确地显示 HTML 页面,浏览器必须知道使用何种字符集。 万维网早期使用的字符集是 ASCII。ASCII 支持 0-9 的数字,大写和小写英文字母表,以及一些特殊字符。 由于很多国家使用的字符并...

好程序员IT
05/14
7
0
【转】python中文decode和encode转码

字符串在Python内部的表示是unicode编码,因此,在做编码转换时,通常需要以unicode作为中间编码,即先将其他编码的字符串解码(decode)成unicode,再从unicode编码(encode)成另一种编码。...

寂寞的远行者
2012/07/20
1K
0

没有更多内容

加载失败,请刷新页面

加载更多

3_数组

3_数组

行者终成事
今天
7
0
经典系统设计面试题解析:如何设计TinyURL(二)

原文链接:https://www.educative.io/courses/grokking-the-system-design-interview/m2ygV4E81AR 编者注:本文以一道经典的系统设计面试题:《如何设计TinyURL》的参考答案和解析为例,帮助...

APEMESH
今天
7
0
使用logstash同步MySQL数据到ES

概述   在生成业务常有将MySQL数据同步到ES的需求,如果需要很高的定制化,往往需要开发同步程序用于处理数据。但没有特殊业务需求,官方提供的logstash就很有优势了。   在使用logstas...

zxiaofan666
今天
10
0
X-MSG-IM-分布式信令跟踪能力

经过一周多的鏖战, X-MSG-IM的分布式信令跟踪能力已基本具备, 特点是: 实时. 只有要RX/TX就会实时产生信令跟踪事件, 先入kafka, 再入influxdb待查. 同时提供实时sub/pub接口. 完备. 可以完整...

dev5
今天
7
0
OpenJDK之CyclicBarrier

OpenJDK8,本人看的是openJDK。以前就看过,只是经常忘记,所以记录下 图1 CyclicBarrier是Doug Lea在JDK1.5中引入的,作用就不详细描述了,主要有如下俩个方法使用: await()方法,如果当前线...

克虏伯
今天
8
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部