asci、unicode、utf-8

原创
2016/10/31 17:02
阅读数 29

1.asci占用一个字节gb2312是扩展

2.unicode 汉字占用两个字节

3.utf-8 汉字占三个字节

>>> name=u'中国'
>>> name
u'\u4e2d\u56fd'         #unicode
>>> print name
中国

>>> name.encode('utf-8')
'\xe4\xb8\xad\xe5\x9b\xbd'    #utf-8

 

展开阅读全文
加载中
点击引领话题📣 发布并加入讨论🔥
打赏
0 评论
0 收藏
0
分享
返回顶部
顶部