解释字节码---即乱码问题

原创
10/12 01:03
阅读数 89

解释字节码

  1. 计算机中文件存在的大小的最小计量单位——字节
  2. 为什么使用字节?

计算结只认识0001111 ——记录不方便,如何表示认识的信息

为了计算机和人的信息转化方便 ——人机交互

正清 字节 1010101001010101

计算机

一个文字表示几个字节 <--字节-->8个1或者0表示一个字节

假若“人”字对应两个字节———16个0和1的组合表示

  1. 有一个问题出现——不同地域语言有区别?

导致出现了很多语言转化字节的规范

中文GBK或者GB2312 英文iso8859—1等等
汉字-------0101数字怎么转变?

为了解决以上问题:有一个世界化的组织——统一化

第一件事情:

文字转化——010111这种问题?

给每一个文字、字符、字母对应一个数字-------ASCII等码表

第二件事情:挑出最有影响力的作为同一标识

中文:GBK或者GB2312 ——一个中文代表两个字节

英文:iso8859—1 ——一个字符对应六个字节

提出编码方法:utf—8 ———一个字符对应三个字节

  1. 乱码问题

原因:在不同的编码环境下打开了相同的文件

例如:

记事本(用的就是utf-8) 电脑系统(GBK)

教头 ABC def AB Cd ef

编写代码的时候符号不能是中文

  1. 解决乱码问题

办法1:

原因:源文件在当前环境在编写编写源文件的工具当前的环境下,使用另外的软件打开源代码乱码

解决:使用源文件软件打开源文件之后复制没有乱码的数据覆盖当前乱码数据,保存

办法2:

原因:如果源文件编辑软件不在当前环境或者乱码文件数量大

解决:保证所有文件没有打开,修改当前工具的编码环境之后再打开文件

 

例如:从别人那里好的项目,先要将当前工具设置成同一编码环境

问题:从别人那里拿过来的文件不知道原始编码怎么办?

方案1:问

方案2:尝试编码环境

顺序:utf-8—>GBK/GB2312—>iso8859-1

注意:每一次尝试编码的时候使用(原始文件——尝试过编码的删除,重新解压)

展开阅读全文
def
打赏
0
0 收藏
分享
加载中
更多评论
打赏
0 评论
0 收藏
0
分享
返回顶部
顶部