文档章节

java获取txt文件编码格式

sunyh
 sunyh
发布于 2012/02/13 10:42
字数 195
阅读 2084
收藏 0

java编码与txt编码对应

java

txt

unicode

unicode big endian

utf-8

utf-8

utf-16

unicode

gb2312

ANSI

java读取txt文件,如果编码格式不匹配,就会出现乱码现象。所以读取txt文件的时候需要设置读取编码。txt文档编码格式都是写在文件头的,在程序中需要先解析文件的编码格式,获得编码格式后,在按此格式读取文件就不会产生乱码了。

  1. InputStream inputStream = new FileInputStream("E:/1.txt");  
  2.         byte[] head = new byte[3];  
  3.         inputStream.read(head);   
  4.         String code = "";  
  5.    
  6.             code = "gb2312";  
  7.         if (head[0] == -1 && head[1] == -2 )  
  8.             code = "UTF-16";  
  9.         if (head[0] == -2 && head[1] == -1 )  
  10.             code = "Unicode";  
  11.         if(head[0]==-17 && head[1]==-69 && head[2] ==-65)  
  12.             code = "UTF-8";  
  13.           
  14.         System.out.println(code); 

这样就获得了txt的编码格式了。

© 著作权归作者所有

sunyh

sunyh

粉丝 13
博文 99
码字总数 22054
作品 0
普陀
项目经理
私信 提问
加载中

评论(2)

要化茧的小虫
要化茧的小虫
if(head0==-17 && head1==-69 && head2 ==-65)
code = "UTF-8";
这一段是判断文件是否包含BOM头, 而不是判断是否是UTF8 吧
要化茧的小虫
要化茧的小虫
楼主从哪抄来的代码,误人子弟
自己写的 根据编码搜索文件的小工具

文件、目录搜索的小工具 用正则式限制文件名、关键字、目录 开始是专门为了搜索GBK和UTF8两种编码的文件,现在可以制定多种编码方式来搜索文件 本科生,代码可能很不规范 因为windows下好像没...

天地一MADAO_
2014/11/07
1K
10
打包Java项目(线程管理)生成可安装的exe运行文件()

一. java 代码: (ps :还有很大的优化空间, 1. 把所有的设置改成读取相对路径下的config 文件,那所有的设置可以通过更改config 文件更改; 2. kill session 的语句,不需要导出到文件,直接通过j...

donald121
2018/07/02
527
1
java 序列化 编码问题

各位大神现在有一个问题,通过java 的序列化将一个对象写到了本地的一个txt格式的文件,这样保存的用该是二进制的,使用editplus的十六进制的查看方式也不是很理想。 在mysql里面可以使用mys...

xianwu13
2013/02/18
394
4
黑马程序员.bobo.DAY.1

C:Program Files (x86)NVIDIA CorporationPhysXCommon;<span style="background:rgb(255,0,0)">%JAVA8HOME%bin;%JAVA8HOME%jrebin;</span>D:oracleproduct10.2.0db_1bin;C:Program Files (x8......

BobbyLou
2015/05/14
34
0
Win10系统下eclipse的基本配置 编码格式 classpath原理 import工作机制

eclipse是用来编译java文件的一个软件 国内也有汉化版,我也不知道该怎么上传……忘了从哪里搞来了 不过用了一段时间就还原原来的配置了因为网上的教程之类的方法都是英文版的 为了和网上的配...

codingcoge
2018/03/17
0
0

没有更多内容

加载失败,请刷新页面

加载更多

使用CSS自定义属性构建骨架屏

写在前面 几天前看到薄荷前端团队分享的《前端骨架屏方案小结》,突然回想起一年前看到的max bock写的《Building Skeleton Screens with CSS Custom Properties》,翻译整理写下出此文,分享...

前端老手
昨天
9
0
Docker常用命令小记

除了基本的<font color="blue">docker pull</font>、<font color="blue">docker image</font>、<font color="blue">docker ps</font>,还有一些命令及参数也很重要,在此记录下来避免遗忘。 ......

程序员欣宸
昨天
9
0
MAT使用-jvm内存溢出问题分析定位

1.MAT简介: MAT 全称 Eclipse Memory Analysis Tools 是一个分析 Java堆数据的专业工具,可以计算出内存中对象的实例数量、占用空间大小、引用关系等,看看是谁阻止了垃圾收集器的回收工作,...

xiaomin0322
昨天
5
0
内网和外网之间的通信(端口映射原理)

首先解释一下“内网”与“外网”的概念: 内网:即所说的局域网,比如学校的局域网,局域网内每台计算机的IP地址在本局域网内具有互异性,是不可重复的。但两个局域网内的内网IP可以有相同的...

Jack088
昨天
6
0
3.深入jvm内核-原理、诊断与优化-4. GC算法和种类

一、GC算法和种类 GC的概念 GC算法 引用计数法 标记清除 标记压缩 复制算法 可触及性 Stop-The-World GC的对象是堆空间和永久区 引用计数法 老牌垃圾回收算法 通过引用计算来回收垃圾 使用者...

hexiaoming123
昨天
4
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部