Java Web 编码问题一:jsp的编码问题

原创
2015/11/02 22:17
阅读数 1.6K

首先我们来看一张由eclipse生成的jsp文件的头:

图1:JSP文件编码

如上图所示jsp中的三个编码,

  1. ①代表的是服务器响应客户端请求的编码方式。服务器会用它来设置http响应头的content-type。就好比在Servlet中用response.setContentType("text/html;charset=utf-8")的作用。可以在浏览器的Header中响应头中的Content-Type中看到。

  2.  ②pageEnconding的编码是值jsp文件本身被编码的编码格式。因为jsp最终会被编译成clss的字节码,而字节码是Unicode编码的,所以必须知道格式才能转换。如果没有设置,eclipse会按iso-8859-1的编码方式对其编码。如果1没有设置,那么就会使用2pageEncoding的编码来设置。

  3. ③中的content也是设置浏览器的解码格式的,但是它的优先级没有Header中的Content-Type优先级高,所以只要在Header中设置了Content-Type,那么就基本不会使用meta中的content了。

下面通过一个非常简单的例子来测试一下:

<%@ page language="java" contentType="text/html; charset=utf-8"
    pageEncoding="UTF-8"%>
<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd">
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
<title>encoding</title>
</head>
<body>
<center>
<h4>您好!</h4> 
</center>
</body>
</html>

非常简单,运行没有乱码。用Firefox的debug看一下请求头如下:

图2:Header1

如果您有兴趣,可以尝试着把图1中①的编码contentType去掉,发现还是没有乱码,查看响应头信息,Content-Type的编码依然是utf-8,这是因为如果没有设置图1中①的编码contentType默认使用的就是图1中②pageEncoding的编码方式。

       还可以尝试着把③中的编码改为iso-8859-1之类的与中文不兼容的编码,发现仍然没有乱码,查看请求头信息Content-Type的编码依然是utf-8,并且比meta中编码的优先级高所以浏览器还是使用响应头中的utf-8的方式来解码。

        现在我们把中①的编码contentType编码改为GBK,如下图:


图3:contentType-GBK

        在Firefox debug中查看请求头信息Content-Type的编码,发现Content-Type的编码是GBK这样证明①的编码contentType是设置响应头中的Content_Type。但是奇怪的是并没有产生乱码,服务器明明是utf-8编码,响应头是GBK为什么没有出现乱码呢?暂时无解。

       但是我们把中①的编码contentType编码改为iso-8859-1不兼容中文的编码方式,发现就出现乱码了。

      关于图3中没有出现乱码的原因,也许我们能够从浏览器的解码过程中找到一些提示,请参考:

www.w3.org/html/wg/drafts/html/master/syntax.html#parsing-with-a-known-character-encoding


展开阅读全文
打赏
0
11 收藏
分享
加载中
更多评论
打赏
0 评论
11 收藏
0
分享
返回顶部
顶部