文档章节

Character Encoding in Java Web (TOMCAT)

徐航
 徐航
发布于 2015/02/27 11:40
字数 1340
阅读 82
收藏 0
点赞 0
评论 0

[TOC]

原文:Character Encoding Issues

请求体和响应体的默认字符编码

如果没有指定具体的字符编码,servlet会使用ISO-8859-1来对请求进行编码。(响应和请求的)HTTP消息体的字符编码在Content-Type头字段中指定,比如: Content-Type: text/html; charset=ISO-8859-1

When no explicit charset parameter is provided by the sender, media subtypes of the "text" type are defined to have a default charset value of "ISO-8859-1" when received via HTTP. Data in character sets other than "ISO-8859-1" or its subsets MUST be labeled with an appropriate charset value.

对使用标准语法的jsp页面来说,默认的响应字符集通常是ISO-8859-1,但是在XML语法中是UTF-8

###URI编码规范 URI语法规范规定任何US-ASCII字符之外的字符必须使用%转义序列进行编码:每个字符编码成一个%和两个表示该字符码的十六进制码,比如:US-ASCII character code 97 = 0x61,URI没有具体的默认编码。

####关于URI字符编码:

  1. ISO-8859-1ASCII对字符码0x20 ~ 0x7E是相互兼容的,大部分网站使用ISO-8859-1作为默认的查询字符串(query string);
  2. 许多浏览器开始提供使用UTF-8编码URL的选项,而不再是使用ISO-8859-1来编码URI。一些浏览器似乎使用当前页面的编码来对页面中链接的URI进行编码;
  3. HTML 4.0 推荐使用UTF-8来编码查询字符串(query string);
  4. 不确定时,将可能出现编码异常的查询字符串(query string)用POST请求发送。

####关于POST请求编码:

  1. HTTP/1.1表明HTTP消息的接收方必须按照发送方在Content-Type头中指定的编码方式进行编码(前提是接收方支持该编码)。
  2. 目前大部分浏览器不会指定请求的字符集,即使是ISO-8859-1以外的编码。看起来违反了HTTP规范,但是大部分浏览器似乎发送请求时使用当前页面使用的编码来生成POST请求。

###修改GET请求参数的编码

  • Tomcat 使用ISO-8859-1作为整个URL,包括查询字符串(query string),的默认字符编码。
  • 有两种方法来指定如何解释GET请求的参数:
    1. 编辑server.xml文件下的<Connector>元素,设置URIEncoding属性为具体值,比如:URIEncoding="UTF-8"
    2. 编辑server.xml文件下的<Connector>元素,设置useBodyEncodingForURI 属性的值为true,这将导致Connector对GET请求的参数使用请求体的编码。

###修改POST请求参数的编码 通过使用javax.servlet.Filter设置请求编码 5.x

webapps/servlets-examples/WEB-INF/classes/filters/SetCharacterEncodingFilter.java
webapps/jsp-examples/WEB-INF/classes/filters/SetCharacterEncodingFilter.java

6.x

webapps/examples/WEB-INF/classes/filters/SetCharacterEncodingFilter.java

5.5.36+, 6.0.36+, 7.x 从7.0.20开始,过滤器开始变成一等公民并且从examples移到了core,任何web应用不再需要单独编译和绑定即可使用。此方法可以移植到较旧的版本5.5.36和6.0.36。

org.apache.catalina.filters.SetCharacterEncodingFilter

请求编码设置必须在参数被解析之前完成才有效,一旦解析开始,就无法逆转。当第一个获取参数名或参数值的函数被调用参数解析即被触发,确保将这个过滤器配置在所有获取参数名或值的过滤器之前。

Tomcat提供的过滤器

###在所有地方使用UTF-8 为了完全转换到UTF-8编码,需要确保以下的改动:

  1. 设置server.mxl中<Connector>元素的URIEncoding="UTF-8";

  2. 使用字符编码过滤器设置默认编码为UTF-8;

  3. 修改所有JSP页面的Content-Type的包含字符集名:

    一般的JSP页面: <%@page contentType="text/html; charset=UTF-8" %> XML语法的页面(aka JSP Documents): <jsp:directive.page contentType="text/html; charset=UTF-8" />

  4. 修改所有的servlet设置响应的content type和在content type中include的字符集都设置为UTF-8

    response.setContentType("text/html; charset=UTF-8") or response.setCharacterEncoding("UTF-8").

  5. 修改内容生成模板库(Velocity, Freemarker, etc.)使用UTF-8,并指定它们生成的响应的content type为UTF-8;

  6. 禁用所有可能在编码设置过滤器或JSP页面设置Content type 为UTF-8之前访问请求参数的过滤器


###CASE 当在JSP页面使用<%@ page contentType="text/html; charset=UTF-8" %>时,页面GET请求的参数在地址栏以UTF-8编码;

charset="UTF-8"时的编码

当使用<%@ page contentType="text/html; charset=GBK" %>时,页面GET请求的参数在地址栏以GBK编码。

charset="GBK"时的编码

当不加这一句时,浏览器地址栏将以&#Unicode编码显示;

此处输入图片的描述

  • 以上JSP文件以UTF-8编码格式在磁盘存储
  • 如果JSP文件保存编码格式和页面中ContentType的charset编码格式不一致,页面显示内容会乱码
  • Tomcat容器默认使用的ISO-8859-1对请求内容进行编码,所以要对获取的参数值先用ISO-8859-1进行解码,然后再使用charset设置的编码格式进行编码

JSP页面中使用<%@ page pageEncoding="UTF-8"%>,JSP文件按照指定编码格式保存文件,如果没有这句,则使用ContentType中指定的编码格式。

© 著作权归作者所有

共有 人打赏支持
徐航
粉丝 15
博文 28
码字总数 19400
作品 0
武汉
程序员
javaweb工程 添加不到tomcat中 解决办法

有时候,我们会遇到java web 工程导入本地eclipse。然而,有可能遇到lib包错误或者tomcat版本不一致或者jar不正确导致导入失败。 在做的过程中,通过百度查找到一些解决办法供大家解惑。 在e...

west_coast ⋅ 05/28 ⋅ 0

Netweaver和CloudFoundry是如何运行Web应用的?

Netweaver 在Jerry的微信公众号文章SAP Fiori应用的三种部署方式里提到SAP Fiori应用以BSP应用的方式部署在ABAP Front-End Server上。那么这些BSP应用在运行时为什么能够接受和发送HTTP请求呢...

JerryWang_SAP ⋅ 06/16 ⋅ 0

Spring Boot 内嵌 Servlet 容器

Web容器名称 Servlet版本 Java版本 Tomcat 8 3.1 Java 7.0 + Tomcat 7 3.0 Java 6.0 + Jetty 9 3.1 Java 7.0 + Jetty 8 3.0 Java 6.0 + Undertow 1.1 3.1 Java 7.0 +...

WorriedFox ⋅ 05/02 ⋅ 0

tomcat中jvm内存溢出解决方案

常见的内存溢出有以下两种: java.lang.OutOfMemoryError: PermGen space java.lang.OutOfMemoryError: Java heap space 一、java.lang.OutOfMemoryError: PermGen space PermGen space的全称......

jin_6868 ⋅ 05/25 ⋅ 0

Spring Boot整合模板引擎jsp

jsp也算是一种模板引擎吧。整合jsp前,先说一下运行SpringBoot项目的几种方式 1. 运行SpringBoot项目的几种方式 1.1 使用内嵌Tomcat运行项目 在IDE中右键运行启动类,也就是直接直接运行App...

yysue ⋅ 06/15 ⋅ 0

Nginx+Tomcat负载均衡集群

通常情况下,一个tomcat站点由于可能出现单点故障及无法应对过多客户复杂多样的请求等问题,不能单独应用于生产环境下,所以我们需要一套更可靠的解决方案来完善Web站点架构。 Nginx是一款非...

cchenyz ⋅ 06/19 ⋅ 0

tomcat安装配置及nginx负载均衡

tomcat安装配置及nginx负载均衡 以下内容为centos6.5的环境下做的。 结构如下 nginx :192.168.43.66 tomcat1 :192.168.43.60 tomcat2 :192.168.43.3 tomcat是Java写的,需要jdk的运行环境所...

优惠券活动 ⋅ 05/06 ⋅ 0

Tomcat的组件及配置文件(一)

tomcat的组件: tomcat运行在JVM中,运行在JVM中之后,它会启动一个JVM实例,这个JVM实例称之为叫做tomcat server; 一个server就是运行在JVM中的一个实例,这个实例内部跑的是tomcat; conn...

长得丑死了 ⋅ 前天 ⋅ 0

利用“进程注入”实现无文件复活 WebShell

  * 本文作者:rebeyond,本文属FreeBuf原创奖励计划,未经许可禁止转载   引子   上周末,一个好兄弟找我说一个很重要的目标shell丢了,这个shell之前是通过一个S2代码执行的漏洞拿到...

FreeBuf ⋅ 05/30 ⋅ 0

dynamic web module消失不见

方法1:在project Facets选项中勾选Dynamic Web Module即可 方法2: 我用eclipse对项目进行修改名称,修改成功后。项目就没有Deployment Descriptor(如下图红色框中)而且最重要的一点是在p...

韩不会 ⋅ 06/06 ⋅ 0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

JavaScript零基础入门——(十)JavaScript的DOM基础

JavaScript零基础入门——(十)JavaScript的DOM基础 欢迎大家回到我们的JavaScript零基础入门,上一节课,我们了解了JavaScript中的函数,这一节课,我们来了解一下JavaScript的DOM。 第一节...

JandenMa ⋅ 今天 ⋅ 0

Spring mvc DispatchServlet 实现原理

在Spring中, ContextLoaderListener只是辅助类,在web 容器启动的时候查找并创建WebApplicationContext对象,通过该对象进行加载spring的配置文件。而真正的逻辑实现其实是在DispatcherSer...

轨迹_ ⋅ 今天 ⋅ 0

Weex起步

本教程假设你已经在你的本地环境安装了node 其实weex起步教程在 https://github.com/lilugirl/incubator-weex 项目说明文件中都已经有了,但为了有些同学看到英文秒变文盲,所以这里我重新写...

lilugirl ⋅ 今天 ⋅ 0

Jenkins实践1 之安装

1 下载 http://mirrors.jenkins.io/war/latest/jenkins.war 2 启动 java -jar jenkins.war 前提:安装jdk并配置环境变量 启动结果节选: ************************************************......

晨猫 ⋅ 今天 ⋅ 0

组合数学 1-2000 中,能被6或10整除的数的个数

1--2000 中,能被6或10整除的数的个数 利用集合的性质 能被6整除的个数 2000/6 = 333 能被10整除的个数 2000/10 = 200 能被6和10整除的个数 2000/30 = 66 能被6或10整除的个数 333+200-66 =...

阿豪boy ⋅ 今天 ⋅ 0

一篇文章学懂Shell脚本

Shell脚本,就是利用Shell的命令解释的功能,对一个纯文本的文件进行解析,然后执行这些功能,也可以说Shell脚本就是一系列命令的集合。 Shell可以直接使用在win/Unix/Linux上面,并且可以调用...

Jake_xun ⋅ 今天 ⋅ 0

大数据工程师需要精通算法吗,要达到一个什么程度呢?

机器学习是人工智能的一个重要分支,而机器学习下最重要的就是算法,本文讲述归纳了入门级的几个机器学习算法,加大数据学习群:716581014一起加入AI技术大本营。 1、监督学习算法 这个算法由...

董黎明 ⋅ 今天 ⋅ 0

Kylin 对维度表的的要求

1.要具有数据一致性,主键值必须是唯一的;Kylin 会进行检查,如果有两行的主键值相同则会报错。 2.维度表越小越好,因为 Kylin 会将维度表加载到内存中供查询;过大的表不适合作为维度表,默...

无精疯 ⋅ 今天 ⋅ 0

58到家数据库30条军规解读

军规适用场景:并发量大、数据量大的互联网业务 军规:介绍内容 解读:讲解原因,解读比军规更重要 一、基础规范 (1)必须使用InnoDB存储引擎 解读:支持事务、行级锁、并发性能更好、CPU及...

kim_o ⋅ 今天 ⋅ 0

代码注释中顺序更改 文件读写换行

`package ssh; import com.xxx.common.log.LogFactory; import com.xxx.common.log.LoggerUtil; import org.apache.commons.lang3.StringUtils; import java.io.*; public class DirErgodic ......

林伟琨 ⋅ 今天 ⋅ 0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

返回顶部
顶部