Javaweb中常见编码乱码问题(一)--688IT编程网

Javaweb中常见编码乱码问题（⼀）最近在看Java web中中⽂编码问题，特此记录下。

本⽂将会介绍常见编码⽅式和Java web中遇到中⽂乱码问题的常见解决⽅法：

⼀、常见编码⽅式：

1、ASCII 码

　众所周知，这是最简单的编码。它总共可以表⽰128个字符，0~31是控制字符如换⾏、回车、删

除等，32~126是打印字符，可以通过键盘输⼊并且能够显⽰出来的。

2、ISO-8859-1

它是基于ASCII码基础上扩展的，它总共能表⽰256个字符，涵盖了⼤多数西欧语⾔字符。详见

该编码不⽀持中⽂，举个中⽂编码栗⼦:

字符串“I am 君⼭”⽤ ISO-8859-1 编码，下⾯是编码结果：

由于ISO-8859-1 是单字节编码且不⽀持中⽂，直接将中⽂字符转成‘3f’, 3f也就是常见的"?"字符

3、GB2312

它是双字节编码，共包含6763个汉字。

4、GBK

汉字内码扩展规范，是基于GB2312上拓展的，加⼊了更多的汉字，能表⽰21003个汉字。它的编码

是和GB2312兼容的。也就是说⽤GB2312编码的汉字可以⽤GBK来解码，并且不会乱码。倒过来就不完

全可以了，因为GB2312描述的汉字⽐GBK少。

5、UTF-16

UTF-16是基于Unicode上定义的，⽤两个字节来表⽰Unicode的转换格式，它采⽤定长的表⽰⽅法，

即不能什么字符都可以⽤两个字节表⽰。两个字节是16个bit，所以就做UTF-16。（Unicode 囊括了世界

上所有语⾔，所有语⾔均可通过Unicode来相互翻译，详解）

6、UTF-8

由于UTF-16统⼀采⽤两个字节来表⽰⼀个字符，有很多字符⽤⼀个字节表⽰即可。所以存储空间放

⼤了⼀倍，还会增加⽹络传输的流量，所以推出了UTF-8。 UTF-8采⽤了⼀种变长技术，每个编码区域有

不同的字码长度。

通过上⾯介绍和对⽐，对于中⽂字符的处理我想UTF-8是最理想的中⽂编码。

⼆、常见乱码问题分析

1、中⽂变成看不懂的字符

如果⼀串中⽂字符变成了⼀串看不懂的字符如："Ì Ô £ ¡Î Ò Ï²»¶ £ ¡"，这种情况通常是编码

字符集与解码时所⽤的字符集不⼀致所造成的。⽐如使⽤GBK编码，如果使⽤ISO-8859-1解码

乱码文字怎么打出来

的话结果就是这样。

2、⼀个汉字变成了⼀个问号

如果编码和解码的字符集都是⼀致的，那么可以确定该字符编码不⽀持中⽂，例如：ISO-8859-1

3、⼀个汉字变成了两个问号

中⽂经过多次编码且其中有⼀次编码或者解码使⽤了不⽀持中⽂的字符集　

三、常见案例分析(tomct+google)

1、参数传输乱码

背景：从jsp中传参数（包括中⽂）请求后台数据，在后台获取到的请求参数乱码。

1.1 前端编码设置，先讲解下jsp中编码的配置：

a、其中contentType中charset⽤来设置服务器发送给客户端时的内容编码；pageEncoding ⽤

来设置JSP源⽂件本⾝和响应正⽂中的字符编码。通俗的说pageEncoding是jsp⽂件本⾝的编码，如果

pageEncoding设置为ISO-8859-1，则jsp页⾯中不能保存中⽂字符，会⾃动提⽰你是否要设置为UTF-8.

b、jsp⽂件编码字符集默认为ISO-8859-1, JSP源⽂件字符集时，为pageEncoding>

contentType。如果都没有设置，默认ISO-8859-1。

c、设置响应输出的字符集时，优先级为contentType>pageEncoding。如果都没有设置，默认

ISO-8859-1。

<%@ page language="java" contentType="text/html; charset=UTF-8" pageEncoding="UTF-8"%>

综上所述，解决该问题乱码的第⼀步要设置jsp中的编码，最好统⼀为UTF-8。

exmaple（乱码⽰例）:

页⾯效果如下：

1.2 后端编码设置

a、⾸先要设置tomcat编码，其中要了解两个参数（l）：URIEncoding 和

useBodyEncodingForURI，可以查看官⽅⽂档说明：

，以下是我理解：

1)URIEncoding是对所有GET⽅式的请求的数据进⾏统⼀的重新编码，默认编码为

ISO-8859-1（针对URI上的请求参数）

2)useBodyEncodingForURI：此设置仅适⽤于请求的查询字符串（针对请求体中内容）。　与URIEncoding不同，它不影响请求URI的路径部分。如果不知道请求字符编码（浏览器不提供，并且SetCharacterEncodingFilter不设置或使⽤Request.setCharacterEncoding⽅法的类

似过滤器），默认编码始终为“ISO-8859-1”。URIEncoding设置对此默认值没有影响。

该参数为false。通俗的说：

true表⽰get和post的编码保持⼀致，post⽅式的编码是什么，get⽅式的编码就是什么。

false表⽰get和post的字符编码各⾃设置，互相没有关系。

example1（只设置URIEncoding）:

<Connector connectionTimeout="20000" port="9080" protocol="HTTP/1.1"

redirectPort="443" URIEncoding="UTF-8" />

controller:

@RequestMapping(value = "/testURI", method=RequestMethod.POST)

@ResponseBody

public String testURI(HttpServletRequest request){

String username = Parameter("username");

String nickname = Parameter("nickname");

System.out.println("姓名：" + username + ", 昵称：" + nickname);

return "姓名：" + username + ", 性别：" + nickname;

}

jsp:

</form>

输出结果：姓名：张三, 昵称：èå¼ ä¸

从结果中可以看出， URIEncoding只对URI中的参数进⾏编码。

example2：只修改controller中代码，就都会显⽰正常

@RequestMapping(value = "/testURI", method=RequestMethod.POST)

@ResponseBody

public String testURI(HttpServletRequest request) throws UnsupportedEncodingException{

request.setCharacterEncoding("UTF-8");

String username = Parameter("username");

String nickname = Parameter("nickname");

System.out.println("姓名：" + username + ", 昵称：" + nickname);

return "姓名：" + username + ", 性别：" + nickname;

}

其实第⼆种做法并不是很⽅便，⼀般通过设置URIEncoding+encodingFilter即可解决。 example3（通常做法）:

l代码如下，其余跟example1⼀样即可。

<filter-name>encodingFilter</filter-name>

<filter-class>org.springframework.web.filter.CharacterEncodingFilter</filter-class>

<init-param>

<param-name>encoding</param-name>

<param-value>UTF-8</param-value>

</init-param>

<init-param>

<param-name>forceEncoding</param-name>

<param-value>true</param-value>

</init-param>

</filter>

<filter-mapping>

<filter-name>encodingFilter</filter-name>

<url-pattern>/*</url-pattern>

</filter-mapping>

example4：

@RequestMapping(value = "/testURI", method=RequestMethod.POST)

@ResponseBody

public String testURI(HttpServletRequest request) throws UnsupportedEncodingException{

request.setCharacterEncoding("UTF-8");

String username = Parameter("username");

String nickname = Parameter("nickname");

System.out.println("姓名：" + username + ", 昵称：" + nickname);

return "姓名：" + username + ", 性别：" + nickname;

}

如果只设置URIEncoding=ISO-8859-1，request.setCharacterEncoding("UTF-8")；只会对请求体中的参数进⾏编码，所以username是乱码的。

example5: 在example4的基础上设置useBodyEncodingForURI="true"

设置useBodyEncodingForURI=true时，就会将请求参数和请求体中的参数根据

request.setCharacterEncoding或者contentType中的字符集编码。

本⽂先记录⾄此，参考⽂献有《深⼊分析Java web解析》《tomcat docs》

688IT编程网

Javaweb中常见编码乱码问题(一)

发表评论

推荐文章

如何打乒乓球英文作文

如何提高乒乓球水平英语作文

喜欢乒乓的原因英语作文

休闲娱乐打乒乓球英语作文

译林版六年级英语下册6B Unit1单元测试卷

热门文章

新沪教牛津版四年级下册小学英语全册单元测试卷(含听力音频文件)

译林版四年级上册英语期中试卷

运动项目的中英文表达方式

介绍乒乓球的英语作文

UPRIGHT NET FOR A TABLE TENNIS GAME

各种运动项目的英语单词

乒乓球规则英语介绍

济南1小学五年级上册英语阅读理解练习题含答案解析

英语乒乓术语资料

英语乒乓球比赛作文

四年级下册英语试题-Unit5 Sport 牛津上海版(三起)(含答案)

香港朗文2Bchapter5知识清单

如何练习打乒乓球英语作文

乒乓球术语中英文对照

Table tennis ball guard

TABLE TENNIS MACHINE

推荐乒乓球的英语作文

2008北京奥运会英语作文初二

关于推荐乒乓俱乐部的英语作文80词

我的爱好是打乒乓球英语作文10句话以内

最新文章

如何提高乒乓球水平英语作文

休闲娱乐打乒乓球英语作文

译林版六年级英语下册6B Unit1单元测试卷

一场乒乓球比赛不少于八句话英语作文

初一英语冠词试题答案及解析

外研社三起三年级下册英语全册教案

标签列表