1、使用getParam等方法获取请求参数时遇到乱码
浏览器发送的请求参数使用的编码就是打开网页时使用的编码。如果服务器端获取到发过来的请求参数,默认使用ISO8859-1进行解码操作,中文一定会有乱码问题。
post和get方法提交的数据区分对待:
对于Post方式提交的数据,request.setCharacterEncoding("gb2312");来明确指定获取请求参数时使用编码。注意,只对post方式有效。
对于Get方式,就只能手动编解码 String newName = new String(name.getBytes("ISO8859-1"),"gb2312");先编码再解码,此种方法对Post方式同样有效。在tomcat的
server.xml中可以配置http连接器的URIEncoding可以指定服务器在获取请求参数时默认使用的编码,从而一劳永逸的决绝获取请求参数时的乱码问题。也可以指定
useBodyEncodingForURI参数,令request.setCharacterEncoding也对GET方式的请求起作用,但是因为发布环境通常不允许修改此属性因此尽量不要使用。get方式处理起来比较繁
琐,所以jsp中尽量使用post方式提交数据。
2、使用request输出数据到客户端时产生乱码
浏览器使用系统默认平台字节码打开服务器发送的数据,如果服务器端使用了非平台码去输出字符的字节数据,就需要明确的指定浏览器编码时所用的码表,以防止乱码问题。
response.addHeader("Content-type","text/html;charset=gb2312"); response.getWriter().write(“中文”);输出数据,这是一个字符流,response会将此字符进行转码操作后输
出到浏览器,这个过程默认使用ISO8859-1码表,而ISO8859-1中没有中文,于是转码过程中用?代替了中文,导致乱码问题。可以指定response在转码过程中使用的目标码表,防止乱
码。response.setCharcterEncoding("gb2312");其实response还提供了setContentType("text/html;charset=gb2312")方法,更加简便。