Java中的编码与解码

前言:今天遇到一个问题,一个用户在登录的时候,出现登录失败。但是其他用户登录都是正常的,经过调试发现登录失败的用户的密码中有两个特殊字符: * 、#  。

特殊符号在提交表单的时候,出现了编码不一样的问题。那么编码是什么鬼??

1、什么是application/x-www-form-urlencoded字符串?

它是一种编码类型。

当URL地址里包含非西欧字符的字符串时,系统会将这些字符转换成application/x-www-form-urlencoded字符串。

表单提交时也是如此,当包含非西欧字符的字符串时,系统也会将这些字符转换成application/x-www-form-urlencoded字符串。

package com.app;
import java.io.UnsupportedEncodingException;
import java.net.URLDecoder;
import java.net.URLEncoder;

public class AA {
    public static void main(String[] args) {
        /**
         * 将application/x-www-form-urlencoded字符串 转换成普通字符串
         */
        String keyWord = "";
        try {
            keyWord = URLDecoder.decode("%E6%96%87%E6%A1%A3", "UTF-8");
        } catch (UnsupportedEncodingException e) {
            e.printStackTrace();
        }

        System.out.println(keyWord);

        /**
         * 将普通字符串转换成application/x-www-form-urlencoded字符串
         * 必须强调的是编码方式必须正确,如baidu的是gb2312,而google的是UTF-8
         */
        String urlStr = "" ;
        try {
            urlStr = URLEncoder.encode("文档", "Utf-8");
        } catch (UnsupportedEncodingException e) {
            e.printStackTrace();
        }
        System.out.println(urlStr);

    }
}

运行结果是:

文档
 %E6%96%87%E6%A1%A3

2、URLEncoder

在java1.3和早期版本中,返回一个新的被编码后的string,encode( ) 使用了平台的默认编码形式

编码:   public static String encode(String s)

解码:   public static String decode(String s)

在java1.4中及以后,要求用户自己指定编码形式,比如 "UTF-8" 、 "gb2312" 。

编码: public static String encode(String s, String encoding) throws UnsupportedEncodingException

解码: public static String decode(String s, String encoding) throws UnsupportedEncodingException

注意:如果你拿不定主意用哪种编码方式,那就选择UTF-8吧。它比其他任何的编码形式更有可能得到正确的结果。

3、为什么要编码?

答案:处理不同操作系统间的差异性

web设计者面临的众多难题之一便是怎样处理不同操作系统间的差异性。这些差异性能引起URL方面的问题:例如,一些操作系统允许文件名中含有空格符,有些又不允许。

大多数操作系统不会认为文件名中含有符号“#”会有什么特殊含义;但是在一个URL中,符号“#”表示该文件名已经结束,后面会紧跟一个fragment(部分)标识符。其他的特殊字符,  非字母数字字符集,它们在URL或另一个操作系统上都有其特殊的含义,表述着相似的问题。为了解决这些问题

我们在URL中使用的字符就必须是一个ASCII字符集的固定字集中的元素,具体如下:

1.大写字母A-Z
   2.小写字母a-z
   3.数字 0-9
   4.标点符 - _ . ! ~ * ‘ (和 ,)

如果向服务器提交数据中含有  / & ? @ # ; $ + = %,这些字符和所有其他字符就应该被编码。

编码过程非常简单,任何字符只要不是ASCII码数字,字母,或者前面提到的标点符,它们都将被转换成字节形式,每个字节都写成这种形式:一个“%”后面跟着两位16进制的数值。

空格是一个特殊情况,因为它们太平常了。它除了被编码成“%20”以外,还能编码为一个“+”。加号(+)本身被编码为%2B。

当/ # = & 和?作为名字的一部分来使用时,而不是作为URL部分之间的分隔符来使用时,它们都应该被编码。

4、如何编码?

类URL并不自动执行编码或解码工作。幸运的是,java提供了一个类URLEncoder把string编码成这种形式。

Java1.2增加了一个类URLDecoder它能以这种形式解码string。

5、网页中的表单使用POST方法提交时,数据内容的类型是 application/x-www-form-urlencoded,这种类型会:

1.字符"a"-"z","A"-"Z","0"-"9",".","-","*",和"_" 都不会被编码;
    2.将空格转换为加号 (+) ;
    3.将非文本内容转换成"%xy"的形式,xy是两位16进制的数值;
    4.在每个 name=value 对之间放置 & 符号

时间: 2024-12-12 05:24:59

Java中的编码与解码的相关文章

关于java中的编码问题

GET方式提交的数据不会受页面编码的影响,应该都是以iso8859-1方式编码提交到后台程序,在后台java代码中可以通过 String str1=new String(name.getBytes("iso8859-1"),"UTF-8"); 的方式对字符串解码,解决乱码问题. 关于java中的编码问题,布布扣,bubuko.com

java中的编码问题

一直在试图搞清楚java中的编码问题,也看了网上的一些文章,但还是云里雾里.直到最近看了方立勋老师的web课程,才略略明白一点. 在此记录一下自己的理解,看看自己能不能说清楚. 第一个问题:我在java代码中定义了一个字符串,它是什么编码? 字符串实质是一个char数组.那么char的编码,其实就是字符串的编码.那么char什么编码呢?为什么'中'字转int类型后的值是20013呢? char c = '中'; System.out.println(c); // 中 System.out.pri

http协议中的编码和解码

http://www.csdn1 2 3.com/html/itweb/20130730/29422_29378_29408.htm ****************************** 一.字符集与文字编码简介 1. 计算机如何显示文字 我们知道,计算机是以二进制的“形式”来保存和处理数据的,也 就是说,不管我们使用键盘进行输入,还是让计算机去读取一个文本文件,计算机得到的原始内容是一些二进制序列,当需要对这些二进制序列进行显示时,计算机 会依照某种“翻译机制”(也就是编码方式),取到

java利用Base64编码和解码图片文件

1.编码与解码代码如下所示: import java.awt.image.BufferedImage; import java.io.ByteArrayOutputStream; import java.io.File; import java.io.FileOutputStream; import java.io.IOException; import java.net.MalformedURLException; import java.net.URL; import javax.image

【js与jquery】javascript中url编码与解码

本文主要针对URI编解码的相关问题做了介绍,对Url编码中哪些字符需要编码.为什么需要编码做了详细的说明,并对比分析了Javascript 中和 编解码相关的几对函数 编码/解码 escape / unescape, encodeURI / decodeURI, encodeURIComponent / decodeURIComponent. [js与jquery]javascript中url编码与解码,布布扣,bubuko.com

js和C#中的编码和解码

原文:js和C#中的编码和解码 同一个字符串,用URL编码和HTML编码,结果是完全不同的. JS中的URL编码和解码 encodeURIComponent("text") //url编码 decodeURIComponent("text") //url解码 JS中的HTML编码和解码 escape("text") //html编码 unescape("text") //html解码 C#中的URL编码和解码 HttpUtil

嵌入式媒体处理(EMP)中的编码和解码

我知道,我对与电子有关的所有事情都很着迷,但不论从哪个角度看,今天的现场可编程门阵列(FPGA),都显得"鹤立鸡群",真是非常棒的器件.如果在这个智能时代,在这个领域,想拥有一技之长的你还没有关注FPGA,那么世界将抛弃你,时代将抛弃你.本公众号作者ALIFPGA,多年FPGA开发经验,所有文章皆为多年学习和工作经验之总结. 很多视频压缩算法都存在着竞争,都想获得业界和消费者的认可.它们的出现反映了一种趋势,即从单个设备上专门存储和播放媒体转向所谓流媒体概念,也就是说媒体内容在由无线或

Java 中需要编码的场景

I/O 操作中存在的编码 我们知道涉及到编码的地方一般都在字符到字节或者字节到字符的转换上,而需要这种转换的场景主要是在 I/O 的时候,这个 I/O 包括磁盘 I/O 和网络 I/O,关于网络 I/O 部分在后面将主要以 Web 应用为例介绍.下图是 Java 中处理 I/O 问题的接口: Reader 类是 Java 的 I/O 中读字符的父类,而 InputStream 类是读字节的父类,InputStreamReader 类就是关联字节到字符的桥梁,它负责在 I/O 过程中处理读取字节到

Java中需要编码的场景

一.I/O 操作中存在的编码 涉及到编码的地方一般都在字符到字节或者字节到字符的转换上,而需要这种转换的场景主要是在 I/O 的时候,这个 I/O 包括磁盘 I/O 和网络 I/O,关于网络 I/O 部分在后面将主要以 Web 应用为例介绍. 下图是 Java 中处理 I/O 问题的接口:       Reader 类是 Java 的 I/O 中读字符的父类,而 InputStream 类是读字节的父类,InputStreamReader 类就是关联字节到字符的桥梁,它负责在 I/O 过程中处理