微客导航 » 文章资讯 » java 使用URLDecoder和URLEncoder对中文进行处理

java 使用URLDecoder和URLEncoder对中文进行处理

2024-02-28 18:04:03 408

java 使用URLDecoder和URLEncoder对中文进行处理

一URLEncoder

HTML格式编码的实用工具类。该类包含了将String转换为application/x-www-form-urlencodedMIME格式的静态方法。有关HTML格式编码的更多信息，请参阅HTML规范。

对String编码时，使用以下规则：

字母数字字符"a"到"z"、"A"到"Z"和"0"到"9"保持不变。
特殊字符"."、"-"、"*"和"_"保持不变。
空格字符""转换为一个加号"+"。

所有其他字符都是不安全的，因此首先使用一些编码机制将它们转换为一个或多个字节。然后每个字节用一个包含3个字符的字符串"%xy"表示，其中xy为该字节的两位十六进制表示形式。推荐的编码机制是UTF-8。但是，出于兼容性考虑，如果未指定一种编码，则使用相应平台的默认编码。

例如，使用UTF-8编码机制，字符串"Thestringü@foo-bar"将转换为"The+string+%C3%BC%40foo-bar"，因为在UTF-8中，字符ü编码为两个字节，C3（十六进制）和BC（十六进制），字符@编码为一个字节40（十六进制）。

二URLDecoder

该类包含了将String从application/x-www-form-urlencodedMIME格式解码的静态方法。

该转换过程正好与URLEncoder类使用的过程相反。假定已编码的字符串中的所有字符为下列之一："a"到"z"、"A"到"Z"、"0"到"9"和"-"、"_"、"."以及"*"。允许有"%"字符，但是将它解释为特殊转义序列的开始。

转换中使用以下规则：

字母数字字符"a"到"z"、"A"到"Z"和"0"到"9"保持不变。
特殊字符"."、"-"、"*"和"_"保持不变。
加号"+"转换为空格字符""。

将把"%xy"格式序列视为一个字节，其中xy为8位的两位十六进制表示形式。然后，所有连续包含一个或多个这些字节序列的子字符串，将被其编码可生成这些连续字节的字符所代替。可以指定对这些字符进行解码的编码机制，或者如果未指定的话，则使用平台的默认编码机制。

该解码器处理非法字符串有两种可能的方法。一种方法是不管该非法字符，另一种方法是抛出IllegalArgumentException异常

简单示例：

try{
StringencodeStr=URLEncoder.encode("中国","utf-8");
System.out.println("处理后:"+encodeStr);
StringdecodeStr=URLDecoder.decode(encodeStr,"utf-8");
System.out.println("解码:"+decodeStr);
}catch(UnsupportedEncodingExceptione){
//TODOAuto-generatedcatchblock
e.printStackTrace();
}

运行结果：

处理后:%E4%B8%AD%E5%9B%BD
解码:中国

感谢阅读，希望能帮助到大家，谢谢大家对本站的支持！

返回顶部
3162201930
czq8825@qq.com

java 使用URLDecoder和URLEncoder对中文进行处理

热门推荐

随机推荐