微客导航 » 文章资讯 » Java截取中英文混合字符串的方法

Java截取中英文混合字符串的方法

2023-08-21 09:26:05 398

题目：

编写一个截取字符串的函数，输入为一个字符串和字节数，输出为按字节截取的字符串。但是要保证汉字不被截半个，如“我ABC”4，应该截为“我AB”，输入“我ABC汉DEF”，6，应该输出为“我ABC”而不是“我ABC+汉的半个”。

GB2312、GBK、GB18030，CP936以及CNS11643都满足条件--中文是占用2个字节的，英文是占用1一个字节。

因为中文转换为byte字节，随着编码的不同，转换的字节长度也会不通，如编码为UTF-8，一个中文字符串转换为byte占三个字节.

packagecom.suanfa;

importjava.io.UnsupportedEncodingException;

publicclassCharactersSplit{
/**
*@paramtext
*目标字符串
*@paramlength
*截取长度
*@paramencode
*采用的编码方式
*@return
*@throwsUnsupportedEncodingException
*/

publicstaticStringsubstring(Stringtext,intlength,Stringencode)
throwsUnsupportedEncodingException{
if(text==null){
returnnull;
}
StringBuildersb=newStringBuilder();
intcurrentLength=0;
for(charc:text.toCharArray()){
currentLength+=String.valueOf(c).getBytes(encode).length;
if(currentLength<=length){
sb.append(c);
}else{
break;
}
}
returnsb.toString();
}

publicstaticvoidmain(String[]args)throwsUnsupportedEncodingException{
Stringtext="我ABC汉DEF";
intlength1=3;
intlength2=6;
String[]encodes=newString[]{"GB2312","GBK","GB18030","CP936",
"CNS11643","UTF-8"};

for(Stringencode:encodes){
System.out.println(newStringBuilder().append("用").append(encode)
.append("编码截取字符串--【").append(text).append("】")
.append(length1).append("个字节的结果是【")
.append(substring(text,length1,encode)).append("】")
.toString());
System.out.println(newStringBuilder().append("用").append(encode)
.append("编码截取字符串--【").append(text).append("】")
.append(length2).append("个字节的结果是【")
.append(substring(text,length2,encode)).append("】")
.toString());
}

}
}

运行后输出：

用GB2312编码截取字符串--【我ABC汉DEF】3个字节的结果是【我A】
用GB2312编码截取字符串--【我ABC汉DEF】6个字节的结果是【我ABC】
用GBK编码截取字符串--【我ABC汉DEF】3个字节的结果是【我A】
用GBK编码截取字符串--【我ABC汉DEF】6个字节的结果是【我ABC】
用GB18030编码截取字符串--【我ABC汉DEF】3个字节的结果是【我A】
用GB18030编码截取字符串--【我ABC汉DEF】6个字节的结果是【我ABC】
用CP936编码截取字符串--【我ABC汉DEF】3个字节的结果是【我A】
用CP936编码截取字符串--【我ABC汉DEF】6个字节的结果是【我ABC】
用CNS11643编码截取字符串--【我ABC汉DEF】3个字节的结果是【我A】
用CNS11643编码截取字符串--【我ABC汉DEF】6个字节的结果是【我ABC】
用UTF-8编码截取字符串--【我ABC汉DEF】3个字节的结果是【我】
用UTF-8编码截取字符串--【我ABC汉DEF】6个字节的结果是【我ABC】

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持毛票票。

返回顶部
3162201930
czq8825@qq.com

Java截取中英文混合字符串的方法

热门推荐

随机推荐