如何从字符串中删除非ASCII字符
Posix字符类\p{ASCII} 与ASCII字符匹配,而元字符^用作负数。
即以下表达式匹配所有非ASCII字符。
"[^\\p{ASCII}]"
replaceAll()
String类的方法接受正则表达式和替换字符串,并用指定的替换字符串替换当前字符串的字符(匹配给定的模式)。
因此,您可以使用replaceAll()
方法通过将匹配的字符替换为空字符串“来删除匹配的字符。
例子1
import java.util.Scanner; public class Exp { public static void main( String args[] ) { Scanner sc = new Scanner(System.in); String regex = "[^\\p{ASCII}]"; System.out.println("输入输入数据:"); String input = sc.nextLine(); String result = input.replaceAll(regex, ""); System.out.println("Result: "+result); } }
输出结果
输入输入数据: whÿ do we fall Result: wh do we fall
例子2
import java.util.Scanner; import java.util.regex.Matcher; import java.util.regex.Pattern; public class Example { public static void main( String args[] ) { Scanner sc = new Scanner(System.in); System.out.println("Enter input string: "); String input = sc.nextLine(); String regex = "[^\\p{ASCII}]"; //创建一个模式对象 Pattern pattern = Pattern.compile(regex); //匹配字符串中的已编译模式 Matcher matcher = pattern.matcher(input); //创建一个空的字符串缓冲区 StringBuffer sb = new StringBuffer(); while (matcher.find()) { matcher.appendReplacement(sb, ""); } matcher.appendTail(sb); System.out.println("Result: \n"+ sb.toString() ); } }
输出结果
Enter input string: whÿ do we fall Result: wh do we fall