java 中HashCode重复的可能性
java中HashCode重复的可能性
今天有同事提议用String的hashcode得到int类型作为主键。其实hashcode重复的可能性超大,下面是java的缺省算法:
publicinthashCode(){
inth=hash;
if(h==0){
intoff=offset;
charval[]=value;
intlen=count;
for(inti=0;i
但是什么情况下会重复?下面是测试代码
importjava.util.HashMap;
publicclassTest{
staticHashMapmap=newHashMap();
privatestaticcharstartChar='A';
privatestaticcharendChar='z';
privatestaticintoffset=endChar-startChar+1;
privatestaticintdup=0;
publicstaticvoidmain(String[]args){
intlen=3;
char[]chars=newchar[len];
tryBit(chars,len);
System.out.println((int)Math.pow(offset,len)+":"+dup);
}
privatestaticvoidtryBit(char[]chars,inti){
for(charj=startChar;j<=endChar;j++){
chars[i-1]=j;
if(i>1)
tryBit(chars,i-1);
else
test(chars);
}
}
privatestaticvoidtest(char[]chars){
Stringstr=newString(chars).replaceAll("[^a-zA-Z_]","").toUpperCase();//195112:0
//Stringstr=newString(chars).toLowerCase();//195112:6612
//Stringstr=newString(chars).replaceAll("[^a-zA-Z_]","");//195112:122500
//Stringstr=newString(chars);//195112:138510
inthash=str.hashCode();
if(map.containsKey(hash)){
Strings=(String)map.get(hash);
if(!s.equals(str)){
dup++;
System.out.println(s+":"+str);
}
}else{
map.put(hash,str);
//System.out.println(str);
}
}
}
在A-z范围内有特殊字符,从结果看,仅仅3位长度的字符串:
不处理:138510次重复
去掉字母意外字符:122500次重复
所有字符转小写:6612次重复(少了很多)
去掉字母意外字符,并且转小写:没有重复!4位字符串也没见重复
不难看出:
1.缺省实现为英文字母优化
2.字母大小写可能导致重复
可能:
长字符串可能hashcode重复
中文字符串和特殊字符可能hashcode重复
感谢阅读,希望能帮助到大家,谢谢大家对本站的支持,如有疑问请留言或者到本站社区交流讨论,大家共同进步!