python同义词替换的实现(jieba分词)
TihuanWords.txt文档格式
注意:同一行的词用单个空格隔开,每行第一个词为同行词的替换词。
年休假年假年休
究竟到底
回家场景我回来了
代码
importjieba
defreplaceSynonymWords(string1):
#1读取同义词表,并生成一个字典。
combine_dict={}
#synonymWords.txt是同义词表,每行是一系列同义词,用空格分割
forlineinopen("TihuanWords.txt","r",encoding='utf-8'):
seperate_word=line.strip().split("")
num=len(seperate_word)
foriinrange(1,num):
combine_dict[seperate_word[i]]=seperate_word[0]
print(seperate_word)
print(combine_dict)
#2提升某些词的词频,使其能够被jieba识别出来
jieba.suggest_freq("年休假",tune=True)
#3将语句切分成单词
seg_list=jieba.cut(string1,cut_all=False)
f="/".join(seg_list).encode("utf-8")
f=f.decode("utf-8")
print(f)
#4返回同义词替换后的句子
final_sentence=""
forwordinf.split('/'):
ifwordincombine_dict:
word=combine_dict[word]
final_sentence+=word
else:
final_sentence+=word
#printfinal_sentence
returnfinal_sentence
string1='年休到底放几天?'
print(replaceSynonymWords(string1))
结果
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持毛票票。
声明:本文内容来源于网络,版权归原作者所有,内容由互联网用户自发贡献自行上传,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任。如果您发现有涉嫌版权的内容,欢迎发送邮件至:czq8825#qq.com(发邮件时,请将#更换为@)进行举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。