python之语音识别speech模块

2023-07-17 00:42:03 382

1.原理

语音操控分为语音识别和语音朗读两部分。

这两部分本来是需要自然语言处理技能相关知识以及一系列极其复杂的算法才能搞定，可是这篇文章将会跳过此处，如果你只是对算法和自然语言学感兴趣的话，就只有请您移步了，下面没有一个字会讲述到这些内容。

早在上世纪90年代的时候，IBM就推出了一款极为强大的语音识别系统-viovoice,而其后相关产品层出不穷，不断的进化和演变着。我们这里将会使用SAPI实现语音模块。

2.什么是SAPI？

SAPI是微软SpeechAPI,是微软公司推出的语音接口，而细心的人会发现从WINXP开始，系统上就已经有语音识别的功能了，可是用武之地相当之少，他并没有给出一些人性化的自定义方案，仅有的语音操控命令显得相当鸡胁。那么这篇文章的任务就是利用SAPI进行个性化的语音识别

代码

前提：打开win7的语音自动识别（控制面板--轻松访问--语音识别）

#!/usr/bin/envpython
#-*-codinfg:utf-8-*-
'''
@author:JeffLEE
@file:.py
@time:2018-07-1911:15
@desc:
'''
fromwin32com.clientimportconstants
importos
importwin32com.client
importpythoncom

speaker=win32com.client.Dispatch("SAPI.SPVOICE")


classSpeechRecognition:
def__init__(self,wordsToAdd):
self.speaker=win32com.client.Dispatch("SAPI.SpVoice")
self.listener=win32com.client.Dispatch("SAPI.SpSharedRecognizer")
self.context=self.listener.CreateRecoContext()
self.grammar=self.context.CreateGrammar()
self.grammar.DictationSetState(0)
self.wordsRule=self.grammar.Rules.Add("wordsRule",constants.SRATopLevel+constants.SRADynamic,0)
self.wordsRule.Clear()
[self.wordsRule.InitialState.AddWordTransition(None,word)forwordinwordsToAdd]
self.grammar.Rules.Commit()
self.grammar.CmdSetRuleState("wordsRule",1)
self.grammar.Rules.Commit()
self.eventHandler=ContextEvents(self.context)
self.say("Startedsuccessfully")
defsay(self,phrase):
self.speaker.Speak(phrase)

classContextEvents(win32com.client.getevents("SAPI.SpSharedRecoContext")):
defOnRecognition(self,StreamNumber,StreamPosition,RecognitionType,Result):
newResult=win32com.client.Dispatch(Result)
print("你在说",newResult.PhraseInfo.GetText())
speechstr=newResult.PhraseInfo.GetText()
#下面即为语音识别信息对应,打开响应操作
ifspeechstr=="记事本":
os.system('notepad')
elifspeechstr=="写字板":
os.system('write')
elifspeechstr=="画图板":
os.system('mspaint')
else:
pass

if__name__=='__main__':

speaker.Speak("语音识别开启")
wordsToAdd=["记事本","写字板","画图板",]
speechReco=SpeechRecognition(wordsToAdd)
whileTrue:
pythoncom.PumpWaitingMessages()

调试遇到问题

python调用语音模块时，遇见TypeError:NoneTypetakesnoarguments这种错误类型该如何解决

报错的原因是：不能调用语音开发包

解决方法：(如果你已经安装了pyWin32，它也安装了PythonWin)

1.在python35目录中找到pythonwin文件夹下的pythonwin.exe

2.双击Pythonwin运行，然后选择工具tools/commakepyutility

3.然后选择MicrosoftSpeechObjectLibrary5.4，点击OK键

4.运行结果如下，问题解决

后记

推荐一个不错的语音识别文档：https://www.nhooo.com/article/195212.htm

到此这篇关于python之语音识别speech模块的文章就介绍到这了,更多相关python语音识别内容请搜索毛票票以前的文章或继续浏览下面的相关文章希望大家以后多多支持毛票票！

声明：本文内容来源于网络，版权归原作者所有，内容由互联网用户自发贡献自行上传，本网站不拥有所有权，未作人工编辑处理，也不承担相关法律责任。如果您发现有涉嫌版权的内容，欢迎发送邮件至：czq8825#qq.com（发邮件时，请将#更换为@）进行举报，并提供相关证据，一经查实，本站将立刻删除涉嫌侵权内容。

python之语音识别speech模块

热门推荐

随机推荐