如何使用Python构建语音识别机器人

即使你对演讲识别一无所知


你现在可能已经实现了一些东西。

支持讲话的产品的压倒性成功 亚马逊亚历克萨 已证明某些程度的言论支持将成为可预见的未来家庭技术的重要方面。

换句话说,启用语音的产品是游戏更换器,因为它提供了很少的技术可以匹配的交互性和可访问性。

没有必要的gui。

不需要短信。

AI时间期刊资源
你学习数据科学吗?

Check out what 图书 帮助20多个成功的数据科学家在他们的职业生涯中成长。

没有必要的表情符号。

这全都是关于 速度

速度是一个大的原因,声音准备成为下一个主要的用户界面。每十年,我们已经采用了一种与技术互动的新方法。我们已经从字符模式发展到了一个图形用户界面,到Web到移动到移动。

声音现在提供更快,更简单的方式来沟通和完成任务而不是移动应用程序。 

我们可以告诉alexa我们需要的东西(关闭灯,调整恒温器,并设置一个闹钟 - 或者以上所有的单个话语,如“alexa,晚安”),或者你可以拉开你的手机,解锁它,打开合适的应用程序,然后执行任务或任务。 

当您考虑习惯性用例时 - 将客户带回随时间后退的人 - 通过语音获得的效率随着时间的推移而增加。

“由于未来的发短信是因为 Alexa” 


- Gary Vaynerchuk.

Gary Vaynerchuk.:声音让我们更快地说

因此,这让我非常有兴趣开始使用Python建立一个简单的语音识别。

当然,我不会从头开始构建代码,因为这需要大量培训数据和计算资源以以一种体面的方式使语音识别模型精确。

相反,我用过 Google语音识别API与Python执行语音到文本任务 (看看下面的演示,我向你展示了语音识别如何工作 - Live!)。

在本文结束时,我希望您可以更好地了解语音识别如何运作,最重要的是,如何使用Google语音识别API与Python实现。 

相信我。这很简单。

随意看看 这里的源代码 如果你有兴趣。

让我们开始吧!


为什么Google语音识别API?

你可能想知道,“这是鉴于越来越多的语音识别的需求和普及的唯一API吗?”

答案是还有其他API可用于免费或付费服务,如下所示:

最后,我选择了 Google Web演讲API 来自 语音识别库有一个默认的API键,它是硬编码的语音识别库。 

这意味着您可以立即开始立即开始,而无需使用API​​密钥或其他API的用户名/密码组合来获得身份验证。

但是,方便起见 Google Web演讲API 还有一定的限制: 您自己密钥的API配额是每天50个请求,目前无法提高此限制。

如果我们只想使用此API以进行实验目的,这适合我们的用例。请注意,如果您正在运行一个应用程序或一直调用API的网站,那么您可能需要考虑从上面的任何一个API获取付费服务。 

使用Google语音识别API与Python构建语音识别 

(来源)

为避免对您的技术细节无聊,您可以阅读如何读到这一点 关于谈论机制的文章,以及如何实现API.

在下面的写作中,我将向您展示我如何按照文章逐步实现此API。 

但首先,您需要安装 语音识别library using pip install SpeechRecognition

我们可以使用来自此库本身的Google Web语音API。

在此实现中,我使用自己的麦克风录制了我的声音,语音识别器访问了麦克风 (安装 Pyaudio包 访问麦克风) 并相应地认识到我的声音。

查看下面的代码段以了解完整的实施,因为它们是相对不言自明的。

识别来自麦克风的语音的功能

To handle ambient noise, you’ll need to use the adjust_for_ambient_noise()method of the Recognizer class in order for the library to recognize your voice. 

After running the adjust_for_ambient_noise()method, wait for a second and let it analyze the audio source collected in order to handle ambient noise and capture correct speech.

Lastly, we need to implement try and exceptblock to handle errors such as when the API is unreachable or unresponsive after sending requests, or when our speech is unrecognizable. 

要使用上面的函数,您只需实施下面的块...Voilà!你做到了! -

使用Google语音识别API的简单演示

现在我们准备好了完整的实现代码。现在是时候了解这件事是有效的。

我录制了一个短视频来展示API如何从录制我的声音以以文本格式返回它。 

虽然这可能似乎无法过于准确,但我们可能预期的东西,这绝对值得与代码和API一起玩的时间!


最后的想法

(来源)

谢谢阅读。

我希望您现在更好地了解语音识别如何运作,最重要的是,如何使用Google语音识别API与Python实现该方法。

随意看看 这里的源代码 如果你有兴趣。

我还建议您尝试其他API来比较语音到文本的准确性。 

尽管启用了讲话的产品,但在这个阶段没有广泛应用于企业和日常生活,我真的相信这项技术会破坏大量企业以及消费者如何使用具有语音识别功能的产品,迟早。

一如既往,如果您有任何疑问或评论随意留下您的反馈,或者您可以随时接触到我 linkedin.。到那时,在下一篇文章中见到你! -


有关 Author

Admond Lee. 被称为高度追捧之一 数据科学家和顾问 在帮助初创创始人和各种公司使用具有强大专业知识的数据来解决他们的问题 数据科学咨询和行业知识.

你可以与他联系 linkedin., 中等的, 推特, 和 Facebook 或者 在这里预约电话预约 如果您正在寻找贵公司的数据科学咨询。与Admond Lee一起在线预订
Admond Lee.被称为备受追捧的数据科学家和顾问之一,帮助初创创始人和......比特

贡献者

 & AI为教育2019年倡议 Committee Member

数据科学咨询|数据科学家|扬声器|顶级作家@medium.

贡献者表达的意见是他们自己的意见。

关于Admond Lee.

 & AI为教育2019年倡议 Committee Member 数据科学咨询|数据科学家|扬声器|顶级作家@medium.

查看Admond Lee的所有帖子→