语音控制方案大致如下:
语音->语音采集器->语音识别器--(识别结果)-->命令执行设备
其中语音识别器因为牵扯大量计算,所以要求高性能,一般为手机或电脑(单片机无法胜任)。
常用方案通常有2套
1. 语音采集器和语音识别器分离方案(在线识别):
你可以使用一个低成本的硬件当作客户端设备并充当语音采集器,当获取到用户的语音数据后,将其上传云端服务器,服务器识别后将语音文本回传到客户端设备,客户端设备通过比对(strcmp)发送相应的命令到RS232设备。
(其中客户端设备通过232直连设备)
优点:性能高,可以完成各种高难度识别。
缺点:需要联网,稳定性依赖网络。
相关方案:科大讯飞方案(在线),DuerOS方案
1. 语音采集器和语音识别器合并方案(离线识别):
使用一个强大的硬件作客户端设备,它既能采集语音又能本地识别,识别完成后比对识别后文本并发送命令到RS232设备。
(其中客户端设备通过232直连设备)
优点:无需联网。
缺点:识别能力一般,有些需要训练。
相关方案:科大讯飞方案(离线),HTK,sphinx
PS:以上方案均有现成资料。自己玩没问题,如果要商用,除了sphinx,其他都需要科大讯飞/百度/微软授权(或付费)。
我本人玩过HTK,使用一台笔记本(linux系统)作语音采集器和语音识别器,通过识别简单语音命令(“红色”,“绿色”,“蓝色”),然后通过串口将识别信息发送给51来控制LED。
语音控制方案大致如下:
语音->语音采集器->语音识别器--(识别结果)-->命令执行设备
其中语音识别器因为牵扯大量计算,所以要求高性能,一般为手机或电脑(单片机无法胜任)。
常用方案通常有2套
1. 语音采集器和语音识别器分离方案(在线识别):
你可以使用一个低成本的硬件当作客户端设备并充当语音采集器,当获取到用户的语音数据后,将其上传云端服务器,服务器识别后将语音文本回传到客户端设备,客户端设备通过比对(strcmp)发送相应的命令到RS232设备。
(其中客户端设备通过232直连设备)
优点:性能高,可以完成各种高难度识别。
缺点:需要联网,稳定性依赖网络。
相关方案:科大讯飞方案(在线),DuerOS方案
1. 语音采集器和语音识别器合并方案(离线识别):
使用一个强大的硬件作客户端设备,它既能采集语音又能本地识别,识别完成后比对识别后文本并发送命令到RS232设备。
(其中客户端设备通过232直连设备)
优点:无需联网。
缺点:识别能力一般,有些需要训练。
相关方案:科大讯飞方案(离线),HTK,sphinx
PS:以上方案均有现成资料。自己玩没问题,如果要商用,除了sphinx,其他都需要科大讯飞/百度/微软授权(或付费)。
我本人玩过HTK,使用一台笔记本(linux系统)作语音采集器和语音识别器,通过识别简单语音命令(“红色”,“绿色”,“蓝色”),然后通过串口将识别信息发送给51来控制LED。
举报