1.深度神经网络语音识别技术(DNN-HMM)安静环境下识别率95%
2.离线1-3米远场识别以及150条离线命令词条 封装形式sop16/ssop24/QFN32
3.CPU 主频可达 160 MHz,支持硬件浮点运算,内置 1MBytes SPI Flash 存储器
4.采样率8KHz -48KHz,电源VCC 为 2.2V 至 5.5V VOUT 为 2.2V 至 3.6V
5.工作温度:-40℃至+85℃ 储存温度:-65℃至+150℃ 功耗15-20mA
WTK6900HA为本地语音触发引擎的辨识模块。该模块基于目前最先进的深度神经网络(DNN-HMM)语音识别技术,实现了高识别率、高实时性、本地和云端结合、高度一体化的语音识别及处理功能;可以实现语义识别等特定智能语音交互效果。同时该模块具备常规MCU的控制及计算处理能力,可以实现各类需要通信及控制的应用。
在应用方面,该模块可以支持本地语音检测、唤醒,支持离线1-3米远场识别以及150条离线命令词条。模块可通过UART将命令推送到设备原有的上位机,实现简单的语音交互接口。该模块方案支持汉语、英语,可广泛应用于家电、照明、玩具、可穿戴设备等产品领域,实现语音交互及控制和各类智能语音方案应用。
管脚相关
WTK6900HA模块尺寸图
WTK6900HA-24SS模块封装管脚图
管脚号
信号名称
功能说明
1
MIC+
接麦克风正极
2
MIC-
接麦克风负极
3
SPK+
喇叭接线端正极
4
SPK-
喇叭接线端负极
5
WTK6900HA-24SS
语音识别芯片
6
WT8002
功放芯片
7
喇叭工作指示灯
不工作时亮红色,工作时灭
8
电源指示灯
供电正常时亮绿色,没有供电时灭
9
VCC
电源输入(2.2.~5.5V)
10
GND
11
TX
UART 异步串口数据输出
12
RX
UART 异步串口数据输入
13
供电口
TYPE-C供电输入(5V/1A/2A)
以下为标准词条举例说明,具体情况请用户以购买、定制的实例为准。根据不同用户的个性需求,模块词组分为开机语、唤醒词、命令词、回复语、退出休眠语。
(1)开机语:模块上电会自动播报一段语音,之后开始识别唤醒词。如“欢迎使用唯创语音识别芯片请喊小唯小唯唤醒我”。
(2)唤醒词:用于将模块在睡眠状态中唤醒,使其进入下一阶段的命令词识别。
(3)命令词:根据用户的需求,可以定制各式的命令词。在模块识别到命令词时,会通过自身串口输出对应命令词通讯数据,同时进行回复语播报。如识别到命令词“打开灯光”,串口输出“7E 06 FF 06 01 02 0E EF”,同时语音播报“打开灯光”。每个用户的命令词、回复语各有不同,请以购买、定制的实例为准。
(4)回复语:回复语为语音模块播放的语音。
(5)退出休眠语:若模块在规定时间内未识别到命令词,进而在进入睡眠之前播报一段语音,如10S内未识别到命令词,模块播报“退下了”。
标准词条示例如下表所示:
序号
词组
词条
回复语
模块UART串口输出
0
开机语
欢迎使用唯创语音识别芯片请喊小唯小唯唤醒我
10S自动退出唤醒
退下了
7E 06 FF 06 01 FE 0A EF
唤醒词
小唯小唯
我在
7E 06 FF 06 01 01 0D EF
命令词
打开灯光
7E 06 FF 06 01 02 0E EF
关闭灯光
7E 06 FF 06 01 03 0F EF
调亮灯光
7E 06 FF 06 01 04 10 EF
调暗灯光
7E 06 FF 06 01 05 11 EF
调到黄光
7E 06 FF 06 01 06 12 EF
调到白光
7E 06 FF 06 01 07 13 EF
调到自然光
7E 06 FF 06 01 08 14 EF
模块工作流程图如下图所示:
注:主动播报为模块识别到相应命令词后即进行语音回复语播报。被动播报为MCU向模块发送相应回复语的数据协议,进而被动进行播报。除了识别发送串口之外,也可以进行识别后的播报(具体可联系我司)。
粤公网安备 44030602001141号