产品概述
WT3000TX 把"让机器开口说话"做到了实用级别。基于 32 位处理器,主频跑到 240 MHz,语音合成的自然度和响应速度都在同价位芯片里拿得出手。
M01 模块把 WT3000T 芯片(T8 或 T3 版本可选)做成了方便接线的形态,该引的脚都引出来了,焊几根线就能用起来。除了在线语音合成,模块还支持播放内置 Flash 里的 MP3/WAV 文件,一颗芯片兼顾两种用法。
选 T8 还是 T3
同一个模块,芯片可以选 T8 或者 T3,两者的区别主要体现在合成能力和内置固定语音容量上。按实际需求的合成复杂度来定就好。
T8 版本
•中文 + 英文字母合成
•内置固定语音 30 秒
•适合简单语音提示场景
T3 版本
•支持中英文混读合成
•内置固定语音 500 秒
•适合复杂语音交互场景
M01 模块管脚(7 Pin)
引脚 1 — VCC
模块电源,2.6 V ~ 5.5 V,接系统电源正极。
引脚 2 — GND
电源地,和系统的 GND 连在一起。
引脚 3 — TX(输出)
模块串口发送,接 MCU 的 RX。
引脚 4 — RX(输入)
模块串口接收,接 MCU 的 TX,耐压 3.3 V。
引脚 5 — SPK+
喇叭输出正极,直接接 8 Ω 喇叭。
引脚 6 — SPK-
喇叭输出负极,直接接 8 Ω 喇叭。
引脚 7 — BUSY
状态指示:播放时低电平,空闲时高电平。
功能亮点
自然度在线的语音合成
T3 版本支持中英文混读,播报地址、商品名这类带英文字母的内容时不会显得生硬。合成引擎对多音字、数字读法、儿化音都有处理,拿到手的合成效果基本不需要再花时间调教。
BUSY 状态脚省去轮询
模块提供了一个 BUSY 输出脚,播放期间拉低,播完自动释放。外部 MCU 既可以通过串口查询状态,也可以直接读这个 GPIO,省去了定时轮询的麻烦,也降低了通信误判的概率。
20 μA 深度休眠
发一条指令就能让模块进入深度休眠,电流掉到 20 μA 以下。用电池供电的设备(比如物联网节点、便携式仪器仪表)用这个特性能把待机功耗压得很低。唤醒不需要复位,发任意有效指令就能让模块恢复工作。
文本标记灵活调效果
T3 版本支持在待合成文本里插入标记符号,实时调整音量、语速、音调、发音人,不需要重新发码或者改全局设置。做多语言播报或者需要强调某句话的时候,这条很好用。
串口通信协议
指令格式
0x7E + 帧长度 + 流水号 + 应答标志 + 数据来源 + 命令 + 数据 + 校验和 + 0xEF
每帧以 0x7E 开头、0xEF 结尾。长度字节指"命令 + 数据 + 校验和"的字节数。校验和为前面所有字节累加和的低字节。
文本标记符号(T3 版本支持)
[v?] 设置音量(0-10)
[s?] 设置语速(0-10)
[y?] 设置音调(0-10)
[m?] 设置发音人(0-3)
[i?] 插入静音(×10 ms)