概述:
WT3000A在线语音识别方案是基于离线语音识别芯片为基础,集成了在线语音识别引擎、词条规则引擎、NLP自然语言处理引擎、在线TTS引擎、流媒体上传下载播放等技术,通过连接网络实现了对全球主流语言识别的支持,可广泛应用于智能家居、AI对话、提示播报类产品;
产品具有低成本、低功耗、高可靠性、通用性强等特点,QFN32封装,4*4mm体积小;用内置BLE或外部集成WIFI、4G通信组件,赋予千行百业产品语音交互能力,让您的产品轻松对接AI大模型;我们相信通过我们的技术及开放服务可以助您产品成功一臂之力。
(离在线语音识别方案演示)
产品服务:
我们可提供套片与模组方案,支持wifi、BLE、4G、UART串口通信传输,提供模块/套片产品服务,开放API及硬件通信协议便于快速集成。
产品特点:
Ø 芯片的工作电压范围2.6V-5.0V;
Ø WT2605CX芯片为双模蓝牙,即音频蓝牙和数传蓝牙,双模蓝牙功能符合蓝牙5.0和BLE规范;
Ø 蓝牙上电后,音频蓝牙默认不开启,仅开启BLE蓝牙,BLE蓝牙名称为:BLE_WT2605C;
Ø 蓝牙晶振参数:24MHZ _9PF,±10PPM,具体型号参考可与本司业务沟通;
Ø 蓝牙连接距离尽量保持在10M以内,蓝牙芯片布局请参考本司相关文档说明;
Ø 采用WT2605CX芯片芯片为核心,最大可支持外挂128Mbit SPI-Flash;SPI-Flash存放为固定音源区(可更新);
Ø USB接口作用:支持U盘升级语音IC固件;支持USB连接到电脑拷贝音频文件到外置Flash中;U盘最大支持32G;
Ø 标准UART通信接口,可以灵活实现指定地址播放、指定文件名播放、音量级数、播放停止;
Ø 支持FAT、FAT32文件系统,支持MP3格式;
Ø 典型TX输出功率+2db;
Ø 音频编解码器支持16位立体声DAC和两个通道16位ADC;
Ø 高性能立体声,ADC具有90dB的信噪比;
Ø 重点注意:语音芯片如果需要挂flash。建议使用“唯创”出的flash,其他厂商的flash,不能保证可以正常工作。(建议将150mil和208mil尺寸兼容扩展画上,更方便备货);
Ø 支持U盘升级模块固件程序,建议画板时预留出USB接口;
专用解决方案:
1. 离在线识别方案
离在线识别芯片方案,支持离线唤醒,词条可在线修改、自动下发,无需在本地训练。支持51国语种22种国内方言切换,灵活创建识别词条,自定义个性回复音:可通过APP内进行TTS、录音、上传本地音频,创建专属化词条。同时支持离线UART串口对接协议,用于开发者MCU对接,控制本地自有设备,如灯控、屏显、电机等。
2. 蓝牙更新方案
蓝牙更新方案,通过BLE传输MP3 音频数据,支持APP内进行TTS文本合成、录音、上传本地音频到语音芯片外置存储中(最大可挂载128Mbit Flash)。MCU发送UART指令控制语音芯片播放、停止、音量大小调节等。同时支持数据透传功能,使能芯片IO口,进入或退出BLE透传。
3. AI对话方案
AI对话:按键/手机APP拾音,流媒体上传、流媒体播放下载,支持按键打断、音量调节,开放API接口,具备集成大模型能力。目前AI对话支持以下技能:支持角色创建、对话、天气、故事、新闻、自定义企业知识库等。
管脚介绍:
应用范围: