【串口屏项目拓展】基于启英泰伦的离线语音控制与开发
本文介绍了基于启英泰伦CI1312语音芯片的串口屏语音控制拓展项目。项目在原有编码器操作基础上新增离线语音交互功能,包括定时提醒、亮度调节、动画管理、音量控制等。硬件采用CI1312语音芯片、8002A功放芯片、差分麦克风和4R/3W喇叭,通过UART接口实现通信。软件开发基于启英泰伦语音AI平台,支持零代码配置或SDK开发,详细说明了固件参数设置和命令词编辑流程。该方案实现了高效稳定的离线语音控
【串口屏项目拓展】基于启英泰伦的离线语音控制与开发
一、前言
语音模块是实现人机语音交互的核心组件,集成了语音识别(ASR)、语音合成(TTS)和音频处理功能,广泛应用于智能家居、工业控制和物联网设备中。它能将语音指令转化为控制信号,如“打开灯光”,也可将文本信息转为语音播报,如环境数据提醒。选型时需根据是否联网、音质要求、功耗和环境适应性综合考量,离线模块保障隐私与响应速度,联网方案支持更复杂的自然语言交互。

二、系统介绍
本项目在串口屏项目基础上新增语音控制功能,原项目具体内容请查看串口屏的应用该篇文章,本文主要讲解新增语音控制功能内容。
1.项目实现的功能
在现有编码器操作基础上,新增语音交互控制模块,实现以下功能扩展。
(1)基础语音控制功能:
● 定时提醒:支持久坐定时语音设定并提醒
● 亮度调节:支持语音指令调整屏幕亮度
● 动画管理:支持语音触发播放或取消动画播放
(2)进阶功能:
● 音量控制:音量大小调节功能
● 语音管理:支持语音启动或禁用
2.项目核心硬件组成
(1)语音芯片:采用启英泰伦CI1312(封装SOP16)第三代高性能神经网络智能语音芯片,集成了启英泰伦自研的脑神经网络处理器BNPU V3和CPU内核,系统主频可达220MHz,内置高达640KByte的SRAM和2MByte的Flash。且集成多模态语音识别、自适应学习系统及深度降噪算法等核心功能模块,还支持汉语、英语、日语等多种全球语言。

设计PCB板时可以将UART0通信引脚引出,方便对芯片进行固件升级。芯片的PA4引脚内置上拉电阻,上电默认为升级模式,时长为850ms。如果需缩短开机时间,可在PA4引脚与地之间串联两个2.2KΩ下拉电阻,在两电阻间若提供高电平信号也可触发开机升级模式。同时UART1通信引脚用于与主控芯片进行数据接收和发送的双向传输。

(2)功放芯片:8002A(封装SOP8)是一款AB类单声道桥式音频功率放大器,应用电路简单,只需要极少数外围器件,输出不需要外接耦合电容,适合低电压、低功耗音频应用方案上使用。单位增益稳定,通过配置外围电阻可以调整放大器的电压增益,方便应用。

SHUTDOWN端口作为功放芯片的模式控制引脚,可通过主控芯片输出的控制信号实现功放工作状态的切换,此目的不在于降低功耗,更多的是根据项目应用而控制转换。当控制信号为高电平时,功放进入关闭模式;当控制信号为低电平时,功放切换至正常工作模式。本项目中该引脚接地处理以确保功放持续处于正常工作状态。
芯片输出运放增益由内部电阻固定,而输入增益可通过外部电阻进行调节。增益设计计算公式为:
A v d = 2 ∗ ( R f / R i ) A~vd~=2*(R~f~ /R~i~) A vd =2∗(R f /R i ) ( R f 为原理图中的 R 5 , R i 为原理图中的 R 6 ) (Rf为原理图中的R5,Ri为原理图中的R6) (Rf为原理图中的R5,Ri为原理图中的R6)
输入的耦合电容选择如下,即可满足系统的性能:
C b y = 1 u F C~by~=1uF C by =1uF (电压基准端外接电容,为原理图中的 C 4 ) (电压基准端外接电容,为原理图中的C4) (电压基准端外接电容,为原理图中的C4)
C i = 0.1 u F C~i~=0.1uF C i =0.1uF (输入耦合电容,为原理图中的 C 6 ) (输入耦合电容,为原理图中的C6) (输入耦合电容,为原理图中的C6)
(3)麦克风:选用差分麦克风,其信号线长度应小于20cm,以减少干扰源。为确保语音识别效果,需将电源纹波控制在300mV内,并增加瞬态抑制二极管构建浪涌防护电路。


(4)喇叭:选用4R/3W规格的3370腔体喇叭,其低阻抗特性可有效匹配功放输出,同时需在电源供电设计中预留充足电流余量,以确保大动态信号驱动时的瞬态响应能力,避免因电流不足导致的失真或保护性关断。

三、项目软件开发
1.开发前期准备工作
本项目软件设计是通过启英泰伦语音AI平台开发,该平台提供完整的开发支持,可加速产品落地进程。开发者可通过官网(官网地址 )注册账号后,在“开发资料”栏目下载语音芯片规格书、开发工具及SDK代码等资料。同时,在“文档中心”提供详细的开发流程指南、软硬件协同开发说明及视频教程等内容。
开发者可根据项目需求灵活选择零代码开发或SDK代码开发。若采用SDK开发,需要搭建集成开发环境,具体操作可参考"文档中心"中"IDE搭建与使用"指南,该文档详细说明了Visual Studio Code编辑器的安装、工程管理插件的安装以及工程编译等内容。

2.软件零代码开发
(1)登录启英泰伦语音AI平台后,进入“功能开发”页面,在“产品开发”选项中选择“离线语音识别大模型应用”,进入该应用后再选择“语音识别固件及SDK开发”选项。


(2)点击“新建项目”后,然后在“产品信息”窗口内填写项目参数,可以将鼠标悬停在问号标志上即可查看详细说明。项目配置需包含单麦语音识别、芯片型号为CI1312、离线应用场景(ASR-Offline),其余参数可根据实际需求补充,填写完毕点击“创建”按钮进入下一页。

(3)根据实际需求选择并填写项目的基本信息,特别注意将模块板选项设置为“自定义”,接着点击“继续”按钮进入下一页。

(4)进入固件参数配置页面后,需结合项目需求及参数说明对参数选项进行微调。特别注意,麦克风输入模式应根据硬件配置选择并设置为“差分输入模式”,随后点击“继续”按钮进入下一页。



(5)进入编辑命令词页面后,选择合适的音色并调整语速和音量,播报音压缩比可根据芯片内置Flash大小选择。

点击“附件样例”下载文档并编辑命令词、播报语、通信协议等内容,详细定义说明可查看“填写说明”页面。还有自然说功能,可使命令词定义更口语化,提升实际应用体验,但需注意,启用此功能需完成企业认证。需注意以下要点:
● 语义标签:相同语义的标签需保持一致。
● 播报模式:主动模式无需接收协议通信,直接播报语音(适用于唤醒词、播报语、欢迎语、休息语和音量控制等,这些词可以不需要主控芯片的参与)。被动模式则需要识别到指定协议后才触发语音播报(建议用于命令词,这样可以确保命令词能有效被主控芯片识别)。
● 通信协议:有3种版本,可下载启英泰伦制作的批量生成自定义协议软件。


握手协议的格式应基于上述定义的语音通信协议进行填写,但需确保与前述协议不相同。在语音模块上电初始化阶段,主控芯片须与语音模块建立握手通信以确保数据传输的可靠性。

若后续语音识别功能需要修改SDK代码,则勾选“SDK选项”用于修改代码。自学习功能可根据具体应用场景和需求进行选择。最后点击“立即提交”按钮等待审核,确认无误后下载文件。

(6)解压下载的文件后,进入解压目录即可找到以.bin为后缀的烧录文件。同时,在SDK代码文件夹的“tools”子目录中,可找到“PACK_UPDATE_TOOL”固件升级工具并打开(或通过启英泰伦官方网站的“开发资料”专区下载该软件)。

选择芯片型号为“CI1312”,然后点击“固件升级”按钮。

固件路径选择为下载文件中的bin文件,然后使用USB转TTL串口工具连接语音模块的UART0升级串口,再将串口工具接入电脑USB端口。待固件升级工具识别到串口连接后,勾选操作界面的选择框,然后为语音模块上电,将自动更新并等待提示升级成功即可。

固件升级完成后,开发者可根据既定通信协议,在主控芯片端编写驱动代码,实现与语音芯片的指令交互。
(7)若后续需要修改语音指令则可以找到该项目进入版本管理,添加新的版本或选择“继承”按钮根据上一个版本的基础上进行修改。

3.软件SDK代码开发
(1)代码可以按上述步骤获取,也可以在英泰伦官方网站的“开发资料”专区下载。
(2)详细步骤可以参考官网提供的文档:软件开发步骤
(3)需注意以下要点:
● 打包固件:分区预留大小需要以4K字节(*n倍)形式预留才能适配。
● Flash大小:可以查看芯片数据手册进行修改。

四、项目效果测试
项目最终测试结果符合设计要求,下面是演示视频:测试视频

更多推荐



所有评论(0)