王新新 孔庆奎
(山东电子职业技术学院 济南 250200)
摘 要 语音识别技术在高档乘用车媒体系统中已有应用,但在车辆操控方面的应用还不多见。本研究旨在解决汽车电动座椅人性化设计不足问题,采用非特定语音识别和单片机控制技术,控制汽车电动座椅在特定方向上的调节。经过改装测试,在车内静音环境中,拾音距离50cm,指令识别率在90%以上,动作执行率达到100%。本系统整体工作稳定,实时性良好。
教育期刊网 http://www.jyqkw.com
关键词 汽车电动座椅,语音识别(ASR),控制技术,位置调整
doi:10.3969/j.issn.1674-7933.2015.04.003
作者简介:王新新,男,1968 年生,硕士,教授,主要从事及研究领域:电路与系统、电子电路设计,Email :wxxchina@yeah.net ;孔庆奎,硕士,副教授。
0 引言
语音识别技术在高档乘用车媒体系统中已有应用,但在车辆操控方面的应用还不多见。本设计采用非特定语音识别及单片机控制技术,实现了声控操作汽车电动座椅。投入不足二百元,即可对现有汽车电动座椅进行改装。
1 系统组成
系统由语音识别模块、控制单元、执行机构、指示装置、电源模块五部分组成。语音识别模块负责接收驾驶员发出的声音指令,并对各种指令进行识别,然后将不同指令对应的编码发送给控制单元。控制单元对接收到的编码进行判断,依据判断结果和软件程序指令确定执行的动作。执行机构负责执行具体动作。指示装置根据驾驶员发出的指令,配合执行机构,给以相应的信号指示。电源模块为各部分提供电力支持。
2 系统硬件设计
2.1 语音识别模块
语音识别模块采用非特定语音识别芯片LD3320。
LD3320芯片集成了语音识别处理器和外部电路,包括AD和DA转换器、麦克风、声音输出等接口,不需要外接任何辅助芯片如flash、RAM等[1~2],直接集成即可实现语音识别/声控/人机对话功能,其识别的教育期刊网 http://www.jyqkw.com
关键词 语列表是可以任意动态编辑的,能够满足低功耗、体积小、可通用等要求[3]。
语音识别芯片LD3320首先对拾音器(MIC)输入的声音进行频谱分析,提取出语音特征,然后与教育期刊网 http://www.jyqkw.com
关键词 语列表中的教育期刊网 http://www.jyqkw.com
关键词 语进行对比匹配,找出得分最高的教育期刊网 http://www.jyqkw.com
关键词 语,再输出该教育期刊网 http://www.jyqkw.com
关键词 语识别码(ID)。
教育期刊网 http://www.jyqkw.com
关键词 语以拼音字符串的形式输入LD3320,教育期刊网 http://www.jyqkw.com
关键词 语的ID值也同时一并输入。如“座椅向前”的拼音字符串为“zuoyixiangqian”,ID为“01”,它们同时输入到LD3320。
为提高语音识别率,模块添加了一些“垃圾教育期刊网 http://www.jyqkw.com
关键词 语”进入识别列表,用来吸收错误识别。语音识别时,只有“座椅向前”“升高”等9个教育期刊网 http://www.jyqkw.com
关键词 语是可执行的。如果识别结果是“垃圾教育期刊网 http://www.jyqkw.com
关键词 语”,则说明是其他声音导致的误识别,设备没有执行动作,将会等待并开始一次新的识别过程。比如,我们设置了“座椅向前”“升高”等9个教育期刊网 http://www.jyqkw.com
关键词 语,另外再设置10~20个发音相近的“垃圾教育期刊网 http://www.jyqkw.com
关键词 语”,如“坐姿好看”“崇高”等进入识别列表,这样可以降低误识别,进一步提高设备的可靠性和稳定性。
不同的教育期刊网 http://www.jyqkw.com
关键词 语可以对应同一个ID,而ID也可以是不连续的。例如:教育期刊网 http://www.jyqkw.com
关键词 语“升高”和“up”,可以设置为同一个ID,后续进行同样的处理,同样都执行座椅升高动作。把“垃圾教育期刊网 http://www.jyqkw.com
关键词 语”的ID都标记成一个值,这样编写的处理程序比较简单,避免添加进很多教育期刊网 http://www.jyqkw.com
关键词 语后,增加过多的程序分支[4]。
2.2 控制单元
控制单元采用物美价廉的STC89C52 RC,晶振采用11.0592MHz,语音识别模块与单片机之间采用串行通信方式,波特率为9600bit/s,使用方式3。LD3320的TXD端输出到单片机的串行通信接口RXD,如图2所示。单片机对接收到的数据进行判断,依据判断结果和软件程序指令,确定单片机P1口各引脚的电位。单片机所有I/O口在系统上电复位时全部置1。
以座椅“向前—向后”控制为例,当驾驶员发出“座椅向前”的指令时,经语音识别模块识别处理后,向单片机发出相应的编码(教育期刊网 http://www.jyqkw.com
关键词 语ID)。单片机接收该编码,由内部硬件将串行口控制寄存器的RI置1,向CPU发出中断请求。在满足中断响应条件的情况下,单片机自动中断正在执行的程序,转而跳到该中断源对应的中断入口地址处,执行中断服务程序。中断服务程序首先关闭串口中断,防止在中断处理过程中出现新的中断请求,导致数据出错;其次,采用switch( )多分支选择语句,针对“座椅向前”“座椅向后”“升高”“降低”“后端升高”“后端降低”“直立”“后仰”8条声音指令分别将P1.0~P1.7的8个引脚置0。若驾驶员发出“马上停止”指令,语音识别模块发出相应编码,使单片机P1口置1,控制电机停止工作,即可实现“马上停止”功能。
2.3 执行机构
执行机构由8个继电器(K0~K7)和4个直流电动机(Ma~Md)组成,如图3所示,其中:Ma为座椅“向前~向后”电动机;Mb为“前端升高~降低”电动机;Mc为“后端升高—降低”电动机;Md为“靠背倾斜~直立”电动机;D0~D7为继电器驱动电路;PTC为自恢复保险。
每个电动机由2个继电器共同控制,继电器常闭触点连接到电源负极,常开触点连接电源正极,继电器不动作时活动触点与常闭触点接通。当单片机某I/O口输出低电平“0”时,其控制的继电器的活动触点与常开触点接通,电动机开始动作,实现座椅某一个方向的移动。
如P1.0引脚被置0后,继电器驱动电路(如图4)的输入端输入低电平,三极管导通,集电极连接的继电器电磁线圈中会有电流流过,继电器动作,常闭触点断开,常开触点闭合,活动触点与12V电源正极接通;在电动机的另外一端,由于单片机所有I/O口在初始化时全部置1,默认是高电平,继电器不动作,活动触点与常闭触点连接,即接至电源负极,此时“座椅向前—向后”电动机正转,座椅向前调节。当驾驶员发出“座椅向后”的指令时,P1.1置0,P1其他端口置1,只有“座椅向前—向后”电动机反转,座椅向后调节。
2.4 指示装置
指示装置由单片机P2口控制,如图5所示。程序指令将P1口的值实时送到P2口,P2口控制面板上的指示装置(发光二极管亮或灭)。驾驶员可以实时掌握指令的执行情况。
2.5 电源模块
声控系统电源取自于汽车点火开关的P端子。只有当点火开关处于OFF档,并且声控电动座椅控制系统的电源开关被接通时,声控调节才有效;当点火开关处于其它档,既使声控电动座椅控制系统的电源开关接通,系统也不会工作,从而防止汽车行驶中各种背景噪音引发误操作,以确保行车安全。
电源模块采用了LM7805和LM1117两个芯片分别实现5V和3.3V两种稳定电压输出,满足单片机和语音识别模块对电源电压的需求。
电源模块部分设置了2个控制开关。一个是12V总电源开关SA,它负责为控制电源模块和直流电动机供电。另外一个是电源模块的专用控制开关SB,当该开关接通时,电源模块开始工作,对外输出5V和3.3V两种直流电压,为单片机和语音识别模块供电;在开关SB切断时,声控单片机和语音识别模块掉电,声控系统不工作,座椅仍然是普通的电动座椅,这样可以防止各种背景噪音引发误操作,确保行车安全。
在每个电动机控制电路中都串接了一个自恢复保险丝,如图3中所示“PTC”。保险丝额定电流依据各电动机工作时实际电流而定,实验证明取值为实际工作电流的1.2倍较为适宜,当座椅调整到极限位置,电机堵转,PTC开始动作,以实现对系统的保护。
3 改装测试
本装置分别在室内与车内进行了改装测试。测试人使用普通话。
3.1 室内测试
置改装后的汽车电动座椅于未加特殊隔音和静音措施的普通房间内,室内面积40m2,室内温度28??。静音环境下(无其他发声物体),面对设备拾音器,以正常语速,中等强度(40至50分贝),每间隔两秒发出1个指令声音,持续地随机发出20个指令声音。测试结果如表1。
3.2 车内测试
改装某国产品牌3厢乘用车电动座椅,改装装置分别放置于中控台附近和被改装的电动座椅下(未对车辆进行任何拆解改装)。关闭所有车窗,车内温度27??,以正常语速,中等强度(40至50分贝),每间隔两秒发出1个指令声音,持续地随即发出20个指令声音。测试结果如表2。
将改装设备(含拾音器)简单地放置在座椅下方,受环境噪声、声音传输距离及路径影响,语音识别效果明显下降。
4 结论
综合两次测试结果,可以看到,该装置在拾音距离30~50cm,指令识别率在90%以上,动作执行率达到100%。改装后的汽车电动座椅的声控调整系统工作稳定,实时性良好。
语音识别的效果与周围环境的声音、识别列表的内容设置(发音响亮的开口音还是不容易发音的闭口音)、识别列表各个词语之间的相互差别程度、说话人的发音清晰/大小/快慢/认真程度/口音、用户操作流程的设置、拾音器的物理特性等等因素都有关系[4]。
普通拾音器作用距离在1米左右,仔细挑选的拾音器作用距离可以在2~3米。 本设备选用的是普通拾音器,识别效果受到了一定影响,若要进一步提高指令识别率,实现高可靠性,可选择更高质量的拾音器件。
该装置直接应用于现有汽车电动座椅,电动座椅原有的全部控制开关无需改动,两套调整装置可独立存在,分别实现对电动座椅的调节,彼此互不影响。
教育期刊网 http://www.jyqkw.com
参考文献
LD3320芯片简明调试步骤[DB/OL]. http://www.i-croute.com/web_cn/LD332X_DebugProcess.html. 2010.
刘幺和, 宋庭新. 语音识别与控制应用技术[M]. 北京:科学出版社, 2008.
金鑫, 田犇, 阙大顺. 基于LD3320的语音控制系统设计实现[J].电脑与信息技术, 2011(6): 22-25.
语音识别芯片LD3320高阶秘籍[DB/OL]. http://www.icroute.com/web_cn/Download.html#LD332x-RegRW. 2011.