语音芯片应用开发 > 语音芯片新闻 > 环芯
Tag: 无 

基于C语言的设计流优化语音识别芯片结构设计

2009年06月24日   出处:ATChip   浏览量:903次   http://www.atchip.net

  据预测,市场对语音控制应用设备的需求将急剧增长,其推动力来自电话机市场。电话机将更多地采用语音命令进行控制。其他应用领域包括玩具和手持设备如计算器、语音控制的安全系统、家用电器及车载设备(立体声、视窗、环境控制、车灯和导航控制)。本文从可复用和优化芯片空间的角度出发介绍语音识别芯片结构设计的种种考虑,其思路有利于开发一系列其它语音识别芯片。

  新加坡Columns公司在便携式语音控制产品应用中起步较早,其中一个产品是执行欧元与其他欧洲货币之间进行兑换的“语音控制欧洲货币兑换器”。欧元兑换器的设计要求包括:1.功率小,电池寿命至少为1年;2.价格低廉,产品零售价不超过9美元;3.具有很强的灵活性,能用多种语言精确地识别并合成与说话人相关的语音;4.整个语音控制核产品应具备可复用的特性。 

  本文介绍利用FrontierDesign公司设计工具来开发欧元兑换器ASIC产品的全过程。在ASIC中实现复杂DSP算法的要求通常极为苛刻,但采用Frontier的结构合成工具A|RTDesigner工具能迅速优化RTL描述,该工具还允许自由选择备用结构以优化应用设计。 

  通过应用基于C语言的设计流,能在结构设计阶段对新特性进行设计和硬件优化,这能降低50%的硅片面积,通过加快C语言原型硬件的设计,可以进一步扩展设计的性能以满足用户对产品规格的严格要求。 

  算法研究 

  欧元兑换器的效率在一定程度上取决于语音命令与存储数据库的比较以及执行命令的能力。开发出满足最终产品要求的算法对设计的成功至关重要,因为没有人希望看到语音控制设备不能始终如一地识别命令,人们需要算法自始至终达到98%以上的识别精度。因此,目前面临的难题包括检测并清除背景噪声、区分真实的命令字和其他噪声(呼吸声、微小静电干扰声及麦克风声响)、确定命令字的起始和终止以及将输入与存储的“声纹谱”数据库及随后的命令字识别(图1)进行比较。