搜索结果: 91-105 共查到“知识库 语音处理”相关记录401条 . 查询时间(2.172 秒)
幅值补偿的AMDF基音周期检测算法
基音检测 平均幅度差函数(AMDF) 变长AMDF
2009/10/12
传统的基于AMDF及其改进算法LV-AMDF容易导致检测基音周期时产生加倍、减半等错误。针对该现象,分析了AMDF、LV-AMDF函数的特性及其用于基音检测时存在的不足,提出了幅值补偿AMDF算法来检测基音周期,降低了基音检测中经常出现的半频、倍频错误,提高了检测的精度。实验表明该方法基音检测性能优于AMDF和LV-AMDF的方法。
改进的语音端点检测技术
端点检测 谱减法 自适应子带谱熵
2009/10/12
为了提高低信噪比下语音端点检测的性能,提出了一种改进的基于谱减法和自适应子带谱熵的语音端点检测方法。该方法先利用谱减法对带噪语音消除加性噪声,及时更新背景噪声估计,再对增强后的语音信号利用改进的自适应子带谱熵进行端点检测。实验结果表明,该方法具有良好的检测性能,相对传统方法提高了端点检测的准确率,在低信噪比环境下仍能比较准确地检测到语音的端点。
利用投票选择机制进行语音分割的新方法
语音分割 倒谱特征 分形维数
2009/10/10
针对在噪声背景下连续语音信号的语音分割性能会明显下降的问题,提出了一种针对连续语音信号分割的新方法。该方法不再采用单一的端点检测方法,而是将基于分形维数的端点检测方法,基于倒谱特征的端点检测方法,基于HMM的端点检测方法等多种不同方法下得到的端点检测结果,通过投票选择的方式,得到最终的端点检测结果,从而达到对连续语音信号进行分割的目的。实验结果表明,该方法较明显地提高了语音分割的准确性。
语音信号共振峰频率估计的分段线性预测算法
共振峰频率 分段线性预测 滤波器组
2009/10/9
基于分段线性预测算法估计语音的共振峰频率,运用多通道的滤波器组对语音的频段进行划分,然后选择合适的逆滤波器逼近不同频段的短时频谱,最后依据该逆滤波器估计共振峰频率。实验结果表明,与传统方法相比,该方法提高了语音共振峰频率估计时的分辨率与准确性,受噪声的影响较小。
Speaker segmentation based on between-window correlation over speakers’ characteristics
Speaker segmentation between-window correlation over speakers’ characteristics
2013/6/28
Speaker segmentation is widely applied in many domains such as multi-speaker detection and speaker tracking. However, the performance of the conventional metric-based methods is neith...
病态嗓音特征的小波变换提取及识别研究
高斯混合模型(GMM) 病态嗓音 Mel倒谱系数(MFCC)
2009/9/30
通过分析嗓音的发音机理、病态嗓音与正常嗓音在频域的表现差异,利用小波变换对信号进行分解,突出病态嗓音的特点,提出了基于多尺度分析的小波降噪、分解的熵系数(Entropy Coefficient based on De-noise,Decomposition of Multi-scale Analysis,ECDDMA)作为识别的特征矢量集。并对比分析了语音识别中经典特征参数Mel倒谱系数(MFCC...
基于微分麦克风阵列的自适应语音增强算法研究及DSP实现
语音增强 微分麦克风阵列 仿射投影算法
2009/9/28
自适应滤波是语音增强算法中的常用技术, 而算法复杂度与收敛速度是设计各种自适应算法需要首要考虑的问题. 本文提出一种用于片上的语音增强自适应滤波新算法. 该算法分两步实现, 首先, 利用一阶微分麦克风阵列, 获得噪声的实时估计; 其次, 对传统的仿射投影算法(Affine projection algorithm, APA)加以改进, 得到计算误差向量的快速算法, 并根据估计误差动态调整搜索步长以...
说话人识别中的因子分析以及空间拼接
说话人识别 联合因子分析 本征音因子
2009/9/28
联合因子分析可以有效拟合混合高斯模型中的说话人和信道差异, 在说话人识别中得到广泛应用. 一般情况下, 该算法在对说话人和信道两个载荷矩阵进行联合估计时, 说话人残差矩阵无法发挥作用, 信道载荷矩阵的因子数不能提高. 本文提出说话人载荷矩阵、说话人残差载荷矩阵采用串行的训练模式, 在信道载荷矩阵训练中采用矩阵拼接的方法, 能够有效提高识别率; 在NIST SRE 2008年核心测试数据库的五个部分...
基于视频三音子的双模态语料自动选取算法
可视语音合成 双模态语料 视频三音子
2009/9/27
为实现可视语音合成,建立符合条件的双模态语料库,提出双模态语料自动选取算法。根据视频中唇部发音特征,对已有的三音子模型归类,形成视频三音子,在其基础上从原始语料中自动选取语料,利用评估函数对原始语料中的句子打分。与其他双模态语料库相比,该语料库在覆盖率等指标上有较大改进,为实现具有真实感的可视语音合成奠定基础。
基于子带主频率信息的语音特征提取算法
语音识别 特征参数 子带主频率
2009/9/27
提出一种用于语音识别的鲁棒特征提取算法。该算法基于子带主频率信息,实现子带主频率信息与子带能量信息相结合,在特征参数中保留语谱中子带峰值位置信息。使用该算法设计抗噪孤立词语音识别系统,分别在白高斯噪声和背景语音噪声环境下,与传统特征算法做多种信噪比对比实验。试验结果表明该特征算法在2种噪声环境下的识别率有不同程度提高,具有良好的噪声鲁棒性。
弱稀疏性下的欠定语音盲分离方法
语音盲分离 混合矩阵估计 稀疏性
2009/9/27
针对语音信号的弱稀疏性,提出一种新的基于混合矩阵估计的欠定语音盲分离方法。该方法通过主成分分析检测只有一个源信号存在时的时频点并用于估计混合矩阵,从而克服语音信号稀疏性变弱时的影响,提高混合矩阵估计精度。结合子空间法重构源信号,进一步提高分离性能,并从几何角度证明子空间方法,仿真结果表明该方法的分离性能优于Cluster-UBSS,且鲁棒性更好。
新的非相干UWB系统平均性能的理论计算方法
理论计算 UWB系统 平均性能的 平均误码率计算
2012/4/20
针对IEEE 802.15.3a信道下UWB非相干接收机的平均误码率计算问题,基于簇生点过程模型给出了一种新的求解方法。该方法通过推导接收窗口内信噪比的均值和方差的闭合表达式,分别以高斯分布和对数正态分布近似其概率分布,给出计算UWB能量检测系统平均误码率的闭合表达式。对比分析对数正态分布、高斯分布与真实分布之间的数字特征,对数正态分布近似效果的合理性好于高斯分布近似。对比基于OOK和PPM 2种...
基于单类支持向量机的音频分类
单类支持向量机 音频分类 特征提取
2009/9/21
研究一种基于单类支持向量机的音频分类方法,能够使每一类样本都独立地获得一个决策函数,通过决策函数的最大值来判断样本所属的类。通过使用小波包变换提取语音特征向量,并融合多特征向量,将音频分为5类:纯语音、音乐、环境音、含背景音语音和静音。实验结果表明这种方法具有较好的分类精度,性能优于贝叶斯、隐马尔可夫模型和神经网络分类器。
基于自相关平方函数与小波变换的基音检测
语音信号 自相关平方函数 小波变换
2009/9/18
在背景噪声干扰条件下,研究语音信号的基音周期,提出了一种基于自相关平方函数与小波变换结合的基音检测算法。该算法先用小波变换对带噪语音去噪,然后再求语音的自相关平方函数以突出真实基音周期的峰值,以获取较精确的基音周期。实验结果表明,与传统的自相关法相比,该算法鲁棒性好,具有更高的准确性,且计算复杂度低,利于语音合成和编码的实时处理。