工学 >>> 信息与通信工程 >>> 信息处理技术 >>> 语音处理 >>>
搜索结果: 91-105 共查到知识库 语音处理相关记录401条 . 查询时间(2.172 秒)
传统的基于AMDF及其改进算法LV-AMDF容易导致检测基音周期时产生加倍、减半等错误。针对该现象,分析了AMDF、LV-AMDF函数的特性及其用于基音检测时存在的不足,提出了幅值补偿AMDF算法来检测基音周期,降低了基音检测中经常出现的半频、倍频错误,提高了检测的精度。实验表明该方法基音检测性能优于AMDF和LV-AMDF的方法。
为了提高低信噪比下语音端点检测的性能,提出了一种改进的基于谱减法和自适应子带谱熵的语音端点检测方法。该方法先利用谱减法对带噪语音消除加性噪声,及时更新背景噪声估计,再对增强后的语音信号利用改进的自适应子带谱熵进行端点检测。实验结果表明,该方法具有良好的检测性能,相对传统方法提高了端点检测的准确率,在低信噪比环境下仍能比较准确地检测到语音的端点。
针对在噪声背景下连续语音信号的语音分割性能会明显下降的问题,提出了一种针对连续语音信号分割的新方法。该方法不再采用单一的端点检测方法,而是将基于分形维数的端点检测方法,基于倒谱特征的端点检测方法,基于HMM的端点检测方法等多种不同方法下得到的端点检测结果,通过投票选择的方式,得到最终的端点检测结果,从而达到对连续语音信号进行分割的目的。实验结果表明,该方法较明显地提高了语音分割的准确性。
基于分段线性预测算法估计语音的共振峰频率,运用多通道的滤波器组对语音的频段进行划分,然后选择合适的逆滤波器逼近不同频段的短时频谱,最后依据该逆滤波器估计共振峰频率。实验结果表明,与传统方法相比,该方法提高了语音共振峰频率估计时的分辨率与准确性,受噪声的影响较小。
Speaker segmentation is widely applied in many domains such as multi-speaker detection and speaker tracking. However, the performance of the conventional metric-based methods is neith...
通过分析嗓音的发音机理、病态嗓音与正常嗓音在频域的表现差异,利用小波变换对信号进行分解,突出病态嗓音的特点,提出了基于多尺度分析的小波降噪、分解的熵系数(Entropy Coefficient based on De-noise,Decomposition of Multi-scale Analysis,ECDDMA)作为识别的特征矢量集。并对比分析了语音识别中经典特征参数Mel倒谱系数(MFCC...
自适应滤波是语音增强算法中的常用技术, 而算法复杂度与收敛速度是设计各种自适应算法需要首要考虑的问题. 本文提出一种用于片上的语音增强自适应滤波新算法. 该算法分两步实现, 首先, 利用一阶微分麦克风阵列, 获得噪声的实时估计; 其次, 对传统的仿射投影算法(Affine projection algorithm, APA)加以改进, 得到计算误差向量的快速算法, 并根据估计误差动态调整搜索步长以...
联合因子分析可以有效拟合混合高斯模型中的说话人和信道差异, 在说话人识别中得到广泛应用. 一般情况下, 该算法在对说话人和信道两个载荷矩阵进行联合估计时, 说话人残差矩阵无法发挥作用, 信道载荷矩阵的因子数不能提高. 本文提出说话人载荷矩阵、说话人残差载荷矩阵采用串行的训练模式, 在信道载荷矩阵训练中采用矩阵拼接的方法, 能够有效提高识别率; 在NIST SRE 2008年核心测试数据库的五个部分...
为实现可视语音合成,建立符合条件的双模态语料库,提出双模态语料自动选取算法。根据视频中唇部发音特征,对已有的三音子模型归类,形成视频三音子,在其基础上从原始语料中自动选取语料,利用评估函数对原始语料中的句子打分。与其他双模态语料库相比,该语料库在覆盖率等指标上有较大改进,为实现具有真实感的可视语音合成奠定基础。
提出一种用于语音识别的鲁棒特征提取算法。该算法基于子带主频率信息,实现子带主频率信息与子带能量信息相结合,在特征参数中保留语谱中子带峰值位置信息。使用该算法设计抗噪孤立词语音识别系统,分别在白高斯噪声和背景语音噪声环境下,与传统特征算法做多种信噪比对比实验。试验结果表明该特征算法在2种噪声环境下的识别率有不同程度提高,具有良好的噪声鲁棒性。
针对语音信号的弱稀疏性,提出一种新的基于混合矩阵估计的欠定语音盲分离方法。该方法通过主成分分析检测只有一个源信号存在时的时频点并用于估计混合矩阵,从而克服语音信号稀疏性变弱时的影响,提高混合矩阵估计精度。结合子空间法重构源信号,进一步提高分离性能,并从几何角度证明子空间方法,仿真结果表明该方法的分离性能优于Cluster-UBSS,且鲁棒性更好。
针对IEEE 802.15.3a信道下UWB非相干接收机的平均误码率计算问题,基于簇生点过程模型给出了一种新的求解方法。该方法通过推导接收窗口内信噪比的均值和方差的闭合表达式,分别以高斯分布和对数正态分布近似其概率分布,给出计算UWB能量检测系统平均误码率的闭合表达式。对比分析对数正态分布、高斯分布与真实分布之间的数字特征,对数正态分布近似效果的合理性好于高斯分布近似。对比基于OOK和PPM 2种...
研究一种基于单类支持向量机的音频分类方法,能够使每一类样本都独立地获得一个决策函数,通过决策函数的最大值来判断样本所属的类。通过使用小波包变换提取语音特征向量,并融合多特征向量,将音频分为5类:纯语音、音乐、环境音、含背景音语音和静音。实验结果表明这种方法具有较好的分类精度,性能优于贝叶斯、隐马尔可夫模型和神经网络分类器。
在背景噪声干扰条件下,研究语音信号的基音周期,提出了一种基于自相关平方函数与小波变换结合的基音检测算法。该算法先用小波变换对带噪语音去噪,然后再求语音的自相关平方函数以突出真实基音周期的峰值,以获取较精确的基音周期。实验结果表明,与传统的自相关法相比,该算法鲁棒性好,具有更高的准确性,且计算复杂度低,利于语音合成和编码的实时处理。
提出了一种新的频域盲分离排序算法。算法对不同频率点采用不同的排序算法:频率较低部分采用比较分离信号相邻频率点和谐波频率点之间幅度相关性相结合的排序算法;中频部分采用基于语音信号方位估计的排序算法;频率较高部分采用相关比较和方位估计结合的排序方法。仿真结果表明,该排序算法的鲁棒性和精确性较现有的单纯利用分离信号相关性的排序算法或者基于语音信号定位的排序算法有了一定的增强。

中国研究生教育排行榜-

正在加载...

中国学术期刊排行榜-

正在加载...

世界大学科研机构排行榜-

正在加载...

中国大学排行榜-

正在加载...

人 物-

正在加载...

课 件-

正在加载...

视听资料-

正在加载...

研招资料 -

正在加载...

知识要闻-

正在加载...

国际动态-

正在加载...

会议中心-

正在加载...

学术指南-

正在加载...

学术站点-

正在加载...