工学 >>> 信息与通信工程 >>> 信息处理技术 >>> 语音处理 >>>
搜索结果: 31-45 共查到知识库 语音处理相关记录401条 . 查询时间(5.123 秒)
针对传统的语音信号线性预测分析算法在噪声环境下性能恶化的问题,提出了一种新的基于超高斯激励的噪声顽健线性预测算法。该算法采用具有超高斯特性的学生t分布对语音信号线性预测激励建模,并显式地考虑环境噪声的影响,从而构建语音信号线性预测分析的概率图模型。在此基础上,利用变分贝叶斯的方法求解模型参数的近似后验分布,进而实现对带噪语音线性预测系数的最优估计。实验结果表明,该算法能够有效提高噪声环境下语音信号...
In Short Utterance Speaker Recognition (SUSR), the role of complete speech units like syllables in carrying speaker information needs further investigation. This paper presents ...
提出了一类适用于Alpha稳定分布随机变量的统计量—类M估计相关(MELC),通过构造阵列输出的类M估计相关矩阵,提出了适用于Alpha稳定分布噪声环境下的波达方向(DOA)估计新算法,即MELC-MUSIC算法。仿真实验表明,在Alpha稳定分布噪声环境下,MELC-MUSIC算法在抗噪声特性、多源信号分辨性以及对不同形式信号(圆对称信号或非圆对称信号)的适应性方面获得比基于分数低阶统计量(FL...
This paper provides an overview of automatic speaker recognition technologies, with an emphasis on front-end features for robust speaker recognition. We categorize the front-end features into ...
Cross-lingual document clustering (CLDC) is the task to automatically or-ganize a large collection of cross-lingual documents into groups considering con-tent or topic. Different from the tradition-al...
跨语言文档聚类主要是将跨语言文档按照内容或者话题组织为不同的类簇 该文通过采用跨语言词相似度计算将单语广义向量空间模型 拓展到跨语言文档表示中 即 跨 语 言 广义空间向量模型 并且比较了不同相似度在文档聚类下的 性 能 同时提出了适用于 的特征选择算法 实 验 证 明 采 用 词汇相似度度量算法构造时跨语言文档聚类的性能优于。
针对现有虚拟信道模型——Laplacian模型不能精确描述其特性,导致系统编码率失真性能不高,深入研究了量化噪声对边信息质量的影响,引入量化噪声因素修正虚拟信道模型,改进了像素域分布式视频编码(PDWZ)系统的帧级虚拟信道模型,并利用原始图像相关信息实现参数的动态调整。实验结果表明,与现有Laplacian模型相比,改进模型能更精确地描述虚拟信道的统计特性,系统的率失真性能得到改善。
利用离散信号空间上的最小能量(小波)框架对升余弦脉冲信号展开去噪算法的研究。对于所给的2组不同最小能量框架,升余弦脉冲信号和加性高斯白噪声的抽样离散信号在这2组框架的各个子数列下的分解系数将出现明显不同的统计特征。据此给出了2个具体的阈值去噪算法,两者都充分利用了最小能量框架在信号去噪应用上的优点,在保持发送原始信号成分的同时去除了部分噪声成分,获得了较好的处理效果。仿真结果表明,当调制方式为BP...
针对现有基于循环谱的频谱感知算法的不足,利用改进SSCA算法计算接收信号的循环谱,减少算法的计算量;利用循环谱的对称性,选择非零循环频率处的循环谱抵抗干扰和噪声,结合对称性搜索策略进行频谱感知。分析并仿真了循环谱的参数对频谱感知算法的影响,仿真结果证明了所提出算法克服了传统算法的不足,提高了低信噪比下的正确检测性能。
该文介绍了言语信息处理的进展特别提到汉语言语处理的现状言语信息处理涉及到言语识别说话人识别言语合成言语知觉计算等带口音和随意发音的言语识别有力的支持了语言学习与口语水平测评等应用跨信道环境噪音多说话人短语音时变语音等因素存在的情况下提高识别正确率是说话人识别的研究热点言语合成主要关注多语言合成情感言语合成可视言语合成等言语知觉计算开展了言语测听噪声抑制算法助听器频响补偿方法语音信号增强算法等研究将...
Speaker clustering is an important step in multi-speaker detection tasks and its performance directly affects the speaker detection performance. It is observed that the shorter t...
Performance degradation with time varying is a generally acknowledged phenomenon in speaker recognition and it is widely assumed that speaker models should be updated from time to time to mainta...
为了提高基于高斯混合模型通用背景模型(GMM-UBM)的说话人辨认系统的运算效率, 提出一种基于参考说话人模型的双层结构用于目标说话人剪枝, 采用矢量量化方法从目标说话人模型集合中训练参考说话人模型,利用语音与参考说人模型的偏差来描述说话人的发音特性,将辨认语音偏差向量和目标说话人偏差向量的相似性作为距离度量进行目标说话人剪枝。实验结果表明: 在基于GMM-UBM 的说话人辨认系统中,对包含5,2...
提出一种利用协惯量分析构建的全参考音视频同步感知质量模型。通过对齐得到待测音频与视频的同步误差。将音视频内容分为纯净语音、无语音和有背景语音3类。将纯净语音类分为视频中有说话人和无说话人2个子类。分别对各类选取多维特征,利用协惯量分析从特征中获得音、视频最相关的特征映射和相关程度。通过参考音视频得到相关程度曲线并得到同步误差到感知质量的映射关系。结果表明该模型评测结果与主观实验结果有较好相关性。
由于面向服务架构的动态性、异构性和松耦合性,其对访问控制提出了新的安全挑战。通过扩展服务描述模型,加入对安全约束描述,可以丰富灵活地表达服务对安全的需求。基于XACML(可扩展访问控制标记语言)的访问控制模型可以有效加强SOA环境下的访问控制,提出的方法可以实现满足特定安全属性需求的服务发现。

中国研究生教育排行榜-

正在加载...

中国学术期刊排行榜-

正在加载...

世界大学科研机构排行榜-

正在加载...

中国大学排行榜-

正在加载...

人 物-

正在加载...

课 件-

正在加载...

视听资料-

正在加载...

研招资料 -

正在加载...

知识要闻-

正在加载...

国际动态-

正在加载...

会议中心-

正在加载...

学术指南-

正在加载...

学术站点-

正在加载...