|本期目录/Table of Contents|

[1]全龙翔,阿不力克木·吾甫尔,马 超,等.基于上下文敏感区块的模糊语音准确识别方法[J].电子设计工程,2020,28(01):32-35.[doi:10.14022/j.issn1674-6236.2020.01.008]
 QUAN Longxiang,Abulikemu·Wupuer,MA Chao,et al.Accurate recognition of fuzzy speech based on context sensitive block[J].Electronic Design Engineering,2020,28(01):32-35.[doi:10.14022/j.issn1674-6236.2020.01.008]
点击复制

基于上下文敏感区块的模糊语音准确识别方法(PDF)
分享到:

《电子设计工程》[ISSN:1674-6236/CN:61-1477/TN]

卷:
28
期数:
2020年01期
页码:
32-35
栏目:
计算机技术应用
出版日期:
2020-01-05

文章信息/Info

Title:
Accurate recognition of fuzzy speech based on context sensitive block
文章编号:
1674-6236(2020)01-0032-04
作者:
全龙翔阿不力克木·吾甫尔马 超武江波
(国网新疆电力有限公司电力科学研究院,新疆 乌鲁木齐 830000)
Author(s):
QUAN Long?xiangAbulikemu·WupuerMA ChaoWU Jiang?bo
(State Grid Xinjiang Electeic Power Research Institute CO.,LTD,Urumqi 830000,China)
关键词:
敏感区块 模糊语音 频谱特征 Gabor滤波 Delta描述子
Keywords:
sensitive blocks fuzzy speech spectrum features Gabor filtering Delta descriptor
分类号:
TN912
DOI:
10.14022/j.issn1674-6236.2020.01.008
文献标志码:
A
摘要:
为对语音信号进行良性切分,实现有目的性的声源重组,提出一种基于上下文敏感区块的模糊语音准确识别方法。在区块组织的频谱特征中,确定模糊语音的Gabor滤波传输条件,并对Delta描述算子进行定向计算,完成上下文敏感区块模糊语音的特征参数分析。在此基础上,利用深度识别神经网络,对模糊语音的特征线索进行有效分离,并对其识别端点进行逐一排查,完成新型语音准确识别方法的构建。对比实验数据显示,与基础语音识别方法相比,基于上下文敏感区块的模糊语音准确识别方法既可将最大信号切分率提升至95%左右,也能保持声源信号的最大深度不超过4.50×10-7 μm,达到重组声源的目的。
Abstract:
In order to segment speech signal benignly and achieve purposeful source reorganization, an accurate recognition method based on context-sensitive blocks for fuzzy speech is proposed. In the spectrum characteristics of the block organization, the Gabor filter transmission condition of the fuzzy speech is determined, and the Delta descriptor is calculated in orientation to complete the analysis of the characteristic parameters of the context-sensitive block fuzzy speech. On this basis, the deep recognition neural network is used to effectively separate the feature clues of the fuzzy speech, and the recognition endpoints are checked one by one to complete the construction of a new accurate speech recognition method. The experimental results show that compared with the basic speech recognition method, the context-sensitive block-based fuzzy speech recognition method can not only increase the maximum signal segmentation rate to about 95%, but also maintain the maximum depth of the source signal not more than 4.50 *10-7 μm, so as to achieve the purpose of recombining the source.

参考文献/References:

[1] 蒋兵,茅玉龙,曹俊纺. GRNN神经网络在雷达信号调制类型识别中的应用[J]. 电子设计工程, 2018,26(16):111-115.[2] 蒋小华,张飙,吴名欢. 嵌入式通信系统远程高速数据准确识别仿真[J]. 计算机仿真, 2018,35(11):362-365.[3] 胡玉玺,李轶鲲,杨萍. 基于上下文敏感的贝叶斯网络及方向关系的遥感图像检索[J]. 国土资源遥感, 2017,29(3):70-76.[4] 贺杰,郭慧,李琳. 基于视觉颜色对比敏感度模型的动态视频压缩预处理算法[J]. 计算机应用研究, 2016,33(8):2552-2556.[5] 肖熙,周路. 基于k均值和基于归一化类内方差的语音识别自适应聚类特征提取算法[J]. 清华大学学报:自然科学版, 2017,21(8):857-861.[6] 宋青松, 田正鑫,孙文磊,等. 用于孤立数字语音识别的一种组合降维方法[J]. 西安交通大学学报, 2016, 50(6):42-46.[7] 刘金刚,周翊,马永保,等. 用于自动语音识别系统的切换语音功率谱估计算法[J]. 计算机应用, 2016,36(12):3369-3373.[8] 黄光许,田垚,康健,等. 低资源条件下基于I-vector特征的LSTM递归神经网络语音识别系统[J]. 计算机应用研究, 2017,34(2):392-396.[9] 努尔麦麦提·尤鲁瓦斯,张力文,吾守尔·斯拉木. 说话人自适应技术在维吾尔语语音识别中的应用研究[J]. 中文信息学报, 2016,19(3):79-84.[10]陈雷,杨俊安,王龙,等. 连续语音识别中基于Dropout修正线性深度置信网络的声学模型[J]. 声学技术, 2016, 35(2):146-154.[11]舒帆,屈丹,张文林,等. 采用长短时记忆网络的低资源语音识别方法[J]. 西安交通大学学报, 2017,51(10):120-127.[12]王群,曾庆宁,郑展恒. 低信噪比环境下的麦克风阵列语音识别算法研究[J]. 科学技术与工程, 2017,23(31):101-107.[13]黄丽霞,王亚楠,张雪英,等. 基于深度自编码网络语音识别噪声鲁棒性研究[J]. 计算机工程与应用, 2017,53(13):49-54.[14]陈理,杨雪梅,毕春艳,等. 基于子波方差和尺度波长关系的语音识别算法研究[J]. 现代电子技术, 2018,41(10):177-179.[15]熊笑颜,陈栩,黄灿英,等. 基于自适应心理声学模型的智能语音识别系统[J]. 沈阳工业大学学报, 2017, 19(6):675-679.[16]范正光,屈丹,李华,等. 基于MTL-DNN系统融合的混合语言模型语音识别方法[J]. 数据采集与处理, 2017,22(5):1012-1021.

相似文献/References:

[1]赵 康.Gabor滤波结合LS-SVM的人群密度估计算法设计[J].电子设计工程,2019,27(14):167.
 ZHAO Kang.Population density evaluation algorithm using Gabor filter and LS?SVM[J].Electronic Design Engineering,2019,27(01):167.

备注/Memo

备注/Memo:
收稿日期:2019-04-26 稿件编号:201904156基金项目:江苏省科技厅项目(CGYKJQQ00000019)作者简介:全龙翔(1986—),男,新疆奇台人,工程师。研究方向:电力营销信息化。
更新日期/Last Update: 2019-12-27